MarkLogicは、マルチモデルデータベースとして、ドキュメントストアとRDFトリプルストアのメリットを融合しています。このアプローチは、すべてのデータの統合とアクセスに最適です。JSONとXMLドキュメントにより、エンティティのモデリングで優れた柔軟性を実現します。セマンティックグラフデータのデータフォーマットであるRDFトリプルは、関係性の格納に最適です。MarkLogicセマンティックは、メタデータの格納、データ統合の向上、関連性の高い統合データを使用したアプリケーションの構築に対応した優れたデータフォーマットです。MarkLogicセマンティックを活用した一般的なユースケースには、高度な検索アプリケーション、レコメンデーションエンジン、不正検知、ナレッジグラフ、創薬、ネットワークセキュリティなどがあります。

詳細はこちら

うまくいくのです。本当にうまくいっているのです。

「MarkLogicでは、RDF、XMLなどのデータに加え、さまざまなインデックスを一緒に使えることを嬉しく思います。大変でしたが、実現できました。とてもうまくいくことを実感できています」

セマンティックデータとクエリ:RDFとSPARQL

近年、グラフデータベースの人気が急激に高まっています。またRDFトリプルストア(セマンティックデータを格納するもの)も、グラフデータベースの一種として認識されています。データがグラフ構造を取り始め、エンティティ(ヒト、場所、モノ)自体とエンティティ間の関係が重要な場合、セマンティックを使うことをお勧めします。データに適切なコンテクストが提供されます。

セマンティックデータを表す標準的な方法はRDFトリプル(Resource Description Framework)であり、標準クエリ言語はSPARQLです。トリプルは、エンティティ(ヒト、場所、モノ)とそれらの関係性に基づいた「主語、述語、目的語」の構成から派生したものです。例えば、「Johnはロンドンに住んでいます。」と「ロンドンはイギリスにあります。」の2つのファクトから、「Johnはイギリスに住んでいます。」などと推測できます。

このように、単純なファクトを相互にリンクすることで、数千億個ものファクト(事実)と関係性のグラフを形成できます。このようなナレッジグラフにより、Googleの検索やLinkedInの「People You May Know」機能など、毎日使用するアプリケーションを機能強化できます。

「データモデル自体が複雑になり、関係性が増え、多様になった場合、RDF(ならびにSPARQL)の重要性はさらに高まります。これは、情報の多様性が他の要素(量や更新頻度)よりも重要になるためです」

RDFトリプルの理由

RDFトリプルはシンプルです。コンテクストがデータに追加されるので、データ統合が向上します。

トリプルは、外部キー、ネストされたクエリ、複雑な結合など、多くの要件でリレーショナルデータベースよりも優れています。

ご存知でしたか?

トリプルは一般に理解されやすく、検索や共有が容易

トリプルを結び付けてグラフを作成できる。これは機械で読み取り可能。新しいファクトも推論できる

W3CはRDFトリプルとクエリ言語のSPARQLの共通基準を定めています。

トリプルストアは、数千億個のファクトや関係性まで拡張できる

トリプルストアはオントロジーを活用して、データの整理と分類が可能(オントロジーはタクソノミーのようなものだが、より内容が豊かで便利)

セマンティックの世界は初めてですか?ここからスタート

「Peek Inside MarkLogic Semantics」ウェビナーでセマンティック技術の概要をご覧になるか、Dummiesのセマンティックの無料のコピーをダウンロードしてください。セマンティックの概要だけでなく、実際のセマンティックの導入事例について確認できます。

eBookをダウンロードするウェビナーを見る

「RDFトリプルを使用することで、組織の構造などのデータ間のリアルタイムの接続、ドキュメントとデータ間の関係性を作成できます。800万のドキュメントの5,000万のデータのインベントリで毎秒40,000を超えるドキュメントまでプラットフォームを拡張できました。これでもまだ、MarkLogicの限界には達していません」

Michael Henry氏 | KPMG

MarkLogicの優位性:ドキュメント、データ、トリプルに対応したマルチモデルデータベース

ドキュメント+データ+トリプルMarkLogicは、ドキュメント、データ、トリプルをネイティブで一緒に格納します。

  • 組み合わせ可能 – MarkLogicは真のマルチモデルです。すべてのデータ型で、さまざまな組み合わせができるクエリを記述できます。
  • エンタープライズ仕様 – ACIDトランザクション、セキュリティ、ディザスタリカバリなどのエンタープライズ機能を完備しています。
  • 洗練されたインデックス – トリプルインデックスに特化し、クエリの機能とパフォーマンスを向上します。
  • 優れた拡張性 – MarkLogicでは、数千億個のトリプルを格納します。

マルチモデルアプローチが優れている理由は、データモデルを統合し、優れた柔軟性とクエリを実現できることです。

O’ReillyマルチモデルeBookをダウンロードする

セマンティックを使用するタイミング

すべてのユースケースでMarkLogicセマンティックオプションが必要になるわけではなく、ドキュメントモデルのみで十分な場合もあります。しかし、大規模な格納とクエリが必要な関係がデータに含まれている場合は、セマンティックがあると非常に便利です。MarkLogicセマンティックの最も一般的なユースケースについて、次にいくつか紹介します。

MarkLogicセマンティックは、マスターデータの「接着剤」として機能し、参照データ、メタデータ(データの出自や系統など)に最適なモデルです。MarkLogicは、顧客や注文などのエンティティデータをドキュメントとして格納し、これらのエンティティの関係性をRDFトリプルとして格納できます。ドキュメントがいつ作成されたか、他のドキュメントとどのように関連するかなど、オントロジーを使用してメタデータを記述することもできます。MarkLogicのマルチモデル機能を使用することで、これらのセマンティックの関係性をドキュメントの内部に格納したり、スタンドアロンのRDFトリプルとして格納したりできます。

MarkLogicセマンティックでは、パーソナライズされたリアルタイムのリコメンデ―ションを提示したり、検索クエリをインテリジェントに拡大できます。グラフとは関連性の高いデータのことであり、MarkLogicセマンティックではこれらの関係性を活用することで、関連する人、製品、質問、その他グラフにある情報を提示し、フロントエンドのユーザー体験を向上できます。セマンティックオントロジーに基づいて検索範囲をインテリジェントに拡大することもできます。検索するキーワードがドキュメントで言及されていない場合でも、関連する結果のセットを拡大できます。それが、検索アプリケーションを構築する最適な方法です。

MarkLogicセマンティックを活用することで、金融サービス企業は、法人と取引相手の関係を調査し、債務負担や不正の可能性を明らかにできます。また保険会社では、犯罪組織や不正請求を明らかにできます。通常は請求先住所と履歴レコードの間に関連性があるからです。これらの関連性は、統合されていないデータやインデックスが付けられていないデータでは失われてしまいます。セマンティックでは、このような情報を余さず迅速に表面化できます。

インテリジェンスデータは、大量で構造が複雑になる場合があり、複数のソースからさまざまな形式や型のデータが流れてくることもあります。それらすべてに意味を持たせるには、統合が必要です。また、すべてを分析するには、関係性を理解することも必要です。MarkLogicセマンティックでは、結論を引き出すために、データを接続して関係性を視覚化できます。軍が対象者を追跡する場合や、警察が近隣の犯罪行為を追跡している場合など、MarkLogicセマンティックでは、これまでになく簡単にデータをインテリジェントに使用できます。

MarkLogicセマンティックでは、世界中のあらゆることを記述する数兆単位のトリプルを活用できます。これらのファクトは自由に利用できます。DBPedia、CIA Factbook、Geonamesを見るだけです。または、自分自身のファクトを使用することもできます。いずれにせよ、これらのトリプルはナレッジグラフのファブリックを形成して、検索と発見を強化できます。例えば、ユーザーがロンドンを検索したときにロンドンに関するファクトを表示したり、会社の所有者とその子会社(ユーザーがその会社を検索したとき)を表示したりする場合に、トリプルが役に立つ場合があります。リンクトデータの世界では、無限の可能性があります。

MarkLogicセマンティックでは、大規模組織のIT資産管理や、そのほかすべての資産を実際に管理することができます。ほとんどの大規模組織では、数千とはいわないまでも、数百規模のITアセットがあります。これらは価値のあるものですが、多くが継続的な保守が必要です。データセンターのラックやサーバーを考えてみてください。MarkLogicセマンティックを使用することで、それらに関するデータをトリプルとして格納し、「2年を超えるすべてのDellサーバーのリストを見せて」などのように、簡単なクエリを実行して、結果を即座に表示できます。

サポートされているセマンティックの機能

  • 数千億個のRDFトリプルを格納・管理
  • ドキュメント/データ/トリプルを対象としたクエリ
  • トリプルインデックスで1秒以内に検索結果を表示
  • 大きなクラスターを越えて高いパフォーマンスを出すためにトリプルをキャッシュ
  • MarkLogic Content Pump(mlcp)によるトリプルの一括読み込み
  • メタデータによる出自などの説明
  • シリアライゼーションおよび推移閉包のためのXQueryヘルパーモジュール
  • MarkLogic APIによる更新と集計
  • グラフトラバーサル(プロパティパスと推移閉包)
  • クエリー時に設定済みのルールを利用するセマンティックの推論
  • RDF、RDFS+、OWL Horst用のルールセット
  • ユーザー定義ルールセット
  • SPARQL 1.1の完全サポート
  • SPARQLエンドポイントとグラフストア プロトコルのサポート
  • サーバーサイドJavascript、Node.jsによるSPARQL
  • JenaとSesame APIのサポート
  • セマンティックのテクノロジーパートナー(Smartlogic、Pool Party、Cambridge Semantics)との完全統合
  • MarkLogicの基幹業務に対応したエンタープライズ機能:ACIDトランザクション、認定済みのセキュリティ (ドキュメントとトリプルレベル)、高可用性と災害復旧、拡張性や弾力的な拡張性
MarkLogicによる機能強化とセマンティックの使用

MarkLogicで構築されたKPMGのDLAP(Digital Labor Automation Platform)は、IA(インテリジェントオートメーション)のフロントエンドであり、KPMGでは、税務や規制監督報告の内容領域の専門知識を高度に自動化された方法で顧客データに応用できるようになりました。KPMGでは、セマンティックを使用して、ドキュメントの読み込み時にエンリッチし、検索機能を向上しています。


MarkLogicでは、さまざまなシステムと機能を統合して、情報共有とナレッジの作成を可能にしています。その結果、OECDは、世界経済と社会福祉を向上する政策を策定・推進できるようになりました。OECDでは、新しいOECDネットワーク環境である「ONE」プラットフォームのデータハブの中核となるプラットフォームとして、MarkLogicを選択しました。


Pearsonでは、複数のレベルでグローバル教育カリキュラムを提供しています。MarkLogicを使用して、豊富なインタラクティブ体験を通して、すべてのデジタルコンテンツを格納、管理、提供しています。Pearsonでは、MarkLogicのマルチモデル機能とセマンティックを活用して、コース評価と受講生の関係性のデータを教育コンテンツ全体に接続しています。


BSI(英国規格協会)は、標準規格の発行ならびに規格関連サービスを全世界で提供しています。BSIは、規格検索用オンラインアプリケーションである「BSOL(British Standards Online)」を開発しました。BSIではより質が高く、高速な規格の検索に向け、セマンティックを活用した新しいアプリケーションを構築しました。

注目のセマンティックパートナー

その他のリソース

医療データは多様です。臨床試験、医師のメモ、患者履歴、スキャン、学術誌の記事、ソーシャルメディア、公文書の記録、請求データ、購入履歴、投薬情報などがあります。
このウェビナーでは、セマンティックが保険会社にどのように役立っているかを解説します。不正行為を検出しこれに対応するために、異種データを集約し、隠れた関係性を見つける方法をご覧ください。
このセッションでは、データセントリックアプローチによる事前対策の警察活動をMarkLogicでどのように可能にしているか、その実例について考察しています。

エンタープライズ向けに、豊富な機能と開発を支援

当ウェブサイトではクッキーを使用しています。

By continuing to use this website you are giving consent to cookies being used in accordance with the MarkLogic Privacy Statement.