データサイロからの決別
データアーキテクチャをシンプルにしてETLとMDMに時間をかけないようにし、データからさらに多くの価値を引き出しましょう。
データの読み込みを高速化し、リネージ、出自、その他のメタデータを保持しながら、変更を迅速に行うことができます。ドキュメント、セマンティックグラフ、地理情報、リレーショナルモデルを、JSON、XML、テキスト、RDFトリプル、地理情報、バイナリ(PDF、画像、動画など)用のネイティブストレージと組み合わせることができます。
マルチモデルデータベースは、1 つのインターフェイスでさまざまなデータモデル、インデックス、プログラミング言語を統合して、データのセキュリティ、ガバナンス、一貫性を確保します。
ドキュメントデータベースモデルは、最も柔軟なNoSQLデータモデルであり、一番人気があります。ドキュメントは多様で複雑な階層型データの処理に適しています。人が読んで理解でき、データの概念またはビジネスモデルをほぼそのまま表現できます。またリレーショナルデータベースのインピーダンスミスマッチ問題を回避できます。まとめると、ドキュメントデータベースモデルには主に次のようなメリットがあります。
ドキュメントに安全にアクセスして共有できるよう、MarkLogicはビルトインの検索エンジン、ドキュメントおよび要素レベルのセキュリティ制御、リダクションポリシーなどを用意しています。検索エンジンが読み込み時の全文検索に備えてドキュメントを自動的にインデックス付けします。追加インデックス(レンジインデックス、地理情報インデックスなど)の定義や関連度順のカスタマイズなどの柔軟性もあります。このように様々な標準機能(ファセット、スニペットなど)により、高度な検索アプリケーションを迅速に構築できます。
MarkLogicプラットフォームでは、ビジネスエンティティを表すJavaオブジェクトや、従来の意味での「ドキュメント」(Microsoft Word文書やPDFなど)の自由文(テキスト)などをすべて、JSONやXMLドキュメントとして自然に格納し、強い一貫性を維持できます。
ドキュメントはビジネスエンティティの格納に適していますが、エンティティの関係性については、もう1つの一般的なNoSQLモデル、セマンテックグラフデータベースモデルが最適です。このモデルは、人、顧客、プロバイダなど、興味対象のエンティティの関係性を格納して管理できるように設計されています。
さらにMarkLogicは、セマンティックなグラフデータモデルをビルトインのRDFトリプルストアとして提供しているため、セマンティックデータを格納・管理できます。この機能がMarkLogicセマンティックです。 MarkLogic のセマンティックセマンティックにより、JSONおよびXMLドキュメントをスマートに関連付けおよび強化することで、ドキュメントモデルを強化します。これにより、データ統合を促進し、強力なクエリを実行して関係性を発見したり推論を実行したりできます。
セマンティックは、メタデータ(オントロジーなど)を格納することでデータのコンテキストも提供します。例えば、部品情報が格納された製品カタログを考えてみましょう。ある部品のサイズは「42」となっていますが、このコンテキスト情報はどこにあるのでしょうか。「42」の単位は何でしょうか。測定時の許容誤差はどのくらいでしょうか。誰がいつ測定したのでしょうか。こうしたコンテキスト情報がセマンテックデータであり、MarkLogicにRDFトリプルとして格納できます。
ドキュメントモデルと同様に、MarkLogicプラットフォームのビルトインの検索エンジンは、SPARQLクエリでセマンティック検索を高速実行するためにRDFトリプルをインデックス付けします。セマンティック検索とドキュメント検索を組み合わせて複雑なクエリを簡単に作成し、インサイトを発見できます。
ドキュメントデータモデルには、地理情報データも格納できる柔軟性があります。MarkLogicでは、関心のある地点、交差経路、地域などの地理情報をネイティブに格納、管理、検索できます。これにより、その他全てのデータ(エンティティ、関係性など)の「位置」に関する質問の答えが得られます。
ビルトインの検索エンジンは、地理情報データのインデックス付けにより、場所に基づく検索クエリと地理情報アプリケーション用のアラートが可能です。地理情報を利用して、場所に基づく強力な検索アプリケーションを実装しているお客様の詳細をご覧ください。
リレーショナルデータモデルが便利なのは、理由があります。表形式に構造化されたデータビューは、標準のSQLでクエリを実行できるので、役に立つこともあります。MarkLogicがあれば、開発者は安心です。
MarkLogicでは標準のSQLをサポートしており、データ上にリレーショナルビューを作成し、データのセキュリティに妥協することなくSQL分析を実行できます。基となるデータを変更しないので、MarkLogicプラットフォームでは元の形式のまま利用できます。
このようなレベルのSQLサポートを可能にする基盤技術は、MarkLogic独自のものです。この技術はTDE(Template Driven Extraction)と呼ばれ、データ(またはエンティティ)のリレーショナルな表現を定義できるため、標準のSQLでクエリできます。これにより、使い慣れたBIツールで業務分析を行えます。
マルチモデルデータベースには一元化された検索インターフェイスがあり、統合されたインデックスを使用して複数のデータモデルに対してクエリを実行できます。通常は、データ型ごとに特定のインデックスを選択・管理しなければなりませんが、MarkLogicプラットフォームは、データが読み込まれるとすぐに高速のデータアクセスを実現する一連の統合インデックスを備えています。マルチモデルデータベースはGoogleのように機能します。Googleでは、webページを特定のフォーマットに合わせる必要はありません。ページにインデックスを付けて、統合検索インターフェイスからアクセス可能にしているだけです。
MarkLogicプラットフォームはビルトインの検索エンジンにより、すべてのデータ型をインデックス付けして卓越した検索パフォーマンスを実現します。したがって、1つのクエリ内で複数の内容を組み合わせることで、複数のデータモデルのデータを迅速に検索できます。例えば、セマンティッククエリと検索クエリを組み合わせて、保険に加入していない慢性疾患の患者を見つけることができます。
マルチモデルデータベースには業界標準のクエリ言語とAPIが備わっているため、サポートされるすべてのデータモデルのデータを柔軟に格納してアクセス可能です。MarkLogicプラットフォームにより、ユーザーは検索、SQL、SPARQL、REST APIを使用してデータのクエリを実行できます。また、JavaScript、Node.js、Java、XQueryなど、複数のプログラミング言語もサポートしています。
真のマルチモデルデータベースであるMarkLogicは、マルチモデルデータアクセス用の一元化されたクエリインターフェイスとしてOptic APIも備えています。あらゆるデータモデルのデータに柔軟かつ簡単にアクセスできます。ドキュメント、リレーショナルビュー、セマンティックグラフを対象として、1つのクエリ内で複数の内容を組み合わせることができます(どのような組み合わせも可能です)。例えば、Optic APIを使用して、ドキュメントの検索やフィルタリング、リレーショナルな操作(結合や集計など)、出力用のドキュメントの抽出(または作成)などを実行できます。他のマルチモデルデータベースでもこんなことができるでしょうか。
マルチモデルデータベースは、データモデリングの柔軟性と統合されたクエリインターフェイスに加え、データセキュリティ、ガバナンス、トランザクション処理に単一のモデルをとっています。統合されたデータプラットフォームとして、開発者の生産性と運用効率を向上します。
真のマルチモデルデータベースであるMarkLogicは、データセキュリティ、ガバナンス、一貫性に関して一元化されたモデルを提供します。シェアードナッシングアーキテクチャにより、拡張性と可用性を実現し、開発、テスト、アップグレード、バックアップ、リカバリなどの運用フットプリントを低減します。