Founders Online

Founders Onlineは、米国国立公文書館より委託され、バージニア大学で導入されている無料のオンラインツールです。バージニア大学の出版局では、アメリカ合衆国建国の父であるトマス・ジェファーソン、ベンジャミン・フランクリン、ジョージ・ワシントン、ジェームズ・マディソン、ジョン・アダムス、アレクサンダー・ハミルトンに関する文書を一般に公開しています。Founders Onlineは、50年にわたる学術的取り組みから発展し、米国国立公文書記録管理局の歴史出版物記録委員会により設立され、華やかかりし啓蒙の時代について独自に洞察できます。Founders OnlineのWebサイトでは、150,000件を超えるドキュメントが検索可能で、その数は175,000件まで増加する予定です。

ケーススタディのPDFをダウンロード »


課題

Founders Onlineは、数十年にもわたる学術研究から発展したものであるため、バージニア大学では大きな課題に直面していました。大学の出版局には、従来は限られた研究者しか利用できなかった学術ツールを、誰でも広く利用できる国家の資源に転換することが求められていました。これはバージニア大学だけの問題ではありません。大学の出版局は、時代遅れにならないように、2004年の早い段階にMarkLogicを導入し、Founders Onlineに先立って、XMLベースのプラットフォームを開発しました。しかし、他の多くの組織と同様、当初のプラットフォームは同時ユーザー数の規模の拡大に対応できるようには設計されておらず、バージニア大学の出版局への利用の要望は増加していました。

負荷の増加: 従来のプラットフォームでは、負荷がかかるとシステムパフォーマンスが急速に低下していました。Founders Onlineの開発段階でアーキテクチャをテストした結果、対応できるのは100人の同時ユーザーのみであることが示されていました。

レガシー設計: 当初のシステムの設計に求められていたのは、印刷した際に見た目、ルックアンドフィールを維持することでした。 これは、小規模なファイルに対しては小さな影響しかありませんが、大規模な外部のコレクションの場合はシステムに負荷がかかります。

冗長検索: 当初のプラットフォームでは、機能よりもフォームに重点が置かれていたため、検索を毎回最初から再作成していました。 例えば、あるユーザーが「ジェファーソン」と「独立」で以前に検索している場合でも、後続のユーザーが同じ用語で検索するたびに、完全に新しい検索クエリが実行されていました。このような無駄な労力により、不要な負荷がコンピューティングリソースにかかり、システムの速度が低下する原因になっていました。

限られたリソース: プロジェクトを専門に担当する常勤のプログラマーとして、わずか1.5人相当しか割り当てられなかったことも、事態をさらに複雑にしていました。


ソリューション

MarkLogicは、唯一のエンタープライズNoSQLデータベースプラットフォームとして、数十億のデータポイントを迅速に管理できるコンテンツシステムを長期にわたり開発してきました。MarkLogicでは、柔軟性に乏しい従来の構造化データベースの行や列だけでなく、どのような形式のデータでも入力できるようになります。小規模の組織にとっては、多くのコンサルタントを雇う必要もなくシステムの能力を迅速に拡大して成果を達成できることは、基幹業務に対応したエンタープライズグレードの柔軟性が持つ驚くべき側面といえます。

私たちは小さな組織ですが、MarkLogicを活用することで、利用者の増加に対応してオンライン出版を再設計、再開発することができました。それが実現できたのも、MarkLogicが単一スタックのプラットフォームであり、データは主にテキスト形式のXMLで、検索、ナビゲーション、レンダリングの機能がすべて組み込まれているからです。

David Sewell氏、バージニア大学出版局、編集および技術担当マネージャ

MarkLogicを選ぶ理由

バージニア大学出版局では、MarkLogicがネイティブで持っている検索、ナビゲーション、レンダリングの各機能を利用することで、既存のプラットフォームを再拡張するのに、ゼロから再構築する必要がなくなりました。ドキュメント単位ではなく、全体としてのクエリを考えるだけです。例えば、従来の構造化データベースでは、数百万の行と列を検索していましたが、MarkLogicでは、データマッピングを利用して、関連するドキュメントを迅速に特定できます。

瞬時の検索: 誰が検索しても結果がサイトに瞬時に表示され、200年以上前に書かれた膨大なドキュメントのコレクションでも、Googleのような検索が可能です。MarkLogicの堅牢なクエリツールを利用することで、応答時間が短縮し、90ページ相当の大きなドキュメントで、従来は19秒かかっていたものが、わずか1.86ミリ秒で済むようになりました。同時読み込みも5,000ユーザーに増加し、初期テスト中の能力も50倍と予測されましたが、それでも平均の応答時間はわずか120ミリ秒でした。

既存のITリソースの活用: データマッピングを利用してドキュメントのグループ全体を見ることで、無関係の結果や情報が発生するボトルネックを回避し、結果を迅速かつ正確に返すことが可能になりました。これは、以前のプログラミング上にも構築されており、既存のスイッチを利用して、すでにあるプロセスを再利用できます。

データ洞察の向上: 従来は、以前の検索結果の静的なインデックスを作成し、一般的な検索用語やリンクで検索を開始する前に、それらのインデックスを事前入力していましたが、既知の検索用語がシステムに入力されると、保存されている各ドキュメントを再度検索することなく、既存の結果が表示されるようになりました。そのため、システムの利用者が増加するほど、保存される検索キャッシュも豊富になります。

少ない労力で大きな実績を達成: バージニア大学出版局のプログラマーは2人で、それぞれ半分ずつ担当していましたが、既存のプラットフォームを簡単に再設計して、応答時間を劇的に短縮し、同時読み込み能力を向上させることができました。MarkLogicの直感的で使いやすいインターフェイスにより、既存のプロセスが効率化し、新しい作業が発生しても、簡単かつ適切に対応できるようになり、外部のリソースに多額のコストをかける必要もなくなりました。

顧客の目標の達成: Sewell氏は、「総合的に考えると、MarkLogicを利用することで、パフォーマンスのすべての目標を達成することができました。エンドポイントも完全に新しくなり、今ではFounders Onlineと呼ばれる誰でも利用可能なオープンアクセスのWebサイトが実現しました。」と述べています。

導入事例

ABN AMRO
ALM
American Psychological Association
American Society of Agronomy
Bowker
Broadridge
BSi Group
CABI
Codifyd
Condé Nast
CQ Roll Call
De Gruyter
EBCONT
Elsevier
Fairfax County, Virginia
Federal Aviation Administration
グローバルなNPO
Hannover再保険
Healthcare.gov
HEROLD.at
Informatics Corporation of America
Institute of Engineering and Technology
Institute of Physics
投資銀行
投資銀行(大手1行)
投資銀行(大手5行)
JWG Group
Klopotek
Lagardère Active
M*Modal
Mitchell 1
MVB
National Archives & Records Administration
NBC Universal
OECD Publishing
Oxford University Press
Press Association
Princeton Theological Seminary
Reed Business Information
Royal Society of Chemistry
RSuite CMS
Springer
Thieme
Triumph Learning
University of Virginia
Warrior Gateway
Wiley
Yell.com