english

研究資源共有化システム

研究資源共有化システムにおけるnihuINT(統合検索システム)

1. システム構成の基本方針と要件

研究資源共有化システムは、2つのシステム(nihuINTnihuONEシステム)から構成されています。第1期(2005年度〜2007年度)システムとして、開発されたもので、2008年4月から一般公開されています。

ここでは、研究資源共有化システムについて、nihuINTを主な例として、概説します。なお、より詳しくは、下記の資料を参考にして下さい。

>nihuINT(2008.3.14 シンポジウム講演資料)pdf

2. システムの全体概要

システムを設計するにあたり、次のような8つの方針を定めています。

【8つの方針】

1. 6機関の公開中の原データベースto the Dictionaryを共有化対象とする(2008.4時点で108種類)。

2. 原データベースto the Dictionaryには手を入れない。すなわち、再構築などをしない。

3. 利用者は人文科学研究者を中心とするが、一般公開を行う。

4. 全データベースに対して、一元的な検索すなわち横断検索を行う。個々のデータベースの操作法の違いや所在を意識しない。

5. 検索および結果の高度処理を行う(時空間情報解析システムなど)。

6. 可能な限り、国際標準技術を用いる。

7. 先行研究成果などを活用する[1][2]

8. 当面、6機関を対象とするが、将来他機関などへの接続を考慮する。

 

方針に基づき、nihuINTは次の3つの技術要素を柱として構築しています。

【3つの技術要素】

1. XMLto the Dictionaryによる標準的なデータ記述を行う。

2. メタデータto the DictionaryDublin Coreto the Dictionaryを主とする)によるデータベースの違いを吸収する。

3. 国際標準検索プロトコルによる検索手順の一元化(Z39.50to the DictionaryおよびSRW:Search/Retrieve Web serviceto the Dictionary)を用いる。

3.システムの構成全体概要

システム構成の概要を、図1に示します。当初計画で全体的な構想です。各機関には、それぞれの固有のデータベースがすでに構築され、専用の情報システムでサービスされています。この情報システムに対して、FES:Front End Systemto the DictionaryならびにGWS:Gate Way Systemto the Dictionaryを前置きしています。

FESto the Dictionaryは、メタデータによって原データベースto the Dictionaryの違いを吸収します。GWSto the Dictionaryは、利用者の検索を担当します。通常、利用者はWebアクセスにより、GWSto the Dictionaryを介して情報検索を実施します。FESto the DictionaryGWSto the Dictionaryの連携により、標準の一貫した横断検索を実現しています。なお、現在のシステムでは、機構以外の外部研究機関への接続は行っていませんが、ハーベスティングto the Dictionaryによるメタデータの集約で対処します。以下、個々のシステムについて概説します。

図1 システム構成概要図(当初計画)

図1 システム構成概要図(当初計画)

4.個々のシステム

(1) 基本システム

図2に、基本システムの現在の構成を示します。各機関のFESto the DictionaryGWSto the Dictionaryを合わせて、基本システムと呼びます。FESto the Dictionaryは、個々の原データベースto the Dictionaryごとにメタデータ・マッピングto the Dictionaryを行い、個々のMDB(メタデータ・データベース)を構築し、保持します。FESto the Dictionaryは、情報検索プロトコルZ39.50to the DictionaryおよびSRW:Search/Retrieve Web Serviceto the Dictionaryにより、GWSto the Dictionaryと接続し、MDBto the Dictionaryに対する情報検索を実施します。GWSto the Dictionaryをクライアントとし、FESto the Dictionaryをサーバとするインターネット通信に依っています。

 利用者はWebアクセスにより、GWSto the Dictionaryに持つWebサーバに対して、横断検索要求を行い、共有化検索の結果を得ます。Webサーバは、標準検索システムクライアントと、ゲートウェイを行い、検索を実施します。Z39.50to the Dictionary(v.2)とSRWto the Dictionary(v.1.1)は、データベースごとに明示的に指定しますが、おおむねSRWto the Dictionaryに統一しています。nihuINTは、インフォコム株式会社による製品InfoLib-GlobalFinderto the Dictionary を用いて開発しています。

図2 基本システム構成概要図(現在)

図2 基本システム構成概要図(現在)

 

(2) MGR

MGR:Managerは、機構本部に置かれた基本システムの1つであり、nihuINT全体の運用管理を行います。MDBの登録、削除、更新などの状況を把握し、利用統計、障害対策、資源管理、バックアップなどの運用管理を行います。さらに、共有化に共通する情報資源(例えば、地図、地名辞書データなどのコンテンツ、高次処理用機能ソフトウェアなど)のサーバとして位置づけ、利用者からのダウンロードに対応する機能を持っています。

リポジトリ機能to the Dictionaryを持っています。OAI-PMH:The Open Archives Initiative Protocol for Metadata Harvestingto the Dictionaryに依っています。現在、外部機関との接続は行っていませんが、機関FESからの運用管理情報の取得などに用いています。

 

(3) メタデータ

メタデータは、Dublin Coreto the Dictionaryをベースとして、人間文化研究機構マッピング規則to the Dictionary[3]を策定し、6機関の100余の全データベースのMDBを作成しています。全項目、5W1H(人・物・時・所)、書誌(名称・作者・主題)、詳細(5W1H+書誌)、および拡張DCMES:Dublin Core Metadata Element Setの5カテゴリによる検索と表示を行います。

また、GTA:Geo-Temporal Analyzerto the Dictionary(時空間情報解析システム)用に、時空間メタデータも定義しています。

 

(4) 利用者インタフェース

利用者インタフェースは、一般利用を考慮し、実証実験、モニタ試験などを経ながら、使い易さを優先し、実装しています。上記の5カテゴリによる検索方法、ならびにより高度な専門向き検索にも対応しています。検索結果についても、例えば一覧表示と詳細表示、結果のソート、キーワードのハイライト表示、原データベースto the Dictionaryへのリンクなど、多くの機能を提供しています。

図3 検索画面の流れ

図3 検索画面の流れ

 図3に、検索と表示の利用画面の遷移を示します。また、図45に検索画面の実例を示します。原データベースへのリンクは、通常はURLto the Dictionary参照により行います。なお、FESto the Dictionaryのメタデータ変換などでURL作成ができない場合、あるいはデータ全件出力などで参照URLを複雑化させる場合などでは、中継機能として、リゾルバ機能to the DictionaryGWSに置き、リンク用URLを作成参照します。管理者用インタフェースを設けています。基本システム環境の運用管理、およびMGRによるnihuINTのトータルな運用管理を行います。

 

(5) GTA

横断検索だけではなく、検索と結果の高次処理の1つとして、GTA:Geo-Temporal Analyzerto the Dictionaryインタフェースを、Webプラグインとして実装しました。検索画面にGTA検索機能を埋込み、選択利用ができます。 空間検索時間表示機能(CIF:Chrono-oriented Interface Function)、空間表示機能(GIF:Geo-oriented Interface Function)を持ちます。タイムスライダto the Dictionaryによる時間範囲の指定や、地図を使用した位置範囲の指定を行って、データベースを検索することができます。また、検索結果を年表上や地図上に表示することもできます。より詳しいGTA機能については、参考資料GT-Mappdf,GT-Timepdfをご覧ください。

図4 検索画面の1例

図4 検索画面の1例

図5 検索画面の1例

図5 検索結果の一覧画面の1例