研究資源共有化システム
研究資源共有化システムにおけるnihuINT(統合検索システム)
1. システム構成の基本方針と要件
研究資源共有化システムは、2つのシステム(nihuINTとnihuONEシステム)から構成されています。第1期(2005年度〜2007年度)システムとして、開発されたもので、2008年4月から一般公開されています。
ここでは、研究資源共有化システムについて、nihuINTを主な例として、概説します。なお、より詳しくは、下記の資料を参考にして下さい。
2. システムの全体概要
システムを設計するにあたり、次のような8つの方針を定めています。
【8つの方針】
1. 6機関の公開中の原データベース
を共有化対象とする(2008.4時点で108種類)。
2. 原データベース
には手を入れない。すなわち、再構築などをしない。
3. 利用者は人文科学研究者を中心とするが、一般公開を行う。
4. 全データベースに対して、一元的な検索すなわち横断検索を行う。個々のデータベースの操作法の違いや所在を意識しない。
5. 検索および結果の高度処理を行う(時空間情報解析システムなど)。
6. 可能な限り、国際標準技術を用いる。
7. 先行研究成果などを活用する[1][2]。
8. 当面、6機関を対象とするが、将来他機関などへの接続を考慮する。
方針に基づき、nihuINTは次の3つの技術要素を柱として構築しています。
【3つの技術要素】
1. XML
による標準的なデータ記述を行う。
2. メタデータ
(Dublin Core
を主とする)によるデータベースの違いを吸収する。
3. 国際標準検索プロトコルによる検索手順の一元化(Z39.50
およびSRW:Search/Retrieve Web service
)を用いる。
3.システムの構成全体概要
システム構成の概要を、図1に示します。当初計画で全体的な構想です。各機関には、それぞれの固有のデータベースがすでに構築され、専用の情報システムでサービスされています。この情報システムに対して、FES:Front End System
ならびにGWS:Gate Way System
を前置きしています。
FES
は、メタデータによって原データベース
の違いを吸収します。GWS
は、利用者の検索を担当します。通常、利用者はWebアクセスにより、GWS
を介して情報検索を実施します。FES
とGWS
の連携により、標準の一貫した横断検索を実現しています。なお、現在のシステムでは、機構以外の外部研究機関への接続は行っていませんが、ハーベスティング
によるメタデータの集約で対処します。以下、個々のシステムについて概説します。
図1 システム構成概要図(当初計画)
4.個々のシステム
(1) 基本システム
図2に、基本システムの現在の構成を示します。各機関のFES
とGWS
を合わせて、基本システムと呼びます。FES
は、個々の原データベース
ごとにメタデータ・マッピング
を行い、個々のMDB(メタデータ・データベース)を構築し、保持します。FES
は、情報検索プロトコルZ39.50
およびSRW:Search/Retrieve Web Service
により、GWS
と接続し、MDB
に対する情報検索を実施します。GWS
をクライアントとし、FES
をサーバとするインターネット通信に依っています。
利用者はWebアクセスにより、GWS
に持つWebサーバに対して、横断検索要求を行い、共有化検索の結果を得ます。Webサーバは、標準検索システムクライアントと、ゲートウェイを行い、検索を実施します。Z39.50
(v.2)とSRW
(v.1.1)は、データベースごとに明示的に指定しますが、おおむねSRW
に統一しています。nihuINTは、インフォコム株式会社による製品InfoLib-GlobalFinder
を用いて開発しています。
図2 基本システム構成概要図(現在)
(2) MGR
MGR:Managerは、機構本部に置かれた基本システムの1つであり、nihuINT全体の運用管理を行います。MDBの登録、削除、更新などの状況を把握し、利用統計、障害対策、資源管理、バックアップなどの運用管理を行います。さらに、共有化に共通する情報資源(例えば、地図、地名辞書データなどのコンテンツ、高次処理用機能ソフトウェアなど)のサーバとして位置づけ、利用者からのダウンロードに対応する機能を持っています。
リポジトリ機能
を持っています。OAI-PMH:The Open Archives Initiative Protocol for Metadata Harvesting
に依っています。現在、外部機関との接続は行っていませんが、機関FESからの運用管理情報の取得などに用いています。
(3) メタデータ
メタデータは、Dublin Core
をベースとして、人間文化研究機構マッピング規則
[3]を策定し、6機関の100余の全データベースのMDBを作成しています。全項目、5W1H(人・物・時・所)、書誌(名称・作者・主題)、詳細(5W1H+書誌)、および拡張DCMES:Dublin Core Metadata Element Setの5カテゴリによる検索と表示を行います。
また、GTA:Geo-Temporal Analyzer
(時空間情報解析システム)用に、時空間メタデータも定義しています。
(4) 利用者インタフェース
利用者インタフェースは、一般利用を考慮し、実証実験、モニタ試験などを経ながら、使い易さを優先し、実装しています。上記の5カテゴリによる検索方法、ならびにより高度な専門向き検索にも対応しています。検索結果についても、例えば一覧表示と詳細表示、結果のソート、キーワードのハイライト表示、原データベース
へのリンクなど、多くの機能を提供しています。
図3 検索画面の流れ
図3に、検索と表示の利用画面の遷移を示します。また、図4、5に検索画面の実例を示します。原データベースへのリンクは、通常はURL
参照により行います。なお、FES
のメタデータ変換などでURL作成ができない場合、あるいはデータ全件出力などで参照URLを複雑化させる場合などでは、中継機能として、リゾルバ機能
をGWSに置き、リンク用URLを作成参照します。管理者用インタフェースを設けています。基本システム環境の運用管理、およびMGRによるnihuINTのトータルな運用管理を行います。
(5) GTA
横断検索だけではなく、検索と結果の高次処理の1つとして、GTA:Geo-Temporal Analyzer
インタフェースを、Webプラグインとして実装しました。検索画面にGTA検索機能を埋込み、選択利用ができます。
空間検索時間表示機能(CIF:Chrono-oriented Interface Function)、空間表示機能(GIF:Geo-oriented Interface Function)を持ちます。タイムスライダ
による時間範囲の指定や、地図を使用した位置範囲の指定を行って、データベースを検索することができます。また、検索結果を年表上や地図上に表示することもできます。より詳しいGTA機能については、参考資料(GT-Map
,GT-Time
)をご覧ください。

図4 検索画面の1例
図5 検索結果の一覧画面の1例









