Atsushi YAMADA
2003.01.08.

作業手順
(1) 各館のExcelファイルをTSVで保存
(2) 各館のTSVからインハウスXMLインスタンスを生成
(3) 各館毎にダブリンコアへの変換表を準備
(4) 変換表を用いてインハウスXMLインスタンスをダブリンコアXMLインスタンスに変換
	mkdc.xsl: 各館毎に一つのXMLファイルを生成
	mkdc2.xsl: オブジェクト毎に一つのXMLファイルを生成 (XalanのRedirect機能を利用)
(5) ダブリンコアXMLインスタンスをXML DBに登録
(6) ウェブサーバからXML:DB API (http://www.xmldb.org/xapi/) を用いてXML DBに接続
(7) 検索条件をXPath式に変換して検索
(8) 検索結果を表示

このとき、
(1)(3)は手作業、
(2)は簡単なPerlスクリプトを書いて実行、
(4)はXSLTの処理系としてXalan (http://xml.apache.org/xalan-j/)を、
(5)のXML DBとしてはXindice (http://xml.apache.org/xindice/) を、
(6)のウェブサーバとしてはBayServer (http://www.baykit.org/bserv/) を、
(7)(8)にはXMLコマンドXi (http://www.baykit.org/xi/) をそれぞれ用いた。

7日に河合さんから送られてきたデータは(3)の変換表さえあればいつでも追加登録可能。



ペーパでは以下の点について議論する

・technical aspect
 上記の処理の流れに加えて、
 インハウスDB、インハウスDBからDCへの変換のタイミングの違いによる実装の可能性
・semantic (content) aspect
 qualifierを使わないとコンテントの意味がどれだけわからないか
 DCによる構造化はしているもののその内容については文字列マッチング、その限界