ホームWeb例規集フォーラムお仕事Tips


洋々亭キャンペーン その3

GoogleでつくるWeb例規集の「輪」
「Web例規全集」へ参加のご提案

2004/5/15



「Web例規全集」とは?

 

 洋々亭ではWeb例規集へのリンクを提供し、好評を得ています。このようなリンク集は、見たい自治体が決まっている場合には適していますが、「どこかにこんな条例ないかな?」、「同規模の自治体ではどうやっているんだろう?」という場合は、市町村の例規集を一つ一つ見るか、Googleの検索結果から拾い集めるしかありません。このため、次のようなニーズが出てきます。

@ 全市町村のWeb例規集を、単語で横断的に検索したい。
A 人口や規模、改正年度などの条件で横断検索したい。

 このような機能を実現する仕組みを「Web例規全集」と名づけましょう。
 Web例規全集を実現するには、2つの方法が考えられます。


 全自治体の例規集を一箇所に集め、例規全集データベースを作る。

 Web例規集は各自治体のサイトに置いたまま、Googleなどの検索を
  利用する。


 このうちAについては、現状でも不可能ではありません(アイディアを最後に述べます。)。しかし、高速大容量のサーバやソフトウェアの開発などが必要で、費用もかかります。
 そこでここでは、とりあえずWeb例規全集の機能を簡易的に実現するため、BのGoogleによる方法を提案します。 
 なお、この提案の実現そのものは、ベンダー各社の皆様のご協力がなければどうにもならないものですが、各自治体や関係者の方々も、Web例規集に対する社会のニーズが変わりつつあることを考えていただくきっかけになればと思います。

 

なぜGoolgeなのか?

 

  いうまでもなく、Googleは世界最大のWebサイト検索エンジンです。
「ロボット」と呼ばれるプログラムで自動的に世界中のWebサイト内(もちろん自治体のサイト内も)のHTMLファイルやPDFファイルを探索収集し、その内容をデータベース化して蓄えます。つまり、「ある範囲で」例規全集データベースがGoogleの中に出来ていることになります。
 そして、利用者が単語や条件を入力すると、該当するサイトやページへのリンクを返してきます。また、Googleでは検索一覧の画面から「キャッシュ」で表示すると、こんな感じに検索語が着色されて表示されるので、見やすくなります。
 しかし、GoogleをWeb例規全集に使う最も重要なポイントは、検索する側で検索の条件を以下のようにさまざまに指定できることです。


・複数の単語を組み合わせて検索できる。
・特定のサイト内の、特定のディレクトリだけを検索対象にできる。
・隠しタイトル内の特定の単語も検索対象になる。


 これらをうまく組み合わせることによって、ある単語を含む条例等を全自治体のWeb例規集から横断的に検索することが可能となるのです。

 以下は、リンク集のページにも配置した、Web例規集横断検索のフォームです。試して、検索結果の「キャッシュ」を見てみてください。

 Googleで全国の
 Web例規集を横断検索!


全自治体
   

 なお、このようなサービスを提供しているのは今のところGoogleだけのようですが、Yahoo!なども検索サービスの強化を目指しているようなので、さらに優れたサービスの登場に期待したいものです。



問題点1:GoogleがアクセスできないWeb例規集がある?


 できているんなら、もういいじゃん、といわれそうですが、残念ながら現時点では上のフォームでの検索結果の精度は50%以下です。
 原因として3つが上げられます。
 ひとつは、ホームページで公開されているのに、条例等の本文がGoogleの検索対象とならないWeb例規集が相当数存在することです。
 Googleは、データ収集プログラム(ロボット)で、世界中のサイトを「リンクをたどりながら」巡回してページを収集し、その内容を分析してデータベースに登録しています。ところが次のような場合、Googleは条例等の本文のデータにアクセスできず、結果としてGoogleで検索できません。


 @ 目次から本文へのリンクがロボットが読めるように書かれていない。

 A プログラムで自動的にページを作っている(ダイナミックページ)。
  (注)


 Googleが条例等の本文を検索できないと思われるWeb例規集には、次のようなものがあります。(2004年5月現在)

 ・(株)ぎょうせい (ExpressFinder版のみ不可。HTML版はOK)
     … 広島市、上越市、高山市、本渡市、人吉市など
 ・第一法規(株) … 検索機能付き版、HTML版とも不可
 ・新日本法規(株) … 遠野市、富岡市、鳩ヶ谷市 など
 ・大和速記情報センター(株) … 古河市、西東京市
 ・フューチャーイン(株) … 滝川市、狭山市、鴨川市など

 痛いのは、シェア4分の1を占める第一法規(株)製のHTML版が、目次までは検索できるのに、本文の検索ができないことです。これは、本文はHTMLなのですが、目次側で本文へのURLを明記せず、JavaScriptで自動生成する仕組みになっているため、Googleのロボットがリンクを見つけられないようです。
 これとは逆に、東京法令出版(株)は、独自検索システムですが、本文へのリンクは明示のため、Googleで検索できます。(帯広市、水海道市、小矢部市など)


問題点2:本文だけでは、市か村か分からない

 そんなばかな、と思われるでしょうが、事実です。
 例えば千葉市で「千葉市情報公開条例」のように表題に市町村名が入っている場合はいいのですが、「乳幼児の医療費の助成に関する条例」となると、本文のデータだけからではどこの自治体か、県か村かすら分かりません。
 洋々亭のフォームでは、やむをえずページのURLに「pref」や「city」が入っているかどうかで絞込みを行っています。


・県 … www.pref.aomori.jp/〜
・市 … www.city.aomori.aomori.jp/〜


 しかし、地域サイトへの相乗りなどで、URLにこれらのキーワードが入っていないと、検索からもれてしまいます。
 これはGoogleというより、ホームページ記述言語のHTMLが「意味」を記述できないためであり、そのためXMLが切り札とされているわけです。(注)
しかし、とりあえず、今できることは何かを考えなくてはなりません。

問題点3:ファイルの置き場所がばらばら

 3つめの問題は、同じ会社製のWeb例規集でさえ、サイト上で本文や目次の置き場所がまちまちなことです。Googleで検索するときには、面倒です。
 たとえば、同じ(株)ぎょうせい製でも、違いがあります。


・仙台市の情報公開条例:
http://www.city.sendai.jp/soumu/bunsyo/reiki/reiki_honbun/
aa60009061.html

・新潟市の情報公開条例:
http://www.city.niigata.niigata.jp/reiki/honbun/ae40200731.html


 検索するときは「inurl:reiki_honbun OR inurl:honbun」などとして、両方を指示しなくてはなりません。
 また、reiki_honbunは明確ですが、「honbun」だけでは、別の記事の本文も引っかかりそうな気がします。

関係者のみなさんへ提案です

 前置きが長くなりました。洋々亭から関係者のみなさんへの提案です。
 もちろんすぐに出来ることではないし、2004年4月には総務省の電子自治体システム検討会も出来たようですので、いずれは統一に向かうのではないかと思いますが、バージョンアップの際にはぜひご検討ください。

@ 目次から本文へはURLを明示してリンクしよう (注)
 外部向けのWeb例規集は、目次から本文へのリンクはJavaScriptやダイナミックページを使わず、URLを明示してリンクしましょう。例規集のアクセス頻度やセキュリティを考えてもそれほど難しくはないのでは。

A META情報を活用しよう
 Googleなどの探索ロボットは、TITLEのほかMETA情報も検索対象にします。そこで、下案のような情報を、META情報として埋め込むことを提案します。本文HTML生成の際に、各自治体ごとのパラメーターとして設定しておけませんかね。


<TITLE>乳幼児の医療費の助成に関する条例</TITLE>
<META name="description" content="最終改正:平成16年4月1日">
<META name="keywords" content="city,県庁市、政令市,千葉県,千葉市">

【注1】自治体別
    県…pref、市…city、町…town、村…vill、
    広域連合…rengou、事務組合…kumiai とする。
【注2】種類別…政令市、中核市、特例市の別を記述
    また、県庁所在市の場合「県庁市」を追記


B 目次と本文のディレクトリ名を統一しよう


 最後のお願いは、URLの各社統一です。
 下案でよろしくお願いします。


・ルートディレクトリ…「 reiki/ 」
・目次ディレクトリ …「 reiki/reiki_mokuji/ 」
・本文ディレクトリ …「 reiki/reiki_honbun/ 」


統一の効果は?

 もし、各社が協力していただければ、Googleによる検索はどう変わるのでしょうか。 直接入力では、以下のように統一されます。フォームを使えば、さらに簡単に検索できるでしょう。
 関係の皆様のご一考・ご検討をお願いいたします。


(例1) 村レベルの乳幼児医療費関係の条例本文を探す場合
  乳幼児医療費 vill inurl:reiki_honbun intitle:条例

(例2) 中核市の懲戒の公表関係例規を探す場合。
  懲戒 公表 中核市 inurl:reiki_honbun


究極の例規全集データベースに向けて

 最後に僭越ながら、究極の目標である例規全集データベースについて想像しておきます。
 GoogleによるWeb例規全集はあくまで簡易版。自治体側で努力した結果が、Googleのデータベースに必ず反映されるとは限りません。
 厳密な検索のためには、やはり正確なデータの収集と解析が必要です。総務省や市町村長会、法令出版社などがデータベースを構築していただけることが望ましいと思います。しかし、どこで設置するにしろこれからの自治体には、いちいち人手で改正データを管理者に上納している暇はありません。となると、本格例規全集DBは、自治体例規集のみを探索収集するGoogleのミニ版として構築するのが適当と思われます。探索ロボットはすでにオープンソフトのものが多数あります。
 ただし、検索エンジンについてはnamazuとcha-senの組み合わせでは少し荷が重そうなので、ジャストシステムのConceptBaseなど優れたものを、法務向けにチューンして採用したいものです。 (注)
 それまでに、各社Web例規集のデータ構造仕様がXMLで統一されていれば、わざわざ変換システムを作る必要がなくなります。あるいは、集中型のサーバさえ不要になるかもしれません。

 しかし逆にそのとき、本稿で検討した問題点、特にロボットが読めないリンク形式が解決されていなければ、例規全集DBの自動化は難しいかもしれません。究極の例規全集に向け、本稿の提案が、検討のきっかけになればと思います。

 

●●●


ホーム  戻 る  このページのトップ

 

戻 る

 

 

 

 


目次


・「Web例規全集」とは?


・なぜGoogleなのか?


・問題点1:GoogleがアクセスできないWeb例規集がある?


・問題点2:本文だけでは、市か村か分からない


・問題点3:ファイルの置き場所がばらばら


・関係者のみなさんへ提案です


・統一の効果は?


・究極の例規全集データベースに向けて





●洋々亭キャンペーン その2

 ・Web例規に検索機能と自治体トップページへのリンクを付けよう!運動



























































(※注)
Googleのロボットがリンクを読めない例

・JavaScriptでリンクを生成(第一法規など)
<A href="javascript:
Open('ABC','XYZ')
">
洋々市表彰条例</A>

・サーバでリンクを生成(フューチャーインなど)
<A href="http://
www.city.ABC.jp/reiki/
XYZ.exe?A=123
&B=789
>
洋々市表彰条例</A>




 誤解の無いように付け加えますが、本稿はどのベンダーが良い、悪いという話ではありません。個別のシステムとしてはそれぞれに特徴と工夫をこらした製品ですが、これほどのWeb検索の一般化を数年前ですら想定できるはずはないし、また発注者側も(私も含めて)そんなニーズが発生しようとは考えていなかっただけなのです。












(※注)
 下はXMLによる本文データのイメージです。
 意味付けしたタグにより検索が容易になります。今後は法令情報のタグの共通化が必須です。
 XML対応ブラウザ(Internet Explorer)等で美しいレイアウトで表示・印刷ができます。


<例規>
<自治体名>
 海梨県洋々市
</自治体名>
<例規名>
 里山愛護条例
</例規名>
<施行日>
 1998/10/1
</施行日>
<最終改正>
 2004/4/1
</最終改正>

<本文>
<条>第1条</条>
<文>この条例は…

 (以下中略)
   …

</本文>

</例規>






(※注)
 洋々亭では、これまで「ベンダー提供の検索システムをそのままインターネット公開するのがベスト」と主張してきましたが、「庁外向けに公表されるデータは、できる限り閲覧者が利用しやすいオープンな形式で提供されるべき」と変更します。

 これからのWeb例規集の「利用者」が誰かを考えると、住民や自治体職員同士、研究者はもちろんですが、「企業立地 支援 OR 補助」などと行政サービス水準の比較の目的で検索される場合も増えてくるはずです。
 ターゲットと戦略の転換が必要です。





































(※注)
 問題は容量と速度ですが、幸い(?)市町村合併により平成17年度中に1,800以下に減少が見込まれます。
 条例数は単純計算で@1000本×1800市町村=180万本、容量は@100メガバイト×1800市町村=180Gバイト。
 現在では高価なサーバが必要ですが、サーバと回線はどんどん高速化していますので、数年後には標準的なシステムで対応できそうです。誰もやっていなかったら、個人でもできるかも?(^o^;)