2008-12-02 memo 研究会講演エントリ締め切り: 12/19 次回委員会: 12/22, 10:00- ここで議論する。 予稿締切:2009年2月23日(月) 歴博 1件 本委員会 1件 他をどうする。 3月の発表の内容の審議 ~~~~~~~~~~~~~~~~~~~~~ 分類名称 資料名称 属性 -- これは使わない。ない。 夏以降,資料名称への適用はやっていない。(科研申請内容には資料名称への適用を含む。) 資料名称の中のことばを分類名とみなして処理することは可能。 一つの分類: collection 中の語彙の共起関係を調べた。 語彙の使用頻度が低いと拾えないという本質的問題がある。 IDF: 語彙の使用頻度には関係しない。 資料の数と語彙の数とは関係ない。 幾つか集めた。衣装に限らず。7 collection 衣装 15 collection (階層をもつものもある。--> 最下位を使う。) 衣装についてやる。 - 同じ手法 GETAによる類似度計算。 - collectionとwordの間の出現行列。出現の値,出たか出ないの2値 - すべての語 or 主要語(その他の小石) で行列をつくる。  たぶん左下がり。左を主要後とする。 次回までにどこまでできるか。