DTD-SG委員会 2008-05-23, 10:00-12:00 小町 出席者: 山田, 小町, 安達 配布文書: - T.1-3 TF-IDF: テキスト検索で使われる手法。 これが高いのは,代表性が高い。 分類集合 <-- 文書 分類後 <-- 語 式の||: 大きさを示すだけ。 対数の底はなんでもよい。ここでは10。 文脈の中のことばは考慮に入っていない。 ノードラベルは入っている。 一般語から特定語にはいれるか。 キモノから入ってコソデにたどりつけるか。 インスタンスの資料名称は分類後には入っていない。 要求: "近い語"を調べたい。 複数回の扱いをどうするか。 次回: 6/20 10:00-12:00, 学会officeにて。