BeTSCAE.db?
PoSP_ID参考
https://github.com/taku910/mecab/blob/master/mecab-ipadic/right-id.def
これ、BoS/EoSの区別をしていないから、微修正が必要かも。BeTSCAE側を修正でいいと思うし難しくない気がする。
ここ最近エミィにやらせていたツイート取得をふるいにかけたのでそれを基にそれっぽく試す。
とりあえずベースはマルコフ連鎖的なので試す。とりあえず2つ作ってどれくらい雰囲気違うのか試したい。
MD
- 前の単語を覚えているもの
- 前の品詞を覚えているもの
WD
- 「ID,w,pron,PoSP_ID」と「PoSP_ID,PoSP」
やること
- 品詞の辞書を作る
- データベースの形で保存できるか試す
- 集めたツイートを食べさせる
- 文章生成テスト
エミィ単語検索
- 検索ウィンドウ作って単語入れる
- 未知判定があったかとか確認できるようにしたい
- 未知判定あった時品詞選択とかするのもあり
- 追加登録したらそのまま辞書(WD)の方に登録?
- 類似文章検索自動補完
- 該当の単語(選択条件?)の文章を検索、追加
- 未知語でもやる?
- 辞書編集機能、アクセスに管理者権限つけとかないとまずいかも
- そもそもサイト開く時にクッソ色々必要な可能性あるかもしれない