没メモ。
正直そのうち船井が使うんじゃないかと思ったので。
UniDic品詞体系 | Yuta Hayashibe
Sudachiで得られる品詞は多分これっぽい
以降、仕様
- 前提:関数一つで実行したい
- 発音が5-7-5
- 5-7-5がそれぞれ各名詞・代名詞・連体詞・副詞・接続詞・感動詞・動詞・形容詞・記号・補助記号から始まる?
→寧ろ、「助詞・助動詞・空白・接尾辞から始まらないもの」という定義かもしれない
- 形状詞ってなんなんすかね?タリとかあるし形容動詞っぽいかも?
「形状詞」という品詞を立てている(=形容動詞語幹) 例:「奇麗」「愉快」
出典元:授業資料/UniDicの品詞体系 - OGI-Wiki
→多分そうという解釈をする。
- 「赤信号みんなで渡れば怖くない」も5-7-5と捉えることがある。長音や促音や撥音を例外処理するのもありかもしれない
→これは仮実装後、というかなんなら本実装後でいい気がする。
- 5-7-5と判定されたらcsvに書き残しておく
- 一定時刻に今日の5-7-5的な感じでエミィにツイートしてもらう。できたら画像で。
→この目標はエミィ1.2の実装時。1.2.bでは要らない。
- ひとまず過去の271108ツイートを全部解析して575の確認をする。
- 甲ループ
- 今までの575をなかったことにする
- スタートの単語を決める
- その単語から575を始められるか確認・始められないなら甲へ戻る
- 乙ループ
- 発音数5になるか確認・5なら乙繰り返し終了・6以上なら甲へ戻る
- 1個次の単語の発音数を足す・乙に戻る
- 丙ループ
- 発音数7になるか確認・7な丙繰り返し終了・8以上なら甲へ戻る
- 1個次の単語の発音数を足す・丙に戻る
- 丁ループ
- 発音数5になるか確認・5なら丁繰り返し終了・6以上なら甲へ戻る
- 1個次の単語の発音数を足す・丁に戻る
- 戊分岐
- 最後が用言であるかの確認・そうならば己へ進む・そうでないなら庚へ進む
- 己分岐
- 活用形の確認・未然形または仮定形であるならば甲へ戻る・そうでないなら庚へ進む
- 庚処理
- 575認定してリストに入れる
ひとまず過去の271108ツイートを全部解析して575の確認をする。
1208件の575が認識された。
うまく言ってそうな例
- アメフトは なんとなくしか わからない
- ツイッター してたらさらに 決められた
- 取り敢えず 観測者の なりきりに
- 知人から みかん5キロが 送られて
- PCの メモリ16 GB
→本当にそれでいいんかねぇ?
- 灯織、今 Voが1 なんだけど
- 眠いのに steam起動 するあたり
ダメな例
- ガムシャやニヴァナやリコラみたい なASって 水以外
これの読みは「ヤヤミタイ ナエーエスッテ ミズイガイ」となっていた。想定外の単語があった時、読みが消失してしまうらしい。もしかしたら「ガムシャ」「ニヴァナ」「リコラ」という単語が補助記号・記号・空白のいずれかに該当する扱いを貰ってしまった可能性があるのでその確認が必要か。
→これMeCabとか使うとどうなるんですかねぇ
- 横浜に いたかと思え ば大阪
どうやら仮定形で句が終わるのもはじいたほうがよさそう
- アクティベーションで検索 かけると、多く のマスター
一般的な単語「アクティベーション」でもこれが起きてしまっていた
- ここからは ミス減らすこと を重視
付属語から句が始まるのはじいていたつもりなんだけどなぁ
- スピニング ☆4とフェルミ 専2つ
☆4の読みがヨンになっているのはいいとしてなんか「2つ」を「フツツ」って呼んでるの気になる
その他の惜しい例
- 狂人 にお淑やかな 服なんて
「狂人に お淑やかな 服なんて」であると575っぽい(字余り字足らずの問題)
- 最近は 「死んでないから セーフ」って
判断に迷う。
- 道徳の 授業って ムダですよ
字余り字足らず問題
- 工匠 結月を+1 するために
読みがちがったがまあそれっぽい
なんなんすかね?
- 「変態度 ブラックリスト 級!」って
- エーファの バトルボイスを 聞き出した
- クランとか 破壊したい気 はするする
するな。
- 「追憶の カノン」、死ぬほど 当てにくい