[過去ログ] Google日本語入力 サジェスト24候補目 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
826
(1): 2022/04/03(日)16:00 ID:pNvEnLFX0(1) AAS
変換において工学的に名詞と固有名詞に違いがあるのかという話だろうがよ

どっちも同じような文脈で使われるし活用にも関わってこないからIMEの辞書で区別する必要性は俺も思い当たらなかった
敢えて言うなら候補の順位とかかな
これも単純にどっちが上になるべきとは言えないけど
827: 2022/04/03(日)22:50 ID:f2Xsx4S20(1) AAS
>>826
上でも言われてるけど、分けたほうが変換精度が高くなるからだろうね
形態素解析とかの仕組みを全く知らないひとにはイメージしにくいかもしれないとは思う

こういった日本語入力ソフトは活用とかの日本語文法のルールを重視して解析してるわけじゃなくて、どんな単語が連鎖しやすいのか、っていうのは品詞や出現頻度などの様々な素性を統計分析した結果から、確率的に候補を出してる
もうちょっと簡単に言うと、あらかじめ大量の文章を集計しておいて、それをもとにして漢字変換の候補を確率的に出している

例えばだけど、「○○さん」という文字列を変換するとき、○○にくるのはただの名詞よりも固有名詞が来る可能性のほうが高くなりそうでしょ
こういうのは文法ルールを活用しているわけじゃなくて、統計情報を使っている

興味があればマルコフ連鎖とか形態素解析で調べてみるとよい
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 1.392s*