電子辞書 part 50 (818レス)
上
下
前
次
1-
新
640
: 04/01(月)00:57
ID:JCAMkGnT(3/3)
AA×
[240|
320
|
480
|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
640: [] 2024/04/01(月) 00:57:42.48 ID:JCAMkGnT 平凡社の大百科は見出し語9万インデックス42万らしいけれど、Wikipedia日本語は見出し語140万超。英語版に至っては680万を超えたとか。百科系は電子辞書では収容し切られないだろうな。 Wikipediaの記事の著作権はパブリックでXML形式のファイルでDLできる。GB単位の巨大テキストだけれど解析プログラム書いてインデクサーごっこ遊びはやり甲斐があるし面白いですよ。生成AIのコアデータでもあるだろうし。若い人はぜひチャレンジして見ほしいね。 http://lavender.5ch.net/test/read.cgi/dgoods/1645380469/640
平凡社の大百科は見出し語万インデックス万らしいけれど日本語は見出し語万超英語版に至っては万を超えたとか百科系は電子辞書では収容し切られないだろうな の記事の著作権はパブリックで形式のファイルでできる単位の巨大テキストだけれど解析プログラム書いてインデクサーごっこ遊びはやり甲斐があるし面白いですよ生成のコアデータでもあるだろうし若い人はぜひチャレンジして見ほしいね
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 178 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
ぬこの手
ぬこTOP
0.023s