[過去ログ]
テキスト入力専用ツール 「ポメラ」 Vol.10 (1001レス)
テキスト入力専用ツール 「ポメラ」 Vol.10 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
74: 名無しさん@3周年 [sage] 2010/10/30(土) 10:01:04 ID:KNvuIye4 >>57 2行表示ならまだマシだ。年末になると1行表示の書院が飛ぶように売れて いたものだがあれは使い物にならんかっただろうな。 ワープロ検定で1行書院を持ち込み受験していた強者が大勢いたが、 たいていは不合格だったし。 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/74
75: 名無しさん@3周年 [sage] 2010/10/30(土) 10:13:11 ID:B8hLdFA7 >>309 慢性的に投稿論文が溜まってるので、いつでも使えそうなこれを検討してるんですけど、英語での文章書きってどんな感じでしょうか。 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/75
76: 名無しさん@3周年 [sage] 2010/10/30(土) 10:14:00 ID:B8hLdFA7 >>75 ごめんなさい、意味のないアンカーを入れてしまいました http://toki.5ch.net/test/read.cgi/dgoods/1288013922/76
77: 名無しさん@3周年 [sage] 2010/10/30(土) 16:22:32 ID:dBTDHreI >75 行末、単語の途中で変な改行されたりすることはない 単語単位で改行してくれる スペルチェッカはない 全体像をみたり、戻ったり進んだりして直すのは苦手かも とりあえずどんどん書くだけならOK おれには、ほんとの最初のラフドラフト段階までなら使える あと、機種によって1文書の文字数上限がきつい。要注意 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/77
78: 名無しさん@3周年 [sage] 2010/10/30(土) 19:19:31 ID:8Hsg3u8/ >>72 自分が解析した事があるのは10の辞書で ユーザ辞書本体より前の部分が少々違うようだけど、基本は同じ感じ。 あと10は、ユーザ辞書自体が幾つかのブロックに分かれてるみたい。 72が言う所のトークンが0x0bになっている単語の次は、 まず2以上のブロック番号(?)、それからまた登録単語情報が続いてたから。 0x0bと考えるのか、単に16進で0とbと考えるのかわからないけど。 ただ解析した辞書データの一つは、トークンが 先頭から87、85、88、88、88、8A、89、だったから 10と20でデータ構造が異なるんじゃない限り 1単語毎に+3というのは偶然かも。 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/78
79: 27 [sage] 2010/10/31(日) 00:33:05 ID:9EfVYV0H >>78 情報サンクス。 工場出荷状態に戻して辞書をエクスポートしたものに、単語を追加して確認しています。 毎回、初期状態から開始しているので+3になっていたのでしょう。 0x2576〜は、FATのようにブロックを管理しているのかもしれませんね。 この辞書、漢字の終端を表すコードが無いので トークンと漢字の区別方法が謎でした。 ブロック管理テーブルによって、次のトークンが1バイトか2バイトか予測がつくならば…… http://toki.5ch.net/test/read.cgi/dgoods/1288013922/79
80: 名無しさん@3周年 [sage] 2010/10/31(日) 00:49:57 ID:XcUfMAUV >>79 >0x2576〜は、FATのようにブロックを管理しているのかもしれませんね。 DM10の場合は少なくとも一部は50音での頭出し情報だった。 登録単語は50音順に並んでる訳だけど、先頭からのオフセットが 2バイトずつ使って表現されてた。 0x2576-7は「あ」、0x2578-9は「い」で始まる単語の 0x2614からのオフセットと言う具合。 もっともそれだと途中でバイト数が足りなくなるから 単純にオフセット値が入ってる訳じゃないけど 20でも同じなら単語の位置と照合すればその辺はすぐ分かると思う。 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/80
81: 80 [sage] 2010/10/31(日) 00:58:44 ID:XcUfMAUV >もっともそれだと途中でバイト数が足りなくなるから >単純にオフセット値が入ってる訳じゃないけど 念の為にもう一回確認してたら、まんま入ってた……。 どうやら幻を見ていたようだw http://toki.5ch.net/test/read.cgi/dgoods/1288013922/81
82: 27 [sage] 2010/10/31(日) 03:23:47 ID:9EfVYV0H >>80 DM20で確認しました。ユーザ辞書部分の構造はDM10と同じなのかもしれません。 [ユーザ辞書のインデックス] 0x2614からのオフセットを格納する 登録単語数が0の場合、ffffが設定される。 'や','ゆ','よ'の位置がずれている点に注意 0x2576: あ い う え お 0x2580: か き く け こ 0x258a: さ し す せ そ 0x2594: た ち つ て と 0x259e: な に ぬ ね の 0x25a8: は ひ ふ へ ほ 0x25b2: ま み む め も 0x25bc: や 0x25be: ゆ 0x25c0: よ 0x25c2: ら り る れ ろ 0x25cc: わ http://toki.5ch.net/test/read.cgi/dgoods/1288013922/82
83: 名無しさん@3周年 [sage] 2010/10/31(日) 09:25:29 ID:kl/uLY4J 買ったよ!これで電車のちょっとした時間にテキスト打てる! つて思ったら、基本的に座れないから意味なかった。 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/83
84: 80 [] 2010/10/31(日) 10:35:58 ID:cOvgtv8E >>82 あと読みに使えるのは各種記号、数字、英大文字、英小文字か。 見た限りではこの順番(仮名の前)に入ってたけど それでも埋まらないバイトは他の用途なのか 単なる予約領域なのか分からんねえ。 てか品詞情報どれよw http://toki.5ch.net/test/read.cgi/dgoods/1288013922/84
85: 名無しさん@3周年 [sage] 2010/10/31(日) 10:37:37 ID:rmuNTb+H BT搭載して http://toki.5ch.net/test/read.cgi/dgoods/1288013922/85
86: 27 [sage] 2010/10/31(日) 10:46:05 ID:9EfVYV0H >>84 たぶん、トークンが品詞情報を含んでいる筈ですけど。全部一般名詞で登録しているのに、コードがバラバラ…… >82の解析で登録した内容はこんなかんじになります。 00002614:CODE[84],LEN[01] [ア][あ] 00002619:CODE[87],LEN[02] [イイ][いい] 00002621:CODE[96],LEN[01] [ウ][うううううううううう] 00002638:CODE[90],LEN[01] [エ][えええええええ] 00002649:CODE[86],LEN[01] [オ][おお] 00002650:CODE[86],LEN[01] [カ][かあ] 00002657:CODE[84],LEN[01] [キ][き] 0000265c:CODE[84],LEN[01] [ク][く] 00002661:CODE[84],LEN[01] [ケ][け] 00002666:CODE[84],LEN[01] [コ][こ] http://toki.5ch.net/test/read.cgi/dgoods/1288013922/86
87: 27 [sage] 2010/10/31(日) 10:47:49 ID:9EfVYV0H のこり。コードの変化規則が読めないです。 0000266b:CODE[86],LEN[01] [サ][ささ] 00002672:CODE[88],LEN[01] [タ][たたた] 0000267b:CODE[8c],LEN[01] [ナ][ななななな] 00002688:CODE[88],LEN[01] [ハ][ははは] 00002691:CODE[88],LEN[01] [ヒ][ひひひ] 0000269a:CODE[8c],LEN[01] [フ][ふふふふふ] 000026a7:CODE[88],LEN[01] [ヘ][へへへ] 000026b0:CODE[8a],LEN[01] [ホ][ほほほほ] 000026bb:CODE[89],LEN[02] [ポ][ポメラ] 000026c5:CODE[8c],LEN[01] [マ][ままままま] 000026d2:CODE[8c],LEN[01] [ミ][みみみみみ] 000026df:CODE[8a],LEN[01] [ム][むむむむ] 000026ea:CODE[8a],LEN[01] [メ][めめめめ] 000026f5:CODE[8a],LEN[01] [モ][もももも] 00002700:CODE[8c],LEN[01] [ヤ][ややややや] 0000270d:CODE[8a],LEN[01] [ユ][ゆゆゆゆ] 00002718:CODE[8a],LEN[01] [ヨ][よよよよ] 00002723:CODE[8a],LEN[01] [ラ][らららら] 0000272e:CODE[8a],LEN[01] [リ][りりりり] 00002739:CODE[8a],LEN[01] [ル][るるるる] 00002744:CODE[8a],LEN[01] [レ][れれっれ] 0000274f:CODE[8a],LEN[01] [ロ][ろろろろ] 0000275a:CODE[86],LEN[01] [ロ][RO] 00002761:CODE[86],LEN[01] [ワ][んん] http://toki.5ch.net/test/read.cgi/dgoods/1288013922/87
88: 名無しさん@3周年 [sage] 2010/10/31(日) 11:39:17 ID:Bwt9E9zT ふたりでメールでやってくれよ http://toki.5ch.net/test/read.cgi/dgoods/1288013922/88
89: 名無しさん@3周年 [sage] 2010/10/31(日) 11:48:52 ID:fL4WVOjD どこまでできるかわからないが面白いじゃん そこにある物を追求するのはエロでも機械でも人生の楽しみ http://toki.5ch.net/test/read.cgi/dgoods/1288013922/89
90: 27 [sage] 2010/10/31(日) 11:54:10 ID:9EfVYV0H 記号部分:たぶん、キーボードから入力可能な記号で、先頭に指定可能な文字は網羅した筈です。 '/'(0x2f)で登録すると中黒(0xA5)に化けます。これは仕様かな? 0x245a: # $ % & -- 0x2468: * + -- 0x2488: : ; < = > -- 0x2494: @ 0x2496: A B C D (中略) 0x24c8: Z -- 0x24d2: _ -- 0x24d6: a b c d (中略) 0x2504: x y z -- 0x255e: ・(0xA5) このインデックスを追加した辞書をインポートしてみたけど、相変わらず「失敗しました」と表示される…… orz コードの採番規則の解析が必要なようです。 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/90
91: 80 [sage] 2010/10/31(日) 12:32:16 ID:cOvgtv8E >>86 >00002614:CODE[84],LEN[01] [ア][あ] [84] [01] B0 82 A0 先頭の0x84−自分自身を含んだバイト数5=7F >00002619:CODE[87],LEN[02] [イイ][いい] [87] [02] B2 B2 82 A2 82 A2 先頭の0x87−自分自身を含んだバイト数8=7F 以下、多分全部同じパターン。 ただし「トークンが2バイトになった」場合は当てはまらないけど どうも「2バイトトークンの先頭」ではなく、直前の単語の品詞情報な気がする。 オフセット格納テーブルには、2バイトトークンの場合 2バイト目の位置を格納してるようだし。 で、トークンが特定の数値(7Fかどうかわからないけど)未満なら トークンに登録単語末尾までのレングスそのものが入ってて かつ末尾に品詞情報が付く。それ以外はトークンに品詞情報も含まれる。 上のレスにあった「穢れ」を登録したところ、 上記を前提として書くとこうなってた。 [0A] [04] B9 B6 DE DA E2 71 82 EA [1b] 0x0A=0x0A〜0xEAまでのバイト数 末尾1Bが品詞情報?(一般動詞で登録) その他、末尾が品詞情報だとするとこんな感じ。 固有名詞:0x02、固有地名:0x03、固有組織:0x04、固有一般:0x05 (一般名詞の場合は、トークンに含まれた0x7Fかも) >>88 すまんね。これで退散するよ。 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/91
92: 名無しさん@3周年 [sage] 2010/10/31(日) 12:41:14 ID:cOvgtv8E 忘れてた。最後にもう一つだけ。 >>78 >ユーザ辞書本体より前の部分が少々違うようだけど これは見間違いだったみたいだ。 今のところ多分10も全部20と同じ感じ。 >>90には頑張って解析してほしい。 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/92
93: 27 [sage] 2010/10/31(日) 16:06:44 ID:9EfVYV0H >>92 情報感謝!これでやってみる。 http://toki.5ch.net/test/read.cgi/dgoods/1288013922/93
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 908 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.012s