[過去ログ]
最新ソフトで棋士の指し手一致率を調査した結果 2 (1002レス)
最新ソフトで棋士の指し手一致率を調査した結果 2 http://mevius.5ch.net/test/read.cgi/bgame/1566706590/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
74: 名無し名人 [sage] 2019/08/27(火) 10:44:39 ID:xcsSd39h 使用するソフトの前提条件は? ハム将棋じゃ、どうやっても相関は得られそうにない? 実は強くもないソフトの真似をしてるだけという可能性は如何にして排除すんの? http://mevius.5ch.net/test/read.cgi/bgame/1566706590/74
75: 名無し名人 [sage] 2019/08/27(火) 10:46:36 ID:xcsSd39h ソフトの棋譜を分析した場合に、勝率互角の2系統のソフトについて 自分と同系統のソフトを異常なまでに高く評価するんじゃないの? http://mevius.5ch.net/test/read.cgi/bgame/1566706590/75
76: ◆f7OmZ9ucu2 [sage] 2019/08/27(火) 11:04:10 ID:Jzuv0Y1o >>50 一致率が強さの指標に有効かは、まず、現棋士のランキング(Eloレーティング)が一致率でも近似できることを証明しなければならない 山下氏はこうしたことをやっていないし、平均悪手が少ない順に並べてもEloレーティングのようには並ばない というわけで、前スレに書いた通りhttps://mevius.5ch.net/test/read.cgi/bgame/1557753233/617 なお、前スレは1000まで書き込まずに放置しておけば暫く閲覧可能なはず http://mevius.5ch.net/test/read.cgi/bgame/1566706590/76
77: ◆f7OmZ9ucu2 [sage] 2019/08/27(火) 11:24:03 ID:Jzuv0Y1o >>75 どのソフトでもかまわないが、そのソフトで解析した現棋士の一致率で現棋士のEloレーティングを近似できることが証明されれば、過去の棋士も近似できるということになるはず あくまでも、そのソフト限定での話なので、そのソフトのクセは問題にならない 近似力が高いソフトほど良いソフトという違いがあるだけだね http://mevius.5ch.net/test/read.cgi/bgame/1566706590/77
78: 名無し名人 [sage] 2019/08/27(火) 11:53:38 ID:X4FAyrfF illqha4が出ててめちゃくちゃ強いらしいけど解析は今後もillqha3なんですか? http://mevius.5ch.net/test/read.cgi/bgame/1566706590/78
79: ◆f7OmZ9ucu2 [sage] 2019/08/27(火) 12:03:21 ID:Jzuv0Y1o >>78 途中で変えるわけにはいかないので、全部やり直しするのが大変なんだよな illqha3での結果が納得できなければ変えていただろうけど、たしか、illqha4はレートで50ほどしか違わないよね つまり、プロ棋士とのレベル差で見るとほとんど無視できる差なんじゃないかな 追検証したい人は最新のソフトを使うのもありだし、より深い探索で解析するのもありだね その結果、現役棋士最強は渡辺でも豊島でもなかったということになったらそのソフトは捨てたほうがいいね http://mevius.5ch.net/test/read.cgi/bgame/1566706590/79
80: ◆f7OmZ9ucu2 [sage] 2019/08/27(火) 12:10:47 ID:Jzuv0Y1o Eloレーティングに対する私見 現棋士に関してはEloレーティングがあるからそれで十分で、Eloレーティングがあるからこそ他の指標の検証もできる しかし、Eloレートは過去との連続性に難点があると言われている とくにインフレが問題らしい 棋士の数が増えるのもインフレの要因になるが、数が同数でも増えるほうは1500点、減るほうは成績低下や高齢での引退なので1300点、1200点と点数を減らしてやめていく これがインフレの元になっている 最近は勝率すらインフレを起こしていると言われている(特に下位クラスの実力のバラツキが甚だしい) つまり、相手の絶対レベルが違うとしたら、基準となる1500点の質が時代によって違う可能性が高い というわけでEloレートの代用になる指標があればいいのにということになった http://mevius.5ch.net/test/read.cgi/bgame/1566706590/80
81: ◆f7OmZ9ucu2 [sage] 2019/08/27(火) 12:12:14 ID:Jzuv0Y1o 一致率を調べる意義 もし、一致率が棋力判定に使えるなら利点が多い (1)一致率なら最強時代が異なる棋士でも比較できる (2)新人棋士のレーティングが信頼できるものになるには100局必要とされるが、一致率ならその半分以下で十分だ★ (3)レーティングでは、研究が嵌まってたまたま一時的に高くなっているのか、地力の違いで高くなっているのかが分からない (4)一致率なら、研究から離れた局面でどれだけ最善手を指せるか、疑問手や悪手率が少ないかの指標となるので、棋士の地力が評価できる (5)一致率なら、先後や手数の違い、勝局時、敗局時の一致率など細かい分析ができる (6)レーティングより少ない局数で評価できるから、線型や持ち時間の長さなどで分類して分析することも可能だ ★前半40手除外しても平均1局110手だから70手ある レーティングは勝ちか負けかの1対のデータなのに対して、一致率の場合は一致したか一致しなかったかで1局1棋士に35個のデータがある すなわち、データ数が圧倒的に多い http://mevius.5ch.net/test/read.cgi/bgame/1566706590/81
82: 名無し名人 [sage] 2019/08/27(火) 14:43:52 ID:GTrCiXsb 持ち時間のばらつきをどう補正しているかを知りたい レートなら勝ち負けしかないからサンプル数重視で無視するという考え方もわかるけど、 一致率は持ち時間が長いほど有利なわけだからなにがしかの補正をしてるんだよね。 64年の大山は防衛戦と王座戦、NHK杯しかなくて当時は二日制は10時間だったから 対局の半分は10時間の将棋だったんじゃないの http://mevius.5ch.net/test/read.cgi/bgame/1566706590/82
83: 名無し名人 [] 2019/08/27(火) 15:09:20 ID:KcGblsp/ >>81 一致率の最大の欠点は対戦相手の強さによって大きく変わって来てしまう事 なので時代が違うと対戦相手の平均レベルがわからないので比較ができない Eloレーティングは初期値を1500等で仮置きすると適正なレートに落ち着くまで時間がかかるが、WHRを使えばその問題は解消される 単純に>>46の式を使っても凡その強さはわかる 一致率を調べるまでもなく圧倒的に簡単に算定できる上に精度もどちらが上かわからない http://mevius.5ch.net/test/read.cgi/bgame/1566706590/83
84: 名無し名人 [sage] 2019/08/27(火) 15:13:04 ID:XkW0xNQj >>81 あ、持ち時間で分類もできるとしているのか。 でも昔は10時間とか7時間が多いから面倒だな http://mevius.5ch.net/test/read.cgi/bgame/1566706590/84
85: 名無し名人 [] 2019/08/27(火) 15:26:53 ID:KcGblsp/ >>80 レーティングは時代が異なると完全には同一視できなくなる可能性という問題点があるが、実際にどこまでズレるかはわからない 山下論文のP11の図3、図4を見ると一見インフレしているように見えるが谷川・加藤の推移を見るとそんな事はなく実際に上位棋士のレベルが上昇した可能性が高そう (仮に200近くインフレしていたら現在の谷川が昔の新人で全く伸びなかったプロレベル、引退前の加藤は街のアマチュアレベルという事になってしまう) file:///C:/Users/%E6%B5%85%E4%BA%95/Downloads/IPSJ-GPWS2014002%20(2).pdf なおレーティングがインフレになるというのは誤った俗説で、新規にプロ入りするレベルははどうか、全体の人数の増減はどうかによってインフレになる場合もデフレになる場合もある 実際に自分でモデルを作って検証すればわかる また戦術の進化等による全体のレベル向上があればそもそもインフレしているのが正しい http://mevius.5ch.net/test/read.cgi/bgame/1566706590/85
86: 名無し名人 [] 2019/08/27(火) 15:54:53 ID:KcGblsp/ >>76 平均悪手が少ない順に並べてもレーティングのように並ばないというのはどこにある情報? あと「平均悪手」という単語は「平均悪手率」なのか山下論文で使っている「平均悪手点」の意味なのかどちら? 「平均悪手点」の意味であれば山下論文の図11で少なくともレート2700〜2800程度までは相関してる事を示している レートがそれ以上の場合の「並ぶか」という厳密な検証はなされていないが、少なくとも表20を見ると「並ばない」結果にはなっていない http://mevius.5ch.net/test/read.cgi/bgame/1566706590/86
87: 名無し名人 [sage] 2019/08/27(火) 15:56:56 ID:w6T9Ob4v >>85 将棋の場合はインフレするよ 新四段の若手は大抵平均レベルよりも強く引退してくベテランは平均レベルよりも弱いから http://mevius.5ch.net/test/read.cgi/bgame/1566706590/87
88: 名無し名人 [] 2019/08/27(火) 16:13:03 ID:KcGblsp/ >>87 仮にレーティング1800の実力を持つ者がプロ入りして来た場合1500→1800になる為には差額の300点を全体から奪い取る事になるのでデフレになる 新人プロの実力は平均すると1500より上なのでこれがデフレ要因 最終的に彼らが平均して1500以下の実力になって棋士総人数が不変ならばデフレ要因はなくなりインフレ要因だけが残るが、実際には人数は増え続けているのでデフレ要因とインフレ要因のどちらが上回っているかわからない これ以上はスレチになるのでレーティングスレがあればそちらに行くよ http://mevius.5ch.net/test/read.cgi/bgame/1566706590/88
89: ◆f7OmZ9ucu2 [sage] 2019/08/27(火) 16:27:18 ID:Jzuv0Y1o >>82 現棋士に関しては勝率での補正も持ち時間での補正もやってない 持ち時間で3区分した一致率は出せる ?1時間以下 ?3時間以上6時間以下 ?8時間以上 の3つに分けることができる 64年大山の棋譜はNHK杯以外はすべて7時間以上の対局だった >>31に記したように3時間以上棋戦とNHK杯では一致率に差が生じている しかし、二日制対局と3時間以上の棋戦の比較では一致率の違いが持ち時間の差違によるものなのか対局者の平均レートの違いによるものかはわからないようだ そこで、二日制タイトル戦登場者に限定して?と?にわけて表を作成してみた ?のほうは勝率5割になるが、?のほうは勝率0.638なので?のほうが平均で一致率が2%少ないという数値になっているが、これはやむを得ない しかし、勝局の一致率はほとんど変わらず、敗局の一致率はむしろ?のほうが高い(1.3%) というわけで、まだ、二日制のデータが24局しかないため結論的なことは無理なんだが、二日制のほうが一致率が高くなるという傍証は見つかっていない ? https://i.imgur.com/xfdtV0F.png ? https://i.imgur.com/lmJRVDx.png http://mevius.5ch.net/test/read.cgi/bgame/1566706590/89
90: ◆f7OmZ9ucu2 [sage] 2019/08/27(火) 17:21:24 ID:Jzuv0Y1o >>86 平均悪手(点)を採用しての話をしている 山下氏の平均悪手(点)は検証できない しかし、山下氏は現棋士の平均悪手を調べてEloレートとの相関を調べたわけではない 将棋クラブ24の棋譜の平均悪手とEloレートが相関したと言っているだけ プロ棋士のレベルで平均悪手の相違が棋力にどう関連するかはまったく検証されていない 例えば、後半10手を除外しているが、プロ棋士の勝ち負けは最後の10手の良し悪しで決まることもある 大悪手なのか、形作りの手なのか、あるいは勝負手なのかの区別が付けられないという理由で評価値が10以上マイナスになる手を平均悪手の計算から除外しているが、これも疑問符がつく また、当時のソフトは一致率が50〜60%台で当てにならなかった 一致率が当てにならないようでは平均悪手も当てにならないはずだ それを、最後の10手は除外するとか、数値が大きいマイナス点は形作りや勝負手の場合もあるから除外するとか工作しても終盤力の差で勝敗が分かれるプロ棋士のレートを出すのは無理でしょ そもそも平均悪手は評価値の大小も増減もソフトによって、解析の深さによって全然違ってくる 一致率の誤差どころではない 一次関数に平均悪手を代入するだけでプロ棋士のレートがわかるなどということは絶対にない http://mevius.5ch.net/test/read.cgi/bgame/1566706590/90
91: ◆f7OmZ9ucu2 [sage] 2019/08/27(火) 18:03:22 ID:Jzuv0Y1o >>86 平均悪手を小さい順から並べてもEloレートの順のようにはならないというのは自分で解析してみての実感なんだな 俺は平均悪手でプロ棋士の棋力の推定が本当に可能なのか2017年から解析して2018年8月で打ち切った 徒労に終わったのは惨憺とした結果しか得られなかったからだ 画像の表で説明する このM値が平均悪手だが、算術平均でなく中央値を採用している 前半40手は除外したが後半10手は除外していない そのため、算術平均だと頓死などの棋譜が1局あるだけでその棋士の平均悪手のケタが違ってしまうため意味をなさない しかし、そうした棋譜を免除して平均悪手を採用することには疑問があった そこで、中央値を採用するのがベターという結論になった で、この表は2018年1月から8月までを集計したものだ データ局数にバラツキがあるのは全棋士対象でなくレート上位60位ぐらいの棋士までの棋譜の解析に限定していたためだ 何なら、2017年のデータとか通算のデータとかを出してもよいが、これだけで、平均悪手のダメさ加減は納得していただけるはず https://i.imgur.com/1g0EV1P.png https://i.imgur.com/p2lamxD.png http://mevius.5ch.net/test/read.cgi/bgame/1566706590/91
92: ◆f7OmZ9ucu2 [sage] 2019/08/27(火) 18:27:07 ID:Jzuv0Y1o >>88 インフレになるかデフレになるかわからないというのは、その通りで、それが1500点の質の違いなので、時代が違うと比較は難しいという結論になる そのいい例が大山五冠の頃のレートだろう 1964年度に1934点のレートを記録しているが、この当時の棋士のレートは10年前に64名いた棋士全員を1500点にしてスタートしている つまり、大山名人から升田らのA級棋士も1500点だったわけで、しかも毎年度対局数が40局程度しかない時代だった 当然デフレが生じていたはずだ また、棋士のレベルも現在の新四段のレベルは高いが、それはプロ棋士全体の100番目以下のプロ棋士集団と比較しての話だ 大山時代は日本で60番目に強いくらいでないとプロ棋士になれなかったわけだから単純な比較は不可能だろう http://mevius.5ch.net/test/read.cgi/bgame/1566706590/92
93: 名無し名人 [] 2019/08/28(水) 01:10:58 ID:s67rdTyy >>91 「中央値」って何? そもそも一定以上に評価が下がる手を入れると評価がおかしくなるから除外してるよね 同じ手法を取ってうまくいかないから「中央値」を採用してみたというのならわかる それをうまくいくかどうか全くわからない「中央値」を採用してうまくいかなかったからといって、なんでそれがそもそもやり方が違う山下論文方式の「平均悪手(点)」を否定する事になるの? 山下論文方式はソフトが今より弱かった時期でさえ少なくともレート2800点までの相関は調べており、ひふみんのデータを見る限りではそれ以上のレートでも機能していても全くおかしくない それをソフトも強くなってるのに試しもせずに否定する根拠は全くない http://mevius.5ch.net/test/read.cgi/bgame/1566706590/93
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 909 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.012s