[過去ログ] 最新ソフトで棋士の指し手一致率を調査した結果 2 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
74
(1): 2019/08/27(火)10:44 ID:xcsSd39h(1/2) AAS
使用するソフトの前提条件は?
ハム将棋じゃ、どうやっても相関は得られそうにない?
実は強くもないソフトの真似をしてるだけという可能性は如何にして排除すんの?
75
(1): 2019/08/27(火)10:46 ID:xcsSd39h(2/2) AAS
ソフトの棋譜を分析した場合に、勝率互角の2系統のソフトについて
自分と同系統のソフトを異常なまでに高く評価するんじゃないの?
76
(1): ◆f7OmZ9ucu2 2019/08/27(火)11:04 ID:Jzuv0Y1o(4/12) AAS
>>50
一致率が強さの指標に有効かは、まず、現棋士のランキング(Eloレーティング)が一致率でも近似できることを証明しなければならない
山下氏はこうしたことをやっていないし、平均悪手が少ない順に並べてもEloレーティングのようには並ばない
というわけで、前スレに書いた通り2chスレ:bgame
なお、前スレは1000まで書き込まずに放置しておけば暫く閲覧可能なはず
77
(1): ◆f7OmZ9ucu2 2019/08/27(火)11:24 ID:Jzuv0Y1o(5/12) AAS
>>75
どのソフトでもかまわないが、そのソフトで解析した現棋士の一致率で現棋士のEloレーティングを近似できることが証明されれば、過去の棋士も近似できるということになるはず
あくまでも、そのソフト限定での話なので、そのソフトのクセは問題にならない
近似力が高いソフトほど良いソフトという違いがあるだけだね
78
(2): 2019/08/27(火)11:53 ID:X4FAyrfF(1) AAS
illqha4が出ててめちゃくちゃ強いらしいけど解析は今後もillqha3なんですか?
79: ◆f7OmZ9ucu2 2019/08/27(火)12:03 ID:Jzuv0Y1o(6/12) AAS
>>78
途中で変えるわけにはいかないので、全部やり直しするのが大変なんだよな
illqha3での結果が納得できなければ変えていただろうけど、たしか、illqha4はレートで50ほどしか違わないよね
つまり、プロ棋士とのレベル差で見るとほとんど無視できる差なんじゃないかな
追検証したい人は最新のソフトを使うのもありだし、より深い探索で解析するのもありだね
その結果、現役棋士最強は渡辺でも豊島でもなかったということになったらそのソフトは捨てたほうがいいね
80
(1): ◆f7OmZ9ucu2 2019/08/27(火)12:10 ID:Jzuv0Y1o(7/12) AAS
Eloレーティングに対する私見

現棋士に関してはEloレーティングがあるからそれで十分で、Eloレーティングがあるからこそ他の指標の検証もできる
しかし、Eloレートは過去との連続性に難点があると言われている
とくにインフレが問題らしい
棋士の数が増えるのもインフレの要因になるが、数が同数でも増えるほうは1500点、減るほうは成績低下や高齢での引退なので1300点、1200点と点数を減らしてやめていく
これがインフレの元になっている
最近は勝率すらインフレを起こしていると言われている(特に下位クラスの実力のバラツキが甚だしい)
つまり、相手の絶対レベルが違うとしたら、基準となる1500点の質が時代によって違う可能性が高い
というわけでEloレートの代用になる指標があればいいのにということになった
81
(3): ◆f7OmZ9ucu2 2019/08/27(火)12:12 ID:Jzuv0Y1o(8/12) AAS
一致率を調べる意義
もし、一致率が棋力判定に使えるなら利点が多い
(1)一致率なら最強時代が異なる棋士でも比較できる
(2)新人棋士のレーティングが信頼できるものになるには100局必要とされるが、一致率ならその半分以下で十分だ★
(3)レーティングでは、研究が嵌まってたまたま一時的に高くなっているのか、地力の違いで高くなっているのかが分からない
(4)一致率なら、研究から離れた局面でどれだけ最善手を指せるか、疑問手や悪手率が少ないかの指標となるので、棋士の地力が評価できる
(5)一致率なら、先後や手数の違い、勝局時、敗局時の一致率など細かい分析ができる
(6)レーティングより少ない局数で評価できるから、線型や持ち時間の長さなどで分類して分析することも可能だ

★前半40手除外しても平均1局110手だから70手ある
レーティングは勝ちか負けかの1対のデータなのに対して、一致率の場合は一致したか一致しなかったかで1局1棋士に35個のデータがある
省1
82
(3): 2019/08/27(火)14:43 ID:GTrCiXsb(1) AAS
持ち時間のばらつきをどう補正しているかを知りたい
レートなら勝ち負けしかないからサンプル数重視で無視するという考え方もわかるけど、
一致率は持ち時間が長いほど有利なわけだからなにがしかの補正をしてるんだよね。

64年の大山は防衛戦と王座戦、NHK杯しかなくて当時は二日制は10時間だったから
対局の半分は10時間の将棋だったんじゃないの
83: 2019/08/27(火)15:09 ID:KcGblsp/(2/5) AAS
>>81
一致率の最大の欠点は対戦相手の強さによって大きく変わって来てしまう事
なので時代が違うと対戦相手の平均レベルがわからないので比較ができない

Eloレーティングは初期値を1500等で仮置きすると適正なレートに落ち着くまで時間がかかるが、WHRを使えばその問題は解消される
単純に>>46の式を使っても凡その強さはわかる
一致率を調べるまでもなく圧倒的に簡単に算定できる上に精度もどちらが上かわからない
84
(1): 2019/08/27(火)15:13 ID:XkW0xNQj(1) AAS
>>81
あ、持ち時間で分類もできるとしているのか。
でも昔は10時間とか7時間が多いから面倒だな
85
(1): 2019/08/27(火)15:26 ID:KcGblsp/(3/5) AAS
>>80
レーティングは時代が異なると完全には同一視できなくなる可能性という問題点があるが、実際にどこまでズレるかはわからない
山下論文のP11の図3、図4を見ると一見インフレしているように見えるが谷川・加藤の推移を見るとそんな事はなく実際に上位棋士のレベルが上昇した可能性が高そう
(仮に200近くインフレしていたら現在の谷川が昔の新人で全く伸びなかったプロレベル、引退前の加藤は街のアマチュアレベルという事になってしまう)
file:///C:/Users/%E6%B5%85%E4%BA%95/Downloads/IPSJ-GPWS2014002%20(2).pdf

なおレーティングがインフレになるというのは誤った俗説で、新規にプロ入りするレベルははどうか、全体の人数の増減はどうかによってインフレになる場合もデフレになる場合もある
実際に自分でモデルを作って検証すればわかる
また戦術の進化等による全体のレベル向上があればそもそもインフレしているのが正しい
86
(2): 2019/08/27(火)15:54 ID:KcGblsp/(4/5) AAS
>>76
平均悪手が少ない順に並べてもレーティングのように並ばないというのはどこにある情報?
あと「平均悪手」という単語は「平均悪手率」なのか山下論文で使っている「平均悪手点」の意味なのかどちら?
「平均悪手点」の意味であれば山下論文の図11で少なくともレート2700〜2800程度までは相関してる事を示している
レートがそれ以上の場合の「並ぶか」という厳密な検証はなされていないが、少なくとも表20を見ると「並ばない」結果にはなっていない
87
(2): 2019/08/27(火)15:56 ID:w6T9Ob4v(1) AAS
>>85
将棋の場合はインフレするよ
新四段の若手は大抵平均レベルよりも強く引退してくベテランは平均レベルよりも弱いから
88
(1): 2019/08/27(火)16:13 ID:KcGblsp/(5/5) AAS
>>87
仮にレーティング1800の実力を持つ者がプロ入りして来た場合1500→1800になる為には差額の300点を全体から奪い取る事になるのでデフレになる
新人プロの実力は平均すると1500より上なのでこれがデフレ要因
最終的に彼らが平均して1500以下の実力になって棋士総人数が不変ならばデフレ要因はなくなりインフレ要因だけが残るが、実際には人数は増え続けているのでデフレ要因とインフレ要因のどちらが上回っているかわからない

これ以上はスレチになるのでレーティングスレがあればそちらに行くよ
89
(2): ◆f7OmZ9ucu2 2019/08/27(火)16:27 ID:Jzuv0Y1o(9/12) AAS
>>82
現棋士に関しては勝率での補正も持ち時間での補正もやってない
持ち時間で3区分した一致率は出せる
?1時間以下
?3時間以上6時間以下
?8時間以上
の3つに分けることができる
64年大山の棋譜はNHK杯以外はすべて7時間以上の対局だった

>>31に記したように3時間以上棋戦とNHK杯では一致率に差が生じている
しかし、二日制対局と3時間以上の棋戦の比較では一致率の違いが持ち時間の差違によるものなのか対局者の平均レートの違いによるものかはわからないようだ
省8
90: ◆f7OmZ9ucu2 2019/08/27(火)17:21 ID:Jzuv0Y1o(10/12) AAS
>>86
平均悪手(点)を採用しての話をしている
山下氏の平均悪手(点)は検証できない
しかし、山下氏は現棋士の平均悪手を調べてEloレートとの相関を調べたわけではない
将棋クラブ24の棋譜の平均悪手とEloレートが相関したと言っているだけ
プロ棋士のレベルで平均悪手の相違が棋力にどう関連するかはまったく検証されていない
例えば、後半10手を除外しているが、プロ棋士の勝ち負けは最後の10手の良し悪しで決まることもある
大悪手なのか、形作りの手なのか、あるいは勝負手なのかの区別が付けられないという理由で評価値が10以上マイナスになる手を平均悪手の計算から除外しているが、これも疑問符がつく
また、当時のソフトは一致率が50〜60%台で当てにならなかった
一致率が当てにならないようでは平均悪手も当てにならないはずだ
省4
91
(2): ◆f7OmZ9ucu2 2019/08/27(火)18:03 ID:Jzuv0Y1o(11/12) AAS
>>86
平均悪手を小さい順から並べてもEloレートの順のようにはならないというのは自分で解析してみての実感なんだな
俺は平均悪手でプロ棋士の棋力の推定が本当に可能なのか2017年から解析して2018年8月で打ち切った
徒労に終わったのは惨憺とした結果しか得られなかったからだ

画像の表で説明する
このM値が平均悪手だが、算術平均でなく中央値を採用している
前半40手は除外したが後半10手は除外していない
そのため、算術平均だと頓死などの棋譜が1局あるだけでその棋士の平均悪手のケタが違ってしまうため意味をなさない
しかし、そうした棋譜を免除して平均悪手を採用することには疑問があった
そこで、中央値を採用するのがベターという結論になった
省5
92: ◆f7OmZ9ucu2 2019/08/27(火)18:27 ID:Jzuv0Y1o(12/12) AAS
>>88
インフレになるかデフレになるかわからないというのは、その通りで、それが1500点の質の違いなので、時代が違うと比較は難しいという結論になる
そのいい例が大山五冠の頃のレートだろう
1964年度に1934点のレートを記録しているが、この当時の棋士のレートは10年前に64名いた棋士全員を1500点にしてスタートしている
つまり、大山名人から升田らのA級棋士も1500点だったわけで、しかも毎年度対局数が40局程度しかない時代だった
当然デフレが生じていたはずだ
また、棋士のレベルも現在の新四段のレベルは高いが、それはプロ棋士全体の100番目以下のプロ棋士集団と比較しての話だ
大山時代は日本で60番目に強いくらいでないとプロ棋士になれなかったわけだから単純な比較は不可能だろう
93
(4): 2019/08/28(水)01:10 ID:s67rdTyy(1) AAS
>>91
「中央値」って何?
そもそも一定以上に評価が下がる手を入れると評価がおかしくなるから除外してるよね
同じ手法を取ってうまくいかないから「中央値」を採用してみたというのならわかる
それをうまくいくかどうか全くわからない「中央値」を採用してうまくいかなかったからといって、なんでそれがそもそもやり方が違う山下論文方式の「平均悪手(点)」を否定する事になるの?

山下論文方式はソフトが今より弱かった時期でさえ少なくともレート2800点までの相関は調べており、ひふみんのデータを見る限りではそれ以上のレートでも機能していても全くおかしくない
それをソフトも強くなってるのに試しもせずに否定する根拠は全くない
1-
あと 909 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.136s*