最新ソフトで棋士の指し手一致率を調査した結果 2

[過去ﾛｸﾞ] 最新ソフトで棋士の指し手一致率を調査した結果 2 (1002ﾚｽ)
上下前次 1-新

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

90: ◆f7OmZ9ucu2 2019/08/27(火)17:21 ID:Jzuv0Y1o(10/12) AAS
>>86
平均悪手(点)を採用しての話をしている
山下氏の平均悪手(点)は検証できない
しかし、山下氏は現棋士の平均悪手を調べてEloレートとの相関を調べたわけではない
将棋クラブ24の棋譜の平均悪手とEloレートが相関したと言っているだけ
プロ棋士のレベルで平均悪手の相違が棋力にどう関連するかはまったく検証されていない
例えば、後半10手を除外しているが、プロ棋士の勝ち負けは最後の10手の良し悪しで決まることもある
大悪手なのか、形作りの手なのか、あるいは勝負手なのかの区別が付けられないという理由で評価値が10以上マイナスになる手を平均悪手の計算から除外しているが、これも疑問符がつく
また、当時のソフトは一致率が50〜60%台で当てにならなかった
一致率が当てにならないようでは平均悪手も当てにならないはずだ
省4

91(2): ◆f7OmZ9ucu2 2019/08/27(火)18:03 ID:Jzuv0Y1o(11/12) AAS
>>86
平均悪手を小さい順から並べてもEloレートの順のようにはならないというのは自分で解析してみての実感なんだな
俺は平均悪手でプロ棋士の棋力の推定が本当に可能なのか2017年から解析して2018年8月で打ち切った
徒労に終わったのは惨憺とした結果しか得られなかったからだ

画像の表で説明する
このM値が平均悪手だが、算術平均でなく中央値を採用している
前半40手は除外したが後半10手は除外していない
そのため、算術平均だと頓死などの棋譜が1局あるだけでその棋士の平均悪手のケタが違ってしまうため意味をなさない
しかし、そうした棋譜を免除して平均悪手を採用することには疑問があった
そこで、中央値を採用するのがベターという結論になった
省5

92: ◆f7OmZ9ucu2 2019/08/27(火)18:27 ID:Jzuv0Y1o(12/12) AAS
>>88
インフレになるかデフレになるかわからないというのは、その通りで、それが1500点の質の違いなので、時代が違うと比較は難しいという結論になる
そのいい例が大山五冠の頃のレートだろう
1964年度に1934点のレートを記録しているが、この当時の棋士のレートは10年前に64名いた棋士全員を1500点にしてスタートしている
つまり、大山名人から升田らのA級棋士も1500点だったわけで、しかも毎年度対局数が40局程度しかない時代だった
当然デフレが生じていたはずだ
また、棋士のレベルも現在の新四段のレベルは高いが、それはプロ棋士全体の100番目以下のプロ棋士集団と比較しての話だ
大山時代は日本で60番目に強いくらいでないとプロ棋士になれなかったわけだから単純な比較は不可能だろう

93(4): 2019/08/28(水)01:10 ID:s67rdTyy(1) AAS
>>91
「中央値」って何？
そもそも一定以上に評価が下がる手を入れると評価がおかしくなるから除外してるよね
同じ手法を取ってうまくいかないから「中央値」を採用してみたというのならわかる
それをうまくいくかどうか全くわからない「中央値」を採用してうまくいかなかったからといって、なんでそれがそもそもやり方が違う山下論文方式の「平均悪手(点)」を否定する事になるの？

山下論文方式はソフトが今より弱かった時期でさえ少なくともレート2800点までの相関は調べており、ひふみんのデータを見る限りではそれ以上のレートでも機能していても全くおかしくない
それをソフトも強くなってるのに試しもせずに否定する根拠は全くない

94(3): ◆f7OmZ9ucu2 2019/08/28(水)06:48 ID:BvtGCFO3(1/10) AAS
>>93
除外していないよ
某棋士の解析が5棋譜あって平均悪手が小さい順にこうなったとする
20　30　50　60　200
平均値は360/5=72
中央値は50
さきのデータでいうと50なら26番目だが、72なら56番目だ
順位が30も違う
平均悪手が200の棋譜は大悪手で負けた棋譜だ
想像つくと思うが、中央値でなく平均値を採用すると中央値を採用する以上に強さのランキングとは言えないものになる
省15

95(2): 2019/08/28(水)07:52 ID:DG+DQT+D(1/2) AAS
>>77
> Eloレーティングを近似できることが証明されれば
「証明」は実は不可能で、「ある程度までに精度を高めることができれば」というのが限界では？

> 過去の棋士も近似できる
「レーティング近似値として十分に役に立つレベルの値が得られる」という意味になりそうな気がするが
しかし過去の棋士のレーティングがそもそも何の役に立つか？という気がしてならない…

96: ◆f7OmZ9ucu2 2019/08/28(水)07:57 ID:BvtGCFO3(2/10) AAS
>>95
>>93と同じ人？
だったら、>>94で納得できたか返事してくれないかな
違ってたらごめんよ
あと、この自問自答には何と返せばいいの？

97(1): 2019/08/28(水)08:10 ID:DG+DQT+D(2/2) AAS
たとえば、上位グループとほとんど没交渉な下位グループというのを考えてみると良い

果たして上位グループから得られた知見をもってして
下位グループのレーティングを高精度に近似できるか？
それなりの労力で実際に確認できるはずなのでやってみるのも一考

だがしかし、仮にそれが上手く行った場合でさえも、言えることは
「既知のグループメンバーと特異的に変わらない指し手の新規メンバーについては
高精度な近似ができる」というのが限界のはず

何故なら、極端な例を持ち出すと、途中までは全ての指し手をソフトを使用して選ぶが
最後の１手で必ず大悪手を指して負けるといったような者がいた場合
その者のレーティングを正しく近似することは、ほぼ間違いなく上手く行かないはずであり
省2

98(1): ◆f7OmZ9ucu2 2019/08/28(水)08:48 ID:BvtGCFO3(3/10) AAS
>>97
全棋士の一致率を調べているのは
>>72に書いたようにまさにそれが理由だよ
常に途中まで完璧に指すことができているのに一手ばったりの悪手が多くて勝率5割しかない棋士がいたら、彼の一致率は勝局も敗局も85%となり全局平均の一致率85%、あるいは勝局はもっとよければ全局平均86%もありうる
したがって一致率が高い棋士が史上最強ではないことになる
実際は仮定と現実は違って、そうした実例は確認されていないばかりか、レート下位棋士のデータ群ほど一致率が低いことが確認されている
それはそれとして、何でコジツケのような疑問しか提示されないのか、なぜ一致率と棋力の相関の高さに否定的になろうとするのか解せないな

99: ◆f7OmZ9ucu2 2019/08/28(水)11:16 ID:BvtGCFO3(4/10) AAS
レート区分及びクラス区分の最新集計表を作ってみた
100区分のレートにすると、Eloレートと換算レートばかりでなく、Eloレートと一致率単独の相関係数も驚異の0.99となった
一致率と棋力が比例関係にあるばかりでなく、データ数を増やしていけば一致率だけでも有力であることを示している

下表のクラス別の集計表を見るとC2が特徴的で、換算レートでも一致率でもC2はB2と同等のようだ
これは、今のC2にB2棋士と同等以上の棋力がある棋士が多いと解釈できる
２期前まではC1がそんなクラスだった
いずれにしても、B2以下の棋士は玉石混交でほとんど差がないことがこの表からわかる
そして、B1以上の棋士との間には実力の壁があることも明らかだ

将棋ファンならこうした資料は大歓迎なはずなんだが、なぜかケチつけようとするレスが必ずある
そういう人は、どういう利害で発言しているのかも表明してほしいね
省1

100(4): 2019/08/28(水)11:37 ID:5wNc5iok(1) AAS
>>89
「３つに分けることができる」が不可解というか、そらわけることはできるだろうけど根拠がないなあ
データを沢山積み上げて、本当に3時間と6時間には微少な差しかないんだと立証できれば凄いことだと思うけど

101: 2019/08/28(水)12:39 ID:TueVNZ3b(1) AAS
>>100
3つに分けたデータを出すことができる（作成済みだから）って意味じゃないの？

102: ◆f7OmZ9ucu2 2019/08/28(水)13:10 ID:BvtGCFO3(5/10) AAS
>>100
棋戦データに標識をつけて三区分でデータベース化しているということ
だから三区分でのデータは簡単に取り出せるという意味だよ
区分の仕方が問題だと思うならどういう区分がよいのか意見してみよう
それと、個々の棋士を分析するときに細分化したデータは役に立たないと思ったほうがいい
現状では、1時間以下の早指しと3時間以上の棋戦の二つぐらいで十分だろう
全棋士レベルでの分析ならNHK杯だけとか、朝日杯だけとか、その両方とか、種々の分析はいつでもできるよ

103: ◆f7OmZ9ucu2 2019/08/28(水)13:24 ID:BvtGCFO3(6/10) AAS
王将戦は予選が3時間でリーグ戦が4時間だが、残念ながらデータベース上で区別していない
3時間で取り出せるのは新人王戦と叡王戦本戦だけになる
棋王戦は4時間の棋戦のデータとして使える
王座戦と竜王戦は5時間棋戦、順位戦は6時間棋戦のデータとして使える
どれだけのデータ数が集計できるかわからないが、今日は1日暇なのでやってみよう

104: ◆f7OmZ9ucu2 2019/08/28(水)14:44 ID:BvtGCFO3(7/10) AAS
>>100
棋戦別の一致率を出してみた
棋戦ごとにレート平均が異なるので比較は難しいが、持ち時間が長くなると一致率が高くなる傾向は出ていない
レート平均があまり違わない新人王戦、棋王戦、竜王戦で見ても違いは見てとれない

二日制の対局の一致率が高いのは
>>89で比較したように棋士の棋力が高いのが理由で、この5棋士は一日制の対局でも似たような数値だった

以上のように3時間と6時間といった持ち時間の違いで一致率が異なるという傾向は見られなかった
「微妙な差しかないのを立証する」のが統計学でなく、
有意差がなければ、両者に違いはないと見なすのが統計を扱う基本だ
そうした基本に戻って意見してくれ
省2

105: ◆f7OmZ9ucu2 2019/08/28(水)20:31 ID:BvtGCFO3(8/10) AAS
NHK杯と朝日杯を追加
画像ﾘﾝｸ[png]:i.imgur.com

106(1): ◆f7OmZ9ucu2 2019/08/28(水)21:45 ID:BvtGCFO3(9/10) AAS
>>93
>>94で約束したように平均悪手を平均値の小さい棋士の順に並べた表を作ってみた
前回同様2018年1月〜8月までの集計だ
平均値が高い2枚目を見るといい
羽生28局の平均が74.8(中央値44.4)だ
豊島39局83.8(56.0)
深浦18局91.8(75.2)
久保18局96.8(60.1)
近藤14局97.7(37.5)
増田18局103.4(63.6)
省5

107: ◆f7OmZ9ucu2 2019/08/28(水)22:01 ID:BvtGCFO3(10/10) AAS
局数が抜けていた
画像ﾘﾝｸ[png]:i.imgur.com
画像ﾘﾝｸ[png]:i.imgur.com

108(3): 2019/08/29(木)01:39 ID:v1Fmy0BZ(1) AAS
>>94
山下論文方式も「中央値」もどちらも一長一短
なのでどちらの判別力が優れているかをデータなしに机上で力説しても全く無意味
山下論文方式は一定の判別力ありとなっているので仮に中央値方式がダメであれば山下論文方式を試せばいいだけ
実際に2つのデータを並べて判別力を比較分析すればわかる話

あと>>106でなんで「無理」という結論付けているのか全くわからない
中央値方式は判別力が低い可能性はあるが、あまりにも対局サンプルが少なすぎる棋士が大半
対局数が少ないためまだ敗戦データがほとんど含まれていない棋士があれば当然上位になってしまうことが予想される
恐らく一致率データもこれくらいの局数で対戦相手を勘案せずに個々人レベルで見るとこんな感じでは？

109(1): 2019/08/29(木)03:27 ID:h22jIbzZ(1) AAS
彼が欲しているのは承認だけだからな

上下前次 1-新書関写板覧索設栞歴

あと 893 ﾚｽあります
ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.165s*