ウイニングポスト9 2020 3周目 SP昇華箱庭でデータ採集・分析編 その4
2000年末まで進めました。
ここまでで生産頭数は133頭、すなわち133頭のデータサンプルが採れたことになります。
この頭数では機械学習による推測や統計解析などを行うのに十分なデータサンプル数とは言えないわけですが、とはいえ、一昔前なら個人的な趣味程度であれば、この規模のサンプル数であっても統計解析にかけていた時代があったのも事実です。
というわけで、現時点での各項目間の相関係数だけ出してみました。
プラスの相関を黄色、マイナスの相関を薄い青、無相関はそのままで色分けしてあります。
相関係数について簡単に説明しますと、一方の数値が上がる時に、もう一方の数値も上がるといった、正比例のような関係性が強いほど、数値が1に近くなります(正の相関)。
逆に一方の数値が上がる時に、もう一方の数値は下がるといった、反比例のような関係性が強いほど、数値が-1に近くなります(負の相関)。
また、相関係数が0という時には、互いの数値の変動が影響しあっていない、つまりまったく関係性がないデータ同士であると言えます(無相関)。
そして、相関係数の値の中で、どのくらいの数値をどのように見るかですが、このブログ記事では、相関係数が0.1以上~0.3未満までの値をとる時に弱い正の相関、0.3以上~0.6未満までの値をとる時に中程度の正の相関、0.6以上~1までの値をとる時に強い正の相関として定義したいと思います。
-0.99~0.99の値は無相関とします。
負の相関は正の相関の定義をひっくり返したもので、一応書きますと相関係数Xについて、-0.3<X≦-0.1が弱い負の相関、-0.6<X≦-0.3が中程度の負の相関、-1<X≦-0.6を強い負の相関、と定義します。
で、上記の画像の中で、中程度の正負の相関についてはボールド体で強調してあります。
ただ、上記の画像の表だけですと細かくて見にくいですので、産駒のSP、ST、サブパラ合計値の部分についてのみ抜き出して、別表にまとめました。
なお、サンプル数がまだまだ少ないですので、誤差を多分に含んでいる、すなわち相関係数の値が内実をしっかり表していない可能性があることを予めご了承いただきつつ、ご覧いただければと思います。
あくまで現時点での結果を踏まえての表と考察になります。
上記のまとめ表の内、中程度の相関となったものについては、フォントを大きくしてボールド体で示しています。
☆産駒のSP値について
まず産駒のSP値についてですが、弱い正の相関を示した項目がいくつかあって、そのどれもが0.2~0.3の間の値をとっていました。
つまり、産駒のSP値については、爆発力が一桁台から20くらいまでの値をとってきた現状までの配合からでは、爆発力、SP因子大活性、父母のSP値、父母の仔だし値などがほとんど同じくらいの影響力を以て決まっていると言えるでしょう。
今後、爆発力が30以上のサンプルが増えると、爆発力の相関係数が相対的に増加することが予見されます。
その他、SP因子数と母ST値に正の相関が出ていますw
SP因子数については配合時の父母の血統内にあるSP因子数を数えています。
これが多ければ、SP因子活性が起こりやすいですし、逆に他のST因子活性やサブパラ因子活性を相対的に阻害しますので、この正の相関は直接的な影響とは言いにくい気がします。
もう少しサンプル数が増えれば、SP因子数とSP因子活性の関係性をクリアに検討できるのではないかと考えています。
もう一つの母ST値と産駒SP値が相関していたら、これはもう本当に大発見ですが・・・w
流石に誤差だと思うんですけどねw
これもサンプル数が増えれば、はっきりするでしょう。
続いて、産駒のSP値と相関が無かったのが、ざっくりと父母の馬齢、サブパラ、気性、繁殖ボーナスでした。
これらはまぁ納得といったところなんですが、重要な点としては、後に見るようにサブパラに関していうと父母の馬齢も重要そうですが、サブパラに目を瞑るなら、高齢の繁殖馬であったもSP値だけなら期待できそうだというところでしょうか。
それから、繁殖ボーナスは私の過去の検証ではSP値にフタをするような役割をしていたという結果が出ており、これは今後の爆発力40以上のサンプルを大量に採る段階になった時にどういった変化が出るかに注目しています。
一桁から20くらいの爆発力の配合においては、SP値に関しては繁殖ボーナスを気にしなくて良さそうです。
そして、産駒のSP値と負の相関を示していたのが、SP因子活性無しとSP因子小活性です。
これはSP因子大活性との相対的な比較として捉えておくべきでしょう。
つまり、SP因子大活性とSP因子活性無しやSP因子小活性の間には、産駒のSP値の値についてかなりの差が出るということですね。
☆産駒のST値について
こちらはシンプルに父母のST値から強い影響を受けているようであり、プレイしている感覚とも合致します。
その他、何故か爆発力と正の相関が出ていたり、こちらはST値が高い産駒のサンプル数が少ないのもあって、誤差が大きいと思われます。
素直に父母のST値が高いと、産駒のST値が高くなる傾向があると捉えておくに留めるべきかと思います。
それから、SP因子数やSP因子活性の部分が特徴的で、これもプレイ感覚と合致するので、おそらく産駒ST値に関与していると捉えて良いと思います。
すなわち、配合時の血統内にSP因子数が多ければ、相対的にST因子数が減るため、SP因子数やSP因子大活性と負の相関が出ているものと思われます。
同様に、SP因子数が少なければ、相対的にST因子数が多い可能性も増すため、SP因子活性無しと正の相関が出ているものと思われます。
まぁこんなに仰々しく書かなくても、単純にST因子が活性化していれば産駒のST値も高くなるよね、という理解で良いと思います。
☆産駒のサブパラ合計値について
こちらについては、母のサブパラと仔だしが中程度の正の相関を示し、母の馬齢が中程度の負の相関を示しています。
これもプレイの感覚と非常に良く合致しますので、産駒のサブパラ合計値の傾向を的確に表していると思います。
つまり、産駒のサブパラには、母馬のサブパラと仔だし値が重要で、馬齢は若い方が良いということになりますね。
馬齢が若い方が良いというのは、馬齢が高くなると仔だし値が下がる傾向にあることが関係していると思います。
サンプル数が増えてきたら、馬齢と仔だし値の関係性についても検討してみたいと考えています。
その他、父のサブパラと仔だし値、父母の繁殖ボーナスも影響していると見て良さそうに思います。
面白いところでは、父母のSP値、それから母のST値が正の相関で影響していると出たところでしょうか。
多分、誤差だとは思いますが・・・w
SP因子活性の部分については、ST値と同様に、SP因子数が多くなるほど、サブパラ因子の数が相対的に減る傾向となり、サブパラ因子活性が阻害されますので、SP因子活性無しが正の相関、SP因子大活性が負の相関を示しているのも納得が行きます。
これと同様の考え方で、産駒のSP値と負の相関を示していることも説明できます。
産駒のSP値が高くなりやすい配合と言うのはSP因子大活性が起こっていることが多いですから、その配合にはSP因子数が多い可能性が高く、そうなると相対的にサブパラ因子が活性しにくい配合である可能性も高いですから、産駒のサブパラ値がそうでない配合よりも低く出やすいということですね。
これをプレイしている時の感覚で言い換えると、〆配合を完成させて、SP因子大活性も完備していたけれども、SP因子以外のサブパラ因子の活性が乏しいため、サブパラが揃いにくく、案外オンライン対戦などで勝てる馬が誕生しにくい、というようなものと捉えて良いと思います。
可能なら、当然ながら〆配合にも因子活性を沢山盛り込んだ方が良いということですね。
とはいえ、サブパラ因子よりも母のサブパラ、仔だし、馬齢の方が重要そうなので、そちらを意識した方が良いというのが個人的な感覚です。
というか、最終的には数撃ちゃ当(ry
ここまでが簡単なデータ分析編となります。
☆プレイ編
SP昇華箱庭構築中のプレイ現況です。
まず、確立を目指していたニホンピロウイナーですが、2000年末に引退。
結果、確立に失敗しました!!
いやー、シンジケート解散が無かったという予定外の事象に見舞われたとはいえ、確立失敗はいつぶりでしょうか。
もうあとほんの一押しだったのですが、上記画像の状態で確立ならずでした。
しょうがないので、すでに保険として確保してあるSP系統牝馬との間の牡馬を後継種牡馬として、系統確立をしていきます。
次に、ここまでで既存SP系統の後継種牡馬が続々スタッドインしていっていますので、ご紹介。
まずはオーエンテューダー系後継種牡馬。
自身の因子が気性難というのが厳しいですが、致し方ありません。
初年度で引退のフィリップオブスペイン(SP因子大活性確定)から良い産駒が出ず、ホスピタリティから後継種牡馬を狙っていましたが、ホスピタリティとの配合では中々SP因子活性が起こせず(SP因子活性無しの配合も今回のデータ採集に必要なので、その点においては活用できましたが)、どうにも後継の確保に手間取りました。
それもニホンピロウイナー確立失敗の一因ですね。
ただ、サブパラについては結構まとまっていますし(現役時の成長が凄かったのでまとまりました)、さらなる後継を着実に出してくれるとは思います。
続いて、テディ系の後継種牡馬。
こちらはハナからSP値については諦めて、高ST値のステイヤー狙いでした。
見事、超長距離タイプの牡馬が出てくれまして、海外長距離で無双してくれました。
サブパラもグングン伸びて、サブパラだけならほぼ完璧というところまで育ってくれました。
今後は後継をつなぎつつ、血統構築に活用していきます。
お次はニアークティック系後継種牡馬です。
この馬は初年度引退のノノアルコ産駒で、首尾よく一発回答を得られましたね。
能力も及第点ですし、SP因子持ちですし、仔だしも良さそうで、一気に確立させたいくらいの気分ですが、他に確立対象馬がひしめいているので、手が回らないかなーという感じですね。
このまま後継を確保しつつ、欧州〆の際の血統構築に活用していくことになりそうです。
最後はレイズアネイティヴ系の後継種牡馬。
カコイーシーズが爆発力を上げやすい血統構成なので、その通りにSP値が高い後継が得られました。
サブパラがやや微妙ですが、逆に稲妻配合が実施可能なパラメータになっています。
今後の後継確保にも困ることは無いでしょう。
その他、サクラユタカオーからプリンスリーギフト系の後継も現役馬に確保しており、既存SP系統の後継種牡馬確保については滞りなく完了できそうです。
それから、海外幼駒購入イベントもこの1996~2000年近辺がラッシュとなっております。
1998年にティズナウを購入。
1999年にはガリレオ。
2000年にはマインシャフトを購入しています。
現在、確立作業に入っているのが、ダンジグ系のラングフールとヌレイエフ系のパントレセレブル。
ここにさらに上記3頭が加わってきます。
ガリレオは放っておいても自然確立しますし、ティズナウも少しのアシストで確立できると思いますので、実質的にはラングフール、パントレセレブル、ちょっと年代が離れてマインシャフトの2頭ないし3頭同時確立という感じになります。
現状、ラングフールとパントレセレブルともに繁殖ボーナスも作用してか、産駒の仔だしが良い感じですので、確立自体には苦労は然程無さそうですが、とはいっても他の既存SP系統後継種牡馬の確立までは手が回らなさそうですね。
といったところが、現在までのプレイ状況となります。
あ、クラブ牧場は名前を「アナコンダ」にしましたw
「アナコンダ」の由来は、Python をインストールする際に便利なライブラリなどを一緒にインストールできるという、これまた便利なパッケージで Anaconda というものがあり、そこからですね。
とりあえず Python で統計や機械学習をするつもりなら、Anaconda にしておけば間違いないというヤツですね。
私はヘビつながりというのに最近気づきましたがw
そんなところで今回はここまで。
また次回!
ディスカッション
コメント一覧
高齢馬の当たり外れの激しさ、SP因子大活性と小活性とでは見た目以上に開きがある等々、体感としてはあったのですが
数字で表していただくと納得です。傾向を掴むだけでも生産に大いに役立ってくれそうですね。
系統確立に向けての種付けは、種牡馬AがダメでもBはアタリだったという場合もあるなか、ニホンピロウイナーの場合は選択肢がほぼないというのも難しいとこですねぇ……。
>おげっちさん
ありがとうございます。
普段の感覚的な理解を数字で表現し可視化してみると、改めて実感するというか、よりはっきりと理解が深まった感じがします。
ニホンピロウイナーはシンジケートさえ解散していれば・・・という感じでしたね。
あるいは、もうちょっと集中的に種付けしていれば、シンジケート解散無しでも確立できたかもしれませんね。
SP因子を2つ持つ種牡馬が出来たときテンション上がってましたがサブパラ枠を圧迫するという考え方も出来るんですね、納得。
母馬の年齢もスピードではなくサブパラに影響していたとは。
繁殖ボーナスもスピードではなくサブパラに影響なんですね。
ヒシアマゾンあたりが繁殖ボーナスで子だしが良くなるイメージといまいちリンクしないのが不思議ですが。
やはりデータを取ってそれを眺めてあれこれ考えるのは色々分かって楽しいですね。(作業してる方は大変ですがw)
>三日月さん
そうですね、とはいえ、基本的にはSP因子が多い方が強い馬が生まれやすいと思います。
母馬の馬齢は直接的には仔だしに影響しているのだろうと思います。
間接的にサブパラに影響が大きいですね。
ヒシアマゾンは私は使ったことないんですが、仮に繁殖ボーナス無しだとどうなるのだろうか・・・。