テン乗り勝負パターンの見極め方の著者竹内の競馬データブログ。競馬騎手のデータや指数等一歩進んだ馬券・競馬への取り組み方を競馬ファンにお届けします。

マイニングの変化

マイニングを使っている人や、研究をしている人とメールをしていると
今月はちょっと酷いという話が良く出ていました。

3月が昨日で終わったわけですが、先々週までの成績が以下です。

1位 回収率71%
2位 回収率65%
3位 回収率74%
4位 回収率48%
5位 回収率73%
6位 回収率98%
7位 回収率119%
8位 回収率122%
9位 回収率139%
10位 回収率139%
11位 回収率36%
12位 回収率115%
13位 回収率110%

確かに、これは1~2月を考えると反動でこうなったとも言えますが
それにしても偏りました。
何か分からないですが、マイニングを見てて「ん?」って時が
少し増えた気がします。

ということで、何か他の部分で偏ったことが起ってないか?
そう思って調べてみたことがあります。

マイニング1位になるのは1~3番人気が多いですから
マイニング1位で1~3番人気になった騎手とその総数を見てみました。

横山騎手が1~3人気 36回 内マイニング1位17回
武豊騎手が1~3人気 43回 内マイニング1位14回
内田騎手が1~3人気 42回 内マイニング1位14回

ここは普通だと思いますが、横山騎手の1位率は高いように思います。
しかもマイニング1位だと勝率52.9%。

藤田騎手が1~3人気 22回 内マイニング1位3回
四位騎手が1~3人気 15回 内マイニング1位1回
松岡騎手が1~3人気 16回 内マイニング1位0回
柴田騎手が1~3人気 10回 内マイニング1位2回
三浦騎手が1~3人気 19回 内マイニング1位3回
後藤騎手が1~3人気 19回 内マイニング1位4回
中舘騎手が1~3人気 19回 内マイニング1位6回


人気の信頼度が高めな騎手にマイニングが1位評価をしてないケースが
結構何人もこういう騎手がいました。
そこで見ていると、こういう騎手はマイニングが上手くいってない
上手い評価をできてない?ということになるのでしょうか
マイニング1位じゃない方が回収率がかなり高く、マイニング1位だと
全然成績を残していませんでした。
普通に考えると、マイニングが1位を付けてあげない(笑)なら
それが1位評価するときは余程信頼できるのか?という見方が正しいと思うのですが
逆の成績になっているということが出ているようです。

去年全体で見ると、上に上げた騎手は大体該当条件の3割ぐらいは
1位がついてるんですよねぇ。


と、ここまで書いてJRAVANのサイトを見たら
見逃している記述がありました、自己嫌悪になりそうです(苦笑)

・2009年1月から上記に2歳戦・3歳戦に限定した予測モデルを追加

ほうほうほう、ということでこの3歳条件を見てみたら
今月、マイニング5・6・7・8・10・12位が
全部+回収、今月全体で高い順位ともかなり被ってました。

2歳戦がない時期なので、今年の3歳戦と
昨年の3歳戦を比較して見ると、かなり違いが?


まず去年のマイニング1位、勝率24.6% 回収73%
今年のマイニング1位、勝率27.5% 回収88%

去年のマイニング2位、勝率16.6% 回収89%
今年のマイニング2位、勝率14.0% 回収68%

去年のマイニング3位、勝率10.5% 回収71%
今年のマイニング3位、勝率13.0% 回収82%


去年まで低かった1位と3位が上がり、2位が落ちてます。
1位んはかなり優秀に思います。

これを1番人気限定とすると
去年の1位 勝率38.9% 回収78%
今年の1位 勝率46.1% 回収87%

去年の同じ期間と比較した場合、今年の1位勝率8%増しです。

どのような変化があったのかは分かりませんが
1位の信頼度が上がり、2位が下がり、3位が上がっている。
1位に関しては大幅に信頼度が増しているということになります。

1位1番人気 今年
重賞   4-2-0-1/7 勝率57% 回収88% 
牝馬限定 15-6-2-5/28 勝率54% 回収106%
500万下 12-1-0-6/19 勝率63% 回収126%


これはかなり変わったと言えると思います。
これからクラシックのシーズンに入っていくわけですが
どこまで影響してくるのか?ということは考えた方が良いでしょう。

そうかと思えば、先週はこの条件が良くなかったと思うので
良すぎたのが下がっていくということになるのか
それとも一時的なことだったのか、この判断が難しいので
これはマイニング使う人は注意して観察した方がいいですね。


変更点を見て気になるのはこれ

競走馬の過去走実績データの削減

・現運用モデルでは、同距離での成績や重賞での成績などの過去成績のデータを予測に使用していましたが
2歳馬、3歳馬の場合、これらのデータが欠損となることが多いため予測に使用するデータから削除しました。

2歳3歳戦に関しては、同距離の成績と重賞成績が「削除された」と書いてあります。
ですが、私としてはキャリアが少ない年齢だからこそ
経験が物を言うレースというのが多いと思うんですね。

じゃあ、マイニング1位で1番人気に対して
「前走同距離」という項目を加えたらどうなるか?
これが今年の勝率50%まで上がります、全体で46%はす。

次ぎに怖いのが「同距離での成績や重賞成績などの過去成績」
この「など」に他の物も含まれているのかどうか?
前走成績とかは含まないのか?
含んで無いのなら、前走2着なら?とかを付け加えたらどうか。
勝率60%、回収103%まであがりました。

距離実績は書いてあるので正しいわけでしょうから
これは今後の2歳戦と3歳戦は、自分でそれを考える必要がありそうです。

特に「2歳3歳戦では、データが欠損になることが多いので」
と書いてあるわけですが、殆どの馬が距離経験がある場合もありますよね。
また、人気馬が初のマイル戦、マイニング1位なんて時は
マイニングの信頼度が落ちてくるかもしれません。
先ほどの条件で、今回延長の馬だと勝率38.5%まで下がります。

3歳G1が特にですが、重賞成績無視ってのはどうなんでしょうね?
同距離無視ということは、桜花賞でマイル実績のある馬は
その部分は無視して、予想を立てるということでしょうからねぇ。

その他の指数と合わせても信頼度かなり上がります。
まず先ほどの条件に対して、gallop指数1位の0馬なんて
勝率62.8% 回収102% 複勝率93% 複回収103%
ダートなら勝率70%近くまで上がります(笑)
頭数も3ヶ月で43頭、3頭だけ馬券にならなかっただけ。
これ以上細かくしても意味無いですが、前走上がり1位だったら
12戦全連対、軸馬として固定して、相手探しに集中して
勝負するには最適な馬となるように思います。


でも全然気がつきませんでした、マイニングの説明ページを
毎月確認することもありませんからねぇ。
1月に気がつくべきでした、2月も馬券率100%でしたし
マイニング2位が弱くなった傾向があるので
3連単で3~8位まで30点流しても回収137%。

これが夏場にも通用してくるのなら、夏競馬も楽しくなりそうですけどね。


TOPPAGE  TOP 
RSS2.0