続・競馬であそぶ 2

 美味いものも食えるうちが華




9. 2005年のデータ

☆足切り☆
レース検討のとき最初に、対象外として外せる馬が分かればかなり楽になる。

人によって、いろいろな方法があるようだが例えば「過去3走の着順を足して評価」
はどうか?
合計が30を超えるものを(前回着順を参照しながら)基準にするこの方法は、
着率も回収率も標準よりは 10%以上悪い馬を除くことができる。
だが結論から言うとダメ。検証してみるとかなり低レベルな意味のない足切りだ。

ダ@  77A 101B  90全 4146:単  1.9 連  4.3 複  6.5|単 63.1 複 54.3x 2616.1(19.9@ 34.0)
続@  15A  24B  22全 1173:単  1.3 連  3.3 複  5.2|単 38.7 複 39.0X  454.0(19.9@ 30.3) 75.3
※@  62A  77B  68全 2973:単  2.1 連  4.7 複  7.0|単 72.7 複 60.3x 2162.1(19.7@ 34.9)264.8

芝@ 63A 82B 113全 3870:単 1.6 連 3.7 複 6.7|単 52.3 複 68.0: 2023.8(17.9@ 32.1) 続@ 16A 23B 30全 1035:単 1.5 連 3.8 複 6.7|単 48.8 複 68.0: 505.0( 8.9@ 31.6)160.8 ※@ 47A 59B 83全 2835:単 1.7 連 3.7 複 6.7|単 53.6 複 68.1: 1518.8(18.8@ 32.3)145.0
ダートの方はマァマァにしても芝の方は使いづらい。着率も案外大きく不満

一番簡単で一般的なのは、目安を決めて何番人気以下は買わないというやりかた。
上の方法より断然優れている。
同レベルの足切りとして使うなら段違いの効率になる。


ダートでの単なる10人気以下
ダ@  72A 143B 196全10639:単  0.7 連  2.0 複  3.9|単 53.9 複 58.1x 5734.6(68.3@ 79.6)
続@  26A  56B  56全 3579:単  0.7 連  2.3 複  3.9|単 54.0 複 50.1x 1932.9(54.9@ 74.3)209.8
※@  46A  87B 140全 7060:単  0.7 連  1.9 複  3.9|単 53.8 複 62.1x 3801.7(72.5@ 82.6)264.8
単なる12番人気以下
ダ@  24A  49B  80全 6636:単  0.4 連  1.1 複  2.3|単 37.2 複 46.7X 2469.7(88.6@102.9)
続@  10A  18B  19全 2188:単  0.5 連  1.3 複  2.1|単 37.9 複 36.5X  829.3(68.3@ 82.9)164.0
※@  14A  31B  61全 4448:単  0.3 連  1.0 複  2.4|単 36.9 複 51.7x 1640.4(105.5@117.2)264.8

芝での単なる10人気以下 芝@ 73A 140B 206全10174:単 0.7 連 2.1 複 4.1|単 44.4 複 61.4x 4519.0(51.1@ 61.9) 続@ 23A 42B 70全 3298:単 0.7 連 2.0 複 4.1|単 47.3 複 60.1x 1558.9(58.1@ 67.8)160.8 ※@ 50A 98B 136全 6876:単 0.7 連 2.2 複 4.1|単 43.0 複 62.0x 2960.1(49.7@ 59.2)169.0 単なる12人気以下 芝@ 34A 74B 99全 6756:単 0.5 連 1.6 複 3.1|単 41.0 複 59.3x 2770.5(75.8@ 81.5) 続@ 11A 23B 27全 2137:単 0.5 連 1.6 複 2.9|単 43.3 複 55.1x 925.4(75.8@ 84.1)160.8 ※@ 23A 51B 72全 4619:単 0.5 連 1.6 複 3.2|単 39.9 複 61.2x 1845.1(81.2@ 80.2)169.0
しかし、タクサン足切りすればいいというものでもないし、切ったところでゼッタイ
来ないというわけのものでもない。

sSeia の基準は、外せる頭数が 25〜30%、その部分での回収率は 55%以下。
この辺の基準は、人気順(またはオッズ)と他の要素を組み合わせることで簡単に
クリアできる筈。

いまのところ指数を他の要素として使っているが、もっといい方法もあるだろう。
誰でも少し考えれば分かることだと思う。


話は変るが、いま悩んでいるのが、ココ一年半のダートのデータ。

(障害や新馬・未勝利の一部は除く)
ダ@2124A2124B2119全29712:単  7.1 連 14.3 複 21.4|単 71.5 複 71.3:21240.7( 4.6@ 10.0)
続@ 957A 962B 950全11690:単  8.2 連 16.4 複 24.5|単 66.1 複 68.8: 7725.2( 3.6@  8.1)209.8
※@1167A1162B1169全18022:単  6.5 連 12.9 複 19.4|単 75.0 複 73.0:13515.5( 5.4@ 11.6)264.8

継続乗りの回収率の悪さ。確かに、芝と違って乗替りの方が回収率が高くなる傾向
はあるにしてもこの期間は異常?。着率はこんなものだが。

その他では、ダートでは前走下から勝ち上がってきた馬の評価は芝よりは低い。
6番手くらいが妥当か。複率23.4%複回収率70%

---芝でもダートでも勝ち上がりに関しては買い方があるよね。---

降級も、かなり下位まで複勝率は高いが、回収率的な買い目は全くない。
それなら敢えて前走同クラスでの下位順位の方が狙い目といえる。

以下、参考までに、芝・全

芝@1911A1914B1912全27273:単  7.0 連 14.0 複 21.0|単 70.6 複 74.3:19249.5( 5.2@ 10.1)
続@ 843A 814B 854全10418:単  8.1 連 15.9 複 24.1|単 73.7 複 75.0: 7675.6( 4.4@  9.1)166.4
※@1068A1100B1058全16855:単  6.3 連 12.9 複 19.1|単 68.7 複 74.0:11573.9( 5.9@ 10.8)169.0



ついでに、
前走からの距離の短縮や延長について、異常にこだわる人がいるので、それに
ついてのデータも少し。
こだわりより認識と理解のほうが先だと思うのだが、ナニカに毒されているとしか
思えないこともあるので念のため。

これらについては、馬や騎手・調教師について書かれた本から理解すれば頭の
(多分)悪い人の書いた低レベルな馬券本を読むより、はるかに役に立つ。
陸上のトラック競技の本にも参考になるものがあるが、探すのが大変。

まずダートの場合

距離短縮
ダ@ 567A 591B 598全 9024:単  6.3 連 12.8 複 19.5|単 70.2 複 73.2: 6335.8( 5.2@ 11.2)
続@ 202A 208B 189全 2614:単  7.7 連 15.7 複 22.9|単 68.4 複 73.0: 1789.2( 4.3@  8.9)164.0
※@ 365A 383B 409全 6410:単  5.7 連 11.7 複 18.0|単 70.9 複 73.2: 4546.6( 5.5@ 12.5)175.6
同距離(調整)
ダ@1211A1174B1179全14030:単  8.6 連 17.0 複 25.4|単 74.3 複 74.9:10421.9( 4.0@  8.6)
続@ 600A 607B 618全 6309:単  9.5 連 19.1 複 28.9|単 64.2 複 72.5: 4049.6( 3.3@  6.7)151.9
※@ 611A 567B 561全 7721:単  7.9 連 15.3 複 22.5|単 82.5 複 76.8: 6372.3( 4.8@ 10.4)264.8
延長(150〜450m)
ダ@ 280A 281B 253全 4476:単  6.3 連 12.5 複 18.2|単 79.8 複 66.6: 3570.7( 5.3@ 12.8)
続@ 123A 104B 100全 1490:単  8.3 連 15.2 複 21.9|単 97.3 複 66.7: 1449.2( 4.6@ 11.8)209.8
※@ 157A 177B 153全 2986:単  5.3 連 11.2 複 16.3|単 71.0 複 66.5: 2121.5( 6.5@ 13.5)166.7
大幅延長(450m超)
ダ@  52A  59B  68全 1480:単  3.5 連  7.5 複 12.1|単 48.3 複 55.1x  714.8( 9.3@ 13.7)
続@  18A  24B  22全  575:単  3.1 連  7.3 複 11.1|単 41.7 複 47.6X  239.7(10.2@ 13.3) 65.4
※@  34A  35B  46全  905:単  3.8 連  7.6 複 12.7|単 52.5 複 59.9x  475.1( 8.8@ 14.0) 60.1

芝では

距離短縮
芝@ 503A 514B 536全 7162:単  7.0 連 14.2 複 21.7|単 73.9 複 82.0: 5294.4( 5.6@ 10.5)
続@ 204A 175B 204全 2320:単  8.8 連 16.3 複 25.1|単 84.3 複 81.2: 1956.1( 5.2@  9.6)110.8
※@ 299A 339B 332全 4842:単  6.2 連 13.2 複 20.0|単 68.9 複 82.4: 3338.3( 6.0@ 11.2)169.0
同距離(調整)
芝@ 857A 854B 871全10888:単  7.9 連 15.7 複 23.7|単 71.5 複 74.0: 7783.0( 4.7@  9.1)
続@ 388A 396B 430全 4467:単  8.7 連 17.6 複 27.2|単 70.2 複 76.3: 3137.2( 4.1@  8.1)160.8
※@ 469A 458B 441全 6421:単  7.3 連 14.4 複 21.3|単 72.4 複 72.3: 4645.8( 5.2@  9.9)145.0
延長(150〜450m)
芝@ 466A 453B 411全 7079:単  6.6 連 13.0 複 18.8|単 70.8 複 69.5: 5011.4( 5.8@ 10.8)
続@ 212A 201B 171全 2641:単  8.0 連 15.6 複 22.1|単 79.7 複 71.1: 2105.3( 4.1@  9.9)166.4
※@ 254A 252B 240全 4438:単  5.7 連 11.4 複 16.8|単 65.5 複 68.5: 2906.1( 6.8@ 11.4) 88.2
大幅延長(450m超)
芝@  72A  82B  79全 1714:単  4.2 連  9.0 複 13.6|単 59.6 複 69.8: 1022.0( 6.4@ 14.2)
続@  26A  31B  34全  560:単  4.6 連 10.2 複 16.3|単 60.4 複 71.8:  338.3( 5.4@ 13.0) 44.5
※@  46A  51B  45全 1154:単  4.0 連  8.4 複 12.3|単 59.2 複 68.8:  683.7( 6.5@ 14.9) 46.1

こうした傾向に対しては昔からの競馬オヤジは対策しているので得意だが、データ派は
ケッコウ買うべき馬を買わず買ってはいけない馬を買うという逆モーションが多いようだ。

これは適性だけでなく、JRAの番組編成まで深く考えないといけない大事な要素。



10. ディレクトリを作る

sSeia も、2004年の半ばから非蓄積系のJVデータを溜め込んでいるので、いつの間
にか毎週の(RACE,RCOV)データも、かなりの数になりました。
これからもしばらく保存するつもりなので、年毎のフォルダを新しく作って 分けること
にします。
ただし、開催スケジュールは新しいフォルダには入れません
最初のうち考えていたのは、2年以上前のデータなら多分要らなくなって外してしまう
だろうということだったんですが、あればケッコウ使います。

まぁ、ほかの人はどうだか分からないけど同じようなことをしようというのであれば、
ディレクトリを作る方法を知らないと無理な話になります。

但しいろいろと問題が生じるので、マズ基本的なところから。
JVOPT.pl でも mkdir を使っていますが、使い方は簡単です。

        mkdir "$dir$yyyy" unless -d "$dir$yyyy" ;
        my $indir = "$dir$yyyy\/" ;

上の例は、$dir の下に $yyyy というディレクトリを作っています。
-d "$dir$yyyy" でそのディレクトリがあるかどうか確認して(-d)、 なければ (unless)、
作ります(mkdir)。

そのディレクトリ内のファイルを表現するときは、Windows の 場合は間に \ を挟む
のが普通です。
但し、perl の場合では、\ は他の用途に使われているので区別 するために \\ で表示
します。これが一つの方法です。
しかし、 の代りに / を使えば、Windows でも Perl でも同じ認識をしてくれるので、
/ を使う方が混乱せずにいい筈です。
パスなどでの区切りには / を使いましょう。

最後の $indir では最後の部分で / を追加しています。
ここで \/ としているのは、/ そのものだよ、と余計な念を入れてるだけで
多分、/ だけでも大丈夫です。というか、/ だけのほうが正しいでしょう。
sSeia はこの辺は、動きさえすればどうでもいいと考えているので、気になる
人は調べてください。

当然、この処理の前に、

        my $yyyy = substr( $fn, 4, 4 ) ;

として、ファイル名から西暦年に該当する部分を $yyyy に取り込んでいます。

ディレクトリを変更するときは、まぁこんな具合です。
で、いままで取得したデータは手作業でディレクトリを作って、ファイルを移動する
のがいいでしょう。

面倒なら、やらなきゃいいだけの話ですが、この取得場所を変更すると、これら取得
したファイルを使うスクリプトやプログラムを変更する必要があります。

kbsTk.pl の場合は、
サブルーチン rd_dat のなかの、以下の該当部分を修正です。
$pass をそのまま使わないほうが、いいとおもいます。

    {   # 出馬表と出走馬データ
        my $npass = "$pass/$yyyy" ;
        my $datRA = "$npass/RADW" . $yymmdd . '.DAT' ;      # 出馬表レースデータ
        -e $datRA or $datRA = "$npass/RABW" . $yymmdd . '.DAT' ;
        -e $datRA or $datRA = "$npass/RAGW" . $yymmdd . '.DAT'
                  or die "?? 出馬表データ RA〜 が見つからない ??:$!\n" ;
        my $datSE = "$npass/SEDW" . $yymmdd . '.DAT' ;      # 出走馬データ
        -e $datSE or $datSE = "$npass/SEBW" . $yymmdd . '.DAT' ;
        -e $datSE or $datSE = "$npass/SEGW" . $yymmdd . '.DAT'
                  or die  "?? 出走馬データ SE〜 が見つからない ??:$!\n" ;

sskj.pl の場合も、/$yyyyを追加してやるところがありますが簡単です。

もう一つの問題は、こうすると JVDTXT でタイマー取得ができなくなります。
発走時刻を RADWファイルから読み取るようにしているので、タイマーでオッズが取れ
なくなるということです。
手動で場別にオッズをとったり、ほかの速報系データを取得するのは問題ありません。

敢えてやるなら、今週データ保存フォルダを西暦年入りに変更して、開催スケジュール
もJVOPTでの取得時にそこにコピーしてやるとかの対策もあります。
簡単なスクリプトなのでそのほうがいいかもしれません。

もし、ここまでのことが理解出来て、リアルタイム系データをタイマー取得するつもりの
人には、差替え用の JVDTXT.exe を送ります。
単に読み込むときに、西暦年のフォルダを覗きに行くようにしただけのものです。
他の用途には使っていないので、他の部分はいじっていません。
見通しがついたら(つかなくても)、Mail ください。

いずれにしても、夏〜秋くらいまでには VB 2005 で、リアルタイム専用のJVDTXT
作るつもりですが、このフォルダに関して方向を決めておかないと混乱しますね。

まぁ、タイマーの問題さえなければ、全部スクリプト内ですむ問題なのですが、、
自らの無能非力のせいにはしたくないけど、う〜む。

現状は、ある程度のデータベースを構築しようという考えもあるし、いよいよ支離滅裂。
収拾のつかない状況に飛んでいきそうな気持ちを、このページを書くことで抑えている
のが現状。。。
あそび続けるというのも、疲れます。

次のシリーズは、どの方向に行くかは決めていないけど、
それよりしばらくは馬券であそびたい。


INDEXへ トップページへ