続・競馬であそぶ

地球の癌細胞(=ブッシュ・ブレア・金・小鼠)は不滅だ。

心入れ替えて、平和について考えろ。。っても無理だよな


7. JVData のファイル名

JVData のファイル名には、一応規則性があるように見えるのでデータ取得用のJVOPT
などでも、それを最大限に活用しています。

ただし、ファイル名については、JV からの約束や保証があるわけではありません。
だから、リネームしただけでそのままテキストファイルとして保存する(JVOPTの)現行の
やり方は完璧とはいえないわけです。

正しくは、ダウンロードしたファイルから、行頭のレコード種別ID とデータ区分をチェック
して、振り分ける作業が必要です。
まぁ、テキストファイルに保存するサブルーチンを少し書き換えるだけですから問題が生
じるようであればやってください。
この項が存在してるうちにそんなことが起きるようなら、ここに対策を書きます。

前回の「競馬であそぶ」シリーズでもこのファイル名について何度か触れましたが、
ここで、もう一度まとめておこうと思います。

------------------------------------------------------
非蓄積系データの命名規則を推理して楽しむ。(再掲&一部修正)

以下は短期間の収集データなので不完全ですが大体の傾向がわかります。
テキストファイルなので中をのぞけば済むことなのですが一応メモをつけておきます。
拡張子は、jvd と rtd がついています。ここでは .dat に統一(変更)しました。
----
上( 2+2 = )4桁のコードがダブらない分だけピックアップしてあります。

BNPW2004070120040701182659.dat;    BNですから馬主マスタですね
BRPW2004070120040701182701.dat;    BRですから生産者マスタですね
CHPW2004070120040701182704.dat;    CHは調教師マスタ
H1SW2004062720040628134356.dat;    H1は票数
HRSW2004062720040628134359.dat;    HRは払戻
KSPW2004070120040701182707.dat;    KSは騎手マスタ
O1SW2004062720040628134403.dat;    O1は単複枠ODDS
O2SW2004062720040628134406.dat;    O2は馬連ODDS
O3SW2004062720040628134408.dat;    O3はワイドODDS
O4SW2004062720040628134411.dat;    O4は馬単ODDS
O5SW2004062720040628134413.dat;    O5は三連複ODDS
RABW2004070420040702113930.dat;    RAはレース詳細ですね
     BWと続いてますがBはBefore[前]売で枠順決まってるの意味ですか
RADW2004070420040703114130.dat;これもRAですね
     DWと続いてますがDは[出馬表]枠順確定ということでしょうね
RAPW2004070420040701161445.dat;これもRA
     PWと続いてますがPはPre[枠順確定前]ですね
RAQW2004070120040701182709.dat;大きいRAのファイルです
     出走馬に関連している過去の全レースをまとめてあるんでしょう。
     これは木曜日に提供されるデータで重要ですね。
RASW2004062720040628134417.dat;これもRA
     これは月曜に提供されるS[成績]データですね。
RCPW2004070120040701182716.dat;    RCはレコードマスタですね
SEBW2004070420040702113932.dat;    SEは馬毎レース情報ですね
     これもBはBefore[前]売で枠順決まってるの意味ですね
SEDW2004070420040703114131.dat;SEですね
     これもDは[出馬表]枠順確定ということでしょうね
SEPW2004070420040701182720.dat;SE
     これもPWと続いてますがPはPre[枠順確定前]ですね
SEQW2004070120040701182721.dat;大きいSEのファイルです
     各馬の過去の全レースをまとめてあるんですね
     これも木曜日に提供されるデータで重要ですね
SESW2004062720040628134428.dat;SE
     これは月曜に提供される馬毎のS[成績]データですね。
UMPW2004070120040701182729.dat;    UMは競走馬マスタ

この他にも、あり得ますがソノトキはそのときで追加して推理しましょう。

4桁コードのアトの8桁はレース日か、その日付のデータだよ!という意味
アトの14桁は lastfiletimestamp に返してる値。

ファイルの中身は、それぞれの該当する内容が一行につき1データづつ入っています。
その一行の中にさらに固定長(同じファイルなら同じ位置に同じデータ、例えば馬番とか
騎手名などのデータが各行の同じ位置にある)でパックされています。
だから、行のどの位置にどんなデータがあるのかが分かればいいわけで、それを知るた
めのJVData仕様書なのです。

ちょくちょく顔を出す構造体とかは、そうしたデータを処理するための必須便利ツール
になるのです。ただし、ここでは使いません。

------------------------------------------------------
現在、取得している蓄積系・非蓄積系ファイルの主なもの

これらの提供されるタイミングに注意。
以下のファイル名で保存(レース日の例: 20041010)
原則として、アタマから12桁を使って(リネームして)います。


YSNW(年)9999.dat  開催スケジュール/蓄積系はこれだけ(通常、月曜日提供)
RABW(レース日).dat レースデータ  (前売り分レース〜通常、前々日提供)
RADW(レース日).dat    枠順確定後(通常、レース前日提供)
RAPW(レース日).dat    枠順確定前(通常、木曜日提供)
SEBW(レース日).dat 馬毎データ   (前売り分レース〜通常、前々日提供)
SEDW(レース日).dat    枠順確定後(通常、レース前日提供)
SEPW(レース日).dat    枠順確定前(通常、木曜日提供)
CHPW(提供日).dat  調教師マスタ  (通常、木曜日提供)
KSPW(提供日).dat  騎手マスタ   (通常、木曜日提供)
UMPW(提供日).dat  馬マスタ    (通常、木曜日提供)
BNPW(提供日).dat  馬主マスタ   (通常、木曜日提供)
RAQW(提供日).dat  その週発走する馬の過去のレース情報(通常、木曜日提供)
SEQW(提供日).dat  その週発走する馬の過去の成績情報 (通常、木曜日提供)
HRSW(レース日).dat 払戻しデータ  (通常、月曜日提供)
RASW(レース日).dat 確定レース情報 (通常、月曜日提供)
SESW(レース日).dat 確定馬別情報  (通常、月曜日提供)

非蓄積系のオッズデータは自分にとっては必要ないのでカットしました。
速報系のオッズがあれば十分という判断。
------------------------------------------------------
現在、取得している(レース日に提供の)速報系ファイル


0B11(レース日).dat      馬体重          WH
0B12(レース日).dat      レース結果    RA SE HR
0B13(レース日).dat      データマイニング  DM
0B14(レース日).dat      開催情報、        WE AV JC TC CC
---[速報オッズは日別のフォルダ毎に]
0B31(レース日・場コード・レース番号).dat    オッズ、単複枠
0B32(レース日・場コード・レース番号).dat    オッズ、馬連
0B33(レース日・場コード・レース番号).dat    オッズ、ワイド
0B34(レース日・場コード・レース番号).dat    オッズ、馬単
0B35(レース日・場コード・レース番号).dat    オッズ、三連複
0B36(レース日・場コード・レース番号).dat    オッズ、三連単

非蓄積系のファイル名の4文字目以外は、変更される必然性はないと思われますが、
前にも書いたように、保証はありません。

----------------------------------------------------------------------------
こんなのもあります。

RAGW(レース日).dat レースデータ  (GTレース〜多分、木曜日提供)
SEGW(レース日).dat 馬毎データ   (GTレース〜多分、木曜日提供)

提供タイミングから考えると多分、PW が提供されるまでのものなんですね。



8. スピードINDEX の限界

現在使われている、殆どのスピード指数は、Beyer のパクリか亜流でしかないのだが、
そこから脱け出すには多分、新しい視点が必要になる。
考えるうちに一つの方向が見えてきたので、ここに一項設けることにした。

ワケもわからず、手法だけを真似た従来のスピードINDEX は無意味だし、10年以上の
永きにわたって疑わなかった(=使い分けた気になっていた) sSeia も愚か。
それでも儲かっているのなら結果オーライだが、信じて損するヤツには、、合掌。

前提_1
もし、Beyer のスピード指数の考え方を進めていくにしても、少なくとも指数一位が、単勝
一番人気の勝率を超え、尚且つ回収率が100%を超えるところを目標にしなければ意味
が無い。

前提_2
もし、前提_1の目標達成に無理な理由があるのなら、その理由を知りたい。
知ろうともせず理解もせずに、信じて使いつづけるわけにはいかない。

経過
、、、省略。

結論
スピードIndex は無意味な数値ではないことは、経験上確かだと思われる。
但し、その数値はゼッタイではあり得ないので必要に応じて修正するワザが必要。

ということは、未だ指数の呪縛から抜け出していないということ。。
修正するのではなくて、どういう場合にどういう意味を持つのかを知るだけで十分。

kbsTk のIndex では、確かに条件を設定すれば、1、2位は回収率で100%を超える。
しかし全条件だと、87〜88% でしかない。つまり使い方次第ということ。

--------------------------------------------------------------------
一つの対策のヒント(として、膨大なデータのうちの一部を)
例;前走5着だった馬の次走データ
まず、ダート
	1〜4人気で5着(前走凡走)
ダ@  66A  69B  63全  553:単 11.9 連 24.4 複 35.8|単 68.0 複 68.6:  376.3( 4.7@  5.7)
続@  27A  27B  24全  220:単 12.3 連 24.5 複 35.5|単 70.3 複 67.4:  154.7( 5.0@  5.7) 17.7
※@  39A  42B  39全  333:単 11.7 連 24.3 複 36.0|単 66.5 複 69.4:  221.6( 4.7@  5.7) 14.3
	5番人気以下で5着だった(前走好走)
ダ@  66A  70B  79全  998:単  6.6 連 13.6 複 21.5|単 87.1 複 80.8:  869.2( 8.8@ 13.2)
続@  27A  36B  45全  455:単  5.9 連 13.8 複 23.7|単 66.5 複 89.0:  302.5( 8.6@ 11.2) 29.6
※@  39A  34B  34全  543:単  7.2 連 13.4 複 19.7|単104.4 複 74.0:  566.7( 8.9@ 14.5)110.9

次に、芝
	1〜4人気で5着(前走凡走)
芝@  71A  49B  43全  476:単 14.9 連 25.2 複 34.2|単 89.6 複 77.5:  426.7( 4.1@  6.0)
続@  21A  15B  26全  170:単 12.4 連 21.2 複 36.5|単 56.0 複 74.6:   95.2( 4.0@  4.5) 12.2
※@  50A  34B  17全  306:単 16.3 連 27.5 複 33.0|単108.3 複 79.1n  331.5( 4.2@  6.6) 30.8
	5番人気以下で5着だった(前走好走)
芝@  60A  51B  64全  782:単  7.7 連 14.2 複 22.4|単103.2 複 82.8n  807.1( 9.3@ 13.5)
続@  19A  27B  31全  347:単  5.5 連 13.3 複 22.2|単 61.4 複 86.4:  213.0( 8.3@ 11.2) 44.5
※@  41A  24B  33全  435:単  9.4 連 14.9 複 22.5|単136.6 複 80.0n  594.1(10.1@ 14.5) 49.7

実際の着順よりは、人気のほうに振れているのが分かると思う。
(実着順による)実タイムで計算されるスピードIndex にはこの要素が抜けている。
ただ上の例のように、たまたま回収率がよい場合が多いので見逃されているともいえる。

ヒントはこれだけで十分だと思う。Index に対する暫定での対策は簡単だ。
それで済ませるのもいいが、コレ以降の仮説の構築を sSeia は続けようと思う。

ということで、ケッコウ参考になったでしょ。
とは言っても、前走の人気と着順に異常にこだわるヤツが居なければ見逃していたとこ
ろだ。

もし、面白い仮説を思いついたら、sSeia にも教えてくろ。


INDEXへ トップページへ 次へ