7. JVData のファイル名
JVData のファイル名には、一応規則性があるように見えるのでデータ取得用のJVOPT
などでも、それを最大限に活用しています。
ただし、ファイル名については、JV からの約束や保証があるわけではありません。
だから、リネームしただけでそのままテキストファイルとして保存する(JVOPTの)現行の
やり方は完璧とはいえないわけです。
正しくは、ダウンロードしたファイルから、行頭のレコード種別ID とデータ区分をチェック
して、振り分ける作業が必要です。
まぁ、テキストファイルに保存するサブルーチンを少し書き換えるだけですから問題が生
じるようであればやってください。
この項が存在してるうちにそんなことが起きるようなら、ここに対策を書きます。
前回の「競馬であそぶ」シリーズでもこのファイル名について何度か触れましたが、
ここで、もう一度まとめておこうと思います。
------------------------------------------------------
非蓄積系データの命名規則を推理して楽しむ。(再掲&一部修正)
以下は短期間の収集データなので不完全ですが大体の傾向がわかります。
テキストファイルなので中をのぞけば済むことなのですが一応メモをつけておきます。
拡張子は、jvd と rtd がついています。ここでは .dat に統一(変更)しました。
----
上( 2+2 = )4桁のコードがダブらない分だけピックアップしてあります。
BNPW2004070120040701182659.dat; BNですから馬主マスタですね
BRPW2004070120040701182701.dat; BRですから生産者マスタですね
CHPW2004070120040701182704.dat; CHは調教師マスタ
H1SW2004062720040628134356.dat; H1は票数
HRSW2004062720040628134359.dat; HRは払戻
KSPW2004070120040701182707.dat; KSは騎手マスタ
O1SW2004062720040628134403.dat; O1は単複枠ODDS
O2SW2004062720040628134406.dat; O2は馬連ODDS
O3SW2004062720040628134408.dat; O3はワイドODDS
O4SW2004062720040628134411.dat; O4は馬単ODDS
O5SW2004062720040628134413.dat; O5は三連複ODDS
RABW2004070420040702113930.dat; RAはレース詳細ですね
BWと続いてますがBはBefore[前]売で枠順決まってるの意味ですか
RADW2004070420040703114130.dat;これもRAですね
DWと続いてますがDは[出馬表]枠順確定ということでしょうね
RAPW2004070420040701161445.dat;これもRA
PWと続いてますがPはPre[枠順確定前]ですね
RAQW2004070120040701182709.dat;大きいRAのファイルです
出走馬に関連している過去の全レースをまとめてあるんでしょう。
これは木曜日に提供されるデータで重要ですね。
RASW2004062720040628134417.dat;これもRA
これは月曜に提供されるS[成績]データですね。
RCPW2004070120040701182716.dat; RCはレコードマスタですね
SEBW2004070420040702113932.dat; SEは馬毎レース情報ですね
これもBはBefore[前]売で枠順決まってるの意味ですね
SEDW2004070420040703114131.dat;SEですね
これもDは[出馬表]枠順確定ということでしょうね
SEPW2004070420040701182720.dat;SE
これもPWと続いてますがPはPre[枠順確定前]ですね
SEQW2004070120040701182721.dat;大きいSEのファイルです
各馬の過去の全レースをまとめてあるんですね
これも木曜日に提供されるデータで重要ですね
SESW2004062720040628134428.dat;SE
これは月曜に提供される馬毎のS[成績]データですね。
UMPW2004070120040701182729.dat; UMは競走馬マスタ
この他にも、あり得ますがソノトキはそのときで追加して推理しましょう。
4桁コードのアトの8桁はレース日か、その日付のデータだよ!という意味
アトの14桁は lastfiletimestamp に返してる値。
ファイルの中身は、それぞれの該当する内容が一行につき1データづつ入っています。
その一行の中にさらに固定長(同じファイルなら同じ位置に同じデータ、例えば馬番とか
騎手名などのデータが各行の同じ位置にある)でパックされています。
だから、行のどの位置にどんなデータがあるのかが分かればいいわけで、それを知るた
めのJVData仕様書なのです。
ちょくちょく顔を出す構造体とかは、そうしたデータを処理するための必須便利ツール
になるのです。ただし、ここでは使いません。
------------------------------------------------------
現在、取得している蓄積系・非蓄積系ファイルの主なもの
これらの提供されるタイミングに注意。
以下のファイル名で保存(レース日の例: 20041010)
原則として、アタマから12桁を使って(リネームして)います。
YSNW(年)9999.dat 開催スケジュール/蓄積系はこれだけ(通常、月曜日提供)
RABW(レース日).dat レースデータ (前売り分レース〜通常、前々日提供)
RADW(レース日).dat 枠順確定後(通常、レース前日提供)
RAPW(レース日).dat 枠順確定前(通常、木曜日提供)
SEBW(レース日).dat 馬毎データ (前売り分レース〜通常、前々日提供)
SEDW(レース日).dat 枠順確定後(通常、レース前日提供)
SEPW(レース日).dat 枠順確定前(通常、木曜日提供)
CHPW(提供日).dat 調教師マスタ (通常、木曜日提供)
KSPW(提供日).dat 騎手マスタ (通常、木曜日提供)
UMPW(提供日).dat 馬マスタ (通常、木曜日提供)
BNPW(提供日).dat 馬主マスタ (通常、木曜日提供)
RAQW(提供日).dat その週発走する馬の過去のレース情報(通常、木曜日提供)
SEQW(提供日).dat その週発走する馬の過去の成績情報 (通常、木曜日提供)
HRSW(レース日).dat 払戻しデータ (通常、月曜日提供)
RASW(レース日).dat 確定レース情報 (通常、月曜日提供)
SESW(レース日).dat 確定馬別情報 (通常、月曜日提供)
非蓄積系のオッズデータは自分にとっては必要ないのでカットしました。
速報系のオッズがあれば十分という判断。
------------------------------------------------------
現在、取得している(レース日に提供の)速報系ファイル
0B11(レース日).dat 馬体重 WH
0B12(レース日).dat レース結果 RA SE HR
0B13(レース日).dat データマイニング DM
0B14(レース日).dat 開催情報、 WE AV JC TC CC
---[速報オッズは日別のフォルダ毎に]
0B31(レース日・場コード・レース番号).dat オッズ、単複枠
0B32(レース日・場コード・レース番号).dat オッズ、馬連
0B33(レース日・場コード・レース番号).dat オッズ、ワイド
0B34(レース日・場コード・レース番号).dat オッズ、馬単
0B35(レース日・場コード・レース番号).dat オッズ、三連複
0B36(レース日・場コード・レース番号).dat オッズ、三連単
非蓄積系のファイル名の4文字目以外は、変更される必然性はないと思われますが、
前にも書いたように、保証はありません。
----------------------------------------------------------------------------
こんなのもあります。
RAGW(レース日).dat レースデータ (GTレース〜多分、木曜日提供)
SEGW(レース日).dat 馬毎データ (GTレース〜多分、木曜日提供)
提供タイミングから考えると多分、PW が提供されるまでのものなんですね。