<?xml version="1.0" encoding="utf-8" ?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>馬ツモくん【競馬予測開発奮戦記】</title>
<link>https://ameblo.jp/umatsumo/</link>
<atom:link href="https://rssblog.ameba.jp/umatsumo/rss20.xml" rel="self" type="application/rss+xml" />
<atom:link rel="hub" href="http://pubsubhubbub.appspot.com" />
<description>データマイニング技術を利用して競馬予測システムを開発しました。競馬・コンピュータ・数学の３つの分野を融合です。これら開発の面白い事・苦労した事などを徒然に記録するブログです。</description>
<language>ja</language>
<item>
<title>18 競馬予測と統計 その3</title>
<description>
<![CDATA[ <p>  ずーと、ブログのほう、サボっていた。というか、何やら、本業のほうが忙しくなってきて、ブログを書く暇がなかった。というのも言い訳がましいが、本当です。まだ、この状態が続くのだが、なるべくブログもがんばるつもりだ。</p><p>　競馬予測と統計のいよいよ本論に入っていく。</p><p>　今回の競馬予測では、「重回帰分析」という手法を使う。</p><p>　まずは、この「重回帰分析」について説明しよう。"重"の付かない回帰分析の計算の本質は、「最小二乗法」の計算と等しい。正確に言えば、メインの答えは、「最小二乗法」であるが、「回帰分析」はこれに統計的な知見を付与している。</p><p>　「最小二乗法」は、高校や大学における実験レポートをまとめるときに利用された方も多いと思うが、改めて、その計算方法を、競馬予測になぞって、説明したいと思う。</p><p>　次回に続く。</p>
]]>
</description>
<link>https://ameblo.jp/umatsumo/entry-10361049852.html</link>
<pubDate>Fri, 09 Oct 2009 21:44:09 +0900</pubDate>
</item>
<item>
<title>17 競馬予測と統計 その2</title>
<description>
<![CDATA[ <p>　今回から競馬予測と統計に関して議論するわけであるが、その本質は、人間の行う競馬予想の多くと符合する。多くの場合、競馬新聞等で仕入れてくる過去の戦績を元にして予想するわけであるが、競馬予測も全く同じである。但し、これらの過去の戦績等の情報を数値化し（正確にいえば数理モデル化・これについてはまた説明する）、統計的処理（重回帰分析）を行っているわけである。どちらも、過去の経験則にのっとり、未来のレースの行方を予測しているのである。その意味で、競馬予測と統計の関係は、わりと馴染みやすい話題となる。<br>　まずは、笑い話級の小生の失敗談をご披露する。<br>　まだ、競馬予測を初めて間もないころ、予測手法として、重回帰分析を利用することも決めていないころ、もう５年以上も前の話である。　まずは、手始めに、馬という動物の特性を調べる目的で、一日の中でどのあたりが調子が良いかあるいは悪いかを統計的に分析した。すると、驚くべきことに、はっきりとその特性が示され、午前中１０時台はあまり良くなく、徐々に調子が良くなり、午後４時～５時ごろ最高潮に達し、午後５時を過ぎるとガクンと調子が下がる。この特性があまりにもはっきりでたもので、インターネットで、馬の動物としての特性でそのような事実があるか、必死で探索したものである。競馬ファンの読者は、このへんで既に事情は呑み込めたと思う。これは、一般に一日のレース編成が、未勝利戦→新馬戦→未勝利戦→500万下→1000万下→1600万下→重賞→500万下となっているのが、真の理由である。実は、競馬予測を始めた当初は、小生、殆ど競馬については知らなかったのである。無論、現在の馬ツモ競馬予測には、このようなトンデモナイ誤解は内在していない。<br>　実は、これは笑い話であるが、統計処理を行う上での難しさを物語る格好の題材である。<br>　統計処理の場合、母集団の数（この場合過去のレース戦績）が多くなればなるほど、そこから得られる統計的数値は、信用できる値となる（数学的には<a href="http://ja.wikipedia.org/wiki/%E5%A4%A7%E6%95%B0%E3%81%AE%E6%B3%95%E5%89%87">大数の法則</a>とか<a href="http://ja.wikipedia.org/wiki/%E4%B8%AD%E5%BF%83%E6%A5%B5%E9%99%90%E5%AE%9A%E7%90%86">中心極限定理</a>・機会があったら説明する予定）。しかし、今の笑い話を考えてみよう。もし仮に、上記笑い話の馬の時間特性を競馬予測システムに内在させていたと仮定しよう。それで10年～20年、安定した予測実績を出していたとしても、今年からガタガタの予測に陥る可能性がある。何故ならば、今年から、メインレースが11Rでない場合が多くなってきたからである。すなわち、長年の過去実績が、そのまま、システムの信頼性につながらないのである。<br>　上記の笑い話の例は、あまりにもハッキリした間違えであるが、難しい場合もたくさんある。<br>　例えば、「馬Aが中山と相性が良い」と「過去の戦績」から判断する場合がある。しかし、それが本当か？もしかすると、「馬Aが中山で走ったレースは全て馬場が不良であった」ならば、不良馬場に馬Aが強いのかもしれない。<br>　次回に続く。</p><p align="right"><a href="http://www.uma-channel.net/">馬ツモ競馬予測サービス</a></p>
]]>
</description>
<link>https://ameblo.jp/umatsumo/entry-10339727598.html</link>
<pubDate>Thu, 10 Sep 2009 19:12:59 +0900</pubDate>
</item>
<item>
<title>16 競馬予測と統計</title>
<description>
<![CDATA[ <p>　今回から競馬予測システムの根幹をなす、データマイニングに関して議論をしたい。<br>　<a href="http://ja.wikipedia.org/wiki/%E3%83%87%E3%83%BC%E3%82%BF%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B0">データマイニング</a> を一言でいえば、「多量のデータから何らかの知識を取り出す技術」ということになるのだが、競馬予測の場合、多量の過去のレース戦績から「次のレースの着順」という知識を取り出すことに他ならない。<br>　データマイニング自体は、バイオ・ネット検索・金融系テクニカル分析・流通系消費分析等、様々な場面で応用されている。多量のデータを扱うことから、確率統計学ともなじみが深く、本格的な確率競馬とも関連してくる。<br>　馬ツモ競馬予測システムでは、<a href="http://ja.wikipedia.org/wiki/%E9%87%8D%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90">重回帰分析</a> という手法を利用して予測を行っている。重回帰分析についてもおいおい説明するが、この手法自体も統計学と大きく関連していることを述べたい。<br>　まずは、統計と競馬予測に関して議論をしたい。<br>　次回に続く。</p><p align="right"><a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a> </p>
]]>
</description>
<link>https://ameblo.jp/umatsumo/entry-10339238848.html</link>
<pubDate>Wed, 09 Sep 2009 23:37:28 +0900</pubDate>
</item>
<item>
<title>15 機械は人間に勝てるか？ その8</title>
<description>
<![CDATA[ <p>「14 機械は人間に勝てるか？ その7」の続きです。<br>　機械（馬ツモ競馬予測システム）の的中率も回収率も同時に伸ばすには、人間の予想とは離れて、機械独自の予測要因を発見することが鍵だと述べました。しかし、これは超難問です。<br>　現在の機械では、流石にそこまではできておらず、予測要因は、現在の競馬予想要因を踏襲しているだけです。無論、コンピュータで計算させているので、人間より定量的にまた精密に予測している面はあると思います。<br>　機械独自の予測要因を打ち出すには、現状での予測前提知識（レース前日以前のレース戦績＋レース前日時点でのレース出馬表）では不可能かもしれません。当日情報（馬体重・天候・馬場状態・パドック等）が必要かもしれません。また、JRAが提供する以外の情報（湿度・雨量・風向・風力等）が有効になるかもしれません。やはり、どこぞのサイトで宣伝されている裏情報が必要なのかもしれません。<br>　しかし<a href="http://ja.wikipedia.org/wiki/%E3%83%87%E3%83%BC%E3%82%BF%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B0">データマイニング</a> のそもそもの目的は、まさにココにあるわけですので、これは、本当に今後の挑戦となるでしょう。</p><br><p align="right"><a href="http://www.uma-channel.net/">馬ツモ競馬予測サービス</a> </p>
]]>
</description>
<link>https://ameblo.jp/umatsumo/entry-10337887616.html</link>
<pubDate>Mon, 07 Sep 2009 23:24:05 +0900</pubDate>
</item>
<item>
<title>14 機械は人間に勝てるか？ その7</title>
<description>
<![CDATA[ <p>「12 機械は人間に勝てるか？ その6」の続きです。<br>前々回に、馬ツモ競馬予測システムは予測アルゴリズムを変更することによって的中率をアップできるのですが、その場合回収率がダウンしてしまうということを述べました。</p><p>今回はこれについて議論します。これまでの議論で何度もお話ししてきたように、馬ツモ競馬予測システムはオッズを考慮しない純粋な着順予測システムであることを忘れてはいけません。従って、馬ツモ競馬予測システムは、回収率には直接的には関与してないのですが、回収率ダウンの原因は、機械の予測が人間の予想（一番人気予想）に近付いているからだと思います。</p><p>的中率も回収率もアップするためには、人間の予想（一番人気予想）から離れた、機械独自の予測要因を発見することが鍵といえます。下図でいえば、薄赤の部分を減らして、赤い部分を増やす方策を打ち出すことです。<br>　次回に続く。</p><p align="right"><br><a href="http://www.uma-channel.net/">馬ツモ競馬予測サービス</a> </p><a href="http://stat.ameba.jp/user_images/20090905/19/umatsumo/f2/77/p/o0800060710247533134.png"><img style="WIDTH: 325px; HEIGHT: 218px" height="218" alt="馬ツモくん【競馬予測開発奮戦記】" src="https://stat.ameba.jp/user_images/20090905/19/umatsumo/f2/77/p/o0800060710247533134.png" width="325" border="0"></a> <br><br>
]]>
</description>
<link>https://ameblo.jp/umatsumo/entry-10336662508.html</link>
<pubDate>Sun, 06 Sep 2009 10:17:15 +0900</pubDate>
</item>
<item>
<title>13 今週の予測</title>
<description>
<![CDATA[ <p>先週は、土曜日があまり良くなかったのですが、日曜日は、妙高特別と阿蘇ステークスで大物を仕留めました。<br>さてさて、今週はどんなもんかな？<br></p><p align="right"><br><a href="http://www.uma-channel.net/">馬ツモ競馬予測サービス</a></p>
]]>
</description>
<link>https://ameblo.jp/umatsumo/entry-10335945840.html</link>
<pubDate>Sat, 05 Sep 2009 10:28:09 +0900</pubDate>
</item>
<item>
<title>12 機械は人間に勝てるか？ その6</title>
<description>
<![CDATA[ <p>　「11 機械は人間に勝てるか？ その5」の続きです。<br>　前回は、人間は現状の機械より的中率は高いが、回収率は低いことをお話ししました。<br>ここで、現状の機械の的中率・回収率とは、現在サービスしている「<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>」の着順予測に基づく単勝1点買いの的中率・回収率のことです。また、人間の的中率・回収率とは、単勝オッズの一番低い（一番人気）馬への単勝1点買いをした場合の的中率・回収率のことです。<br><br>　今回は、その辺の事情について議論していきたいと思います。<br>　小生は、<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>を構築し、3連単・3連複の買い目で軒並み年間回収率が100%を超えた時点で、人間に勝ったと思いました。どこかで聞いた話ですが、「有名な競馬評論家でも、年間回収率は75%」。どう考えても機械の勝ちだと思いました。　しかし、よく考えてみるとこれはとんでもない間違いだと現在は気付いています。<br>　なぜならば、有名な競馬評論家の予想は、マスメディアを通じて多くの人が知る運命にあり、必然的にその予想のオッズは下がります。<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>の知名度はまだまだですので、その予測を公表することによるオッズの低下はほとんどないと思われます。このような環境下で人間に回収率で勝ったとしても、本質的ではなく、的中率で比較しないといけないと思います。　無論、今後も<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>の目標は、回収率アップにあるわけですが、的中率のアップも忘れてはならない課題だと思います。<br><br>　　また、前回、<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>は予測アルゴリズムを変更することによって的中率をアップできるのですが、その場合回収率がダウンしてしまうので、的中率アップのアルゴリズムは、「顧客サービス」では展開していない事も述べました。<br>　　次回は、この事に関して突っ込んだ議論をしたいと思います。</p><p align="right"><br><a href="http://www.uma-channel.net/">馬ツモ競馬予測サービス</a></p>
]]>
</description>
<link>https://ameblo.jp/umatsumo/entry-10334848971.html</link>
<pubDate>Thu, 03 Sep 2009 20:07:06 +0900</pubDate>
</item>
<item>
<title>11 機械は人間に勝てるか？ その5</title>
<description>
<![CDATA[ <p>　「10 機械は人間に勝てるか？ その4」の続きです。<br>　前回は、単勝1点買いでの的中率を機械と人間で比較してみました。<br>　機械の年間的中率は24%～27%、人間の的中率は31%～35%となり、人間の的中率のほうがはるかに高いことが示されました。ここで、機械の的中率とは、現状の<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>での的中率であり、人間の的中率は、単勝オッズの最も低い馬の単勝1点買いを行った場合の的中率です。<br><br>　それでは回収率はどうなのかといえば、同じ条件で、機械の年間回収率は87%～105%であるのに対して、人間の年間回収率は、75%～81%くらいで、回収率に関しては機械のほうがはるかに上である。無理もない、人間のほうは最低オッズを買い続けるわけだから。<br><br>　実は、機械の的中率性能を2%ほどアップするデータマイニングのアルゴリズムを持っている。しかし、このアルゴリズムでは回収率が下がってしまうため、<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>ではこのアルゴリズムは採用していない。<br>　<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>自体は、オッズを関連ずけておらず、純然たる着順予測のシステムであるので、当然的中率2%アップのアルゴリズムのほうが性能が良いこととなる。しかし回収率が低くなるため、顧客サービスとしては採用していないわけである。<br>　次回に続く。</p><p align="right"><a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a><br></p>
]]>
</description>
<link>https://ameblo.jp/umatsumo/entry-10333911772.html</link>
<pubDate>Wed, 02 Sep 2009 13:08:29 +0900</pubDate>
</item>
<item>
<title>10 機械は人間に勝てるか？ その4</title>
<description>
<![CDATA[ <p>　ここのところ体調がすぐれず、ブログのほうサボっていました。<br>　「8 機械は人間に勝てるか？ その3」の続きです。<br>　前回「まずは的中率性能を議論する」としましたが、正確には「まずは馬の着順予測を議論する」に訂正します。この点は、マサさんのコメントでの指摘にもありますように、単勝で全頭に賭ければ的中率100%が保証されますので、単純に的中率性能を論じるのはあまり意味がありません。その意味から、議論を「馬の着順予測性能」の議論とします。<br>　機械（競馬予測システム）では、馬の着順予測という言葉になじみがありますが、人間の予想では全頭の着順予測をすることはありません。多くて１・２・３着の予想となるでしょう。ここでは簡単に、1着馬の予測性能、すなわち単勝1点買いの的中率性能を考えてみます。現在の「<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>」の単勝1点買いの年間的中率（平地戦・新馬戦除く）は、年によっても異なりますが、24%～27%程度です。一方、単勝オッズの最も低い馬の単勝1点買いの場合の年間的中率は、同じ条件（平地戦・新馬戦除く）で31%～35%程度となります。すなわち機械は、人間と比べて的中率で7～8%も劣ります。機械（<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>）は、前日予測（すなわちレース当日の天候・馬場状態・馬体重・騎手変更・取消などを考慮しない）とはいえ、この的中率の差は非常に大きいと認識しています。また、単勝オッズの最も低い馬は、結局人間が投票している1番人気という意味で、人間の予想としては一つの基準となり,現在の機械（「<a href="http://www.uma-channel.net/">馬ツモ競馬予測システム</a>）は、的中率に関してははるかに及ばないということが確かめられます。<br>　次回に続きます。</p><p align="right"><a href="http://www.uma-channel.net/">馬ツモ競馬予測サービス</a></p>
]]>
</description>
<link>https://ameblo.jp/umatsumo/entry-10333082157.html</link>
<pubDate>Tue, 01 Sep 2009 09:10:43 +0900</pubDate>
</item>
<item>
<title>9 今週の競馬予測</title>
<description>
<![CDATA[ <p>　先週の予測は悲惨でした。。。　涙涙。。。</p><p>　今週はどんなものでしょうか？</p><p>　<a href="http://www.uma-channel.net/" target="_blank">馬ツモ競馬予測サービス</a> もしよろしければ覗いてやってください。無料予測もやってます。</p><p>　また、本サービスを応用した友人のブログ、<a href="http://wetanddry.seesaa.net/" target="_blank">ウェット＆ドライ</a> も参考になるかもしれません。</p><p>　ちょい宣伝でした。</p><p><br></p><p align="right"><br><a href="http://www.uma-channel.net/">馬ツモ競馬予測サービス</a> </p>
]]>
</description>
<link>https://ameblo.jp/umatsumo/entry-10325490903.html</link>
<pubDate>Fri, 21 Aug 2009 16:42:00 +0900</pubDate>
</item>
</channel>
</rss>
