データベースは、何のためにあるのか?
綺麗なデータを保つためです。
しかし、その使ったデータはどうしていますか?
目次
利用したデータを再利用するには、データベースが必要
こんにちは。伊川(@naonaoke)です。
競馬のデータベースを作成しています。
作成はしているものの、データ分析後のデータはどうしていますか?
パワーポイントや、Excelにまとめて終わりでしょうか?
そのデータは、まだ使えますというのが、今回のお題です。
2次加工したデータは、現在のデータよりも大切です。
なぜか?
その2次加工データを、利用して、販売戦略等を、立てるわけです。
成功しても、失敗しても、その検証は、何よりも大切なものです。
このブログはこんな人にお勧め
- データベースを利用して、データ分析をしている人
- 統計に興味がある人
- 2次加工したデータを、データベースに組み込みたい人
このブログを、読み終わるころには・・・・
データベースは、手段であって目的ではありません。
綺麗なデータを作成するために、VBAや、関数が必要なのです。
VBAや、関数は、データ分析をするために、もっと、利用すべきです。
ExcelとACCESSの連携で、データ分析
多分、私たちの、身近にあるもので、一番最強の組合せは、ExcelとACCESSだと思っています。
そして、ACCESSの主キーを理解していれば、必要なデータだけを、Excelに転送して、データ分析が可能です。
今回は、コードはお見せしませんが、全部、私のブログと、動画で紹介したもので、作成ができます。
また、データ分析する内容は、競馬のデータで、3開催分です。
データにして、500件程度です。
ExcelとACCESSの連携で、データ分析 作業手順 その1 主キーを利用してデータ抽出
主キーは、絶対に、規則性のあるものです。
ランダムに作成した主キーなどは、存在しません。
運転免許書番号も、マイナンバーカードも、必ず規則性があります。
今回利用するのは、9月4日のデータです。
競馬に関しては、9月4日は、必ず、主キーに、20220904というワードが含まれています。
ということは、20220904を自動で表示させればいいのです。
関数なら、下記のように記載します。
=VALUE(TEXT(TODAY(),”yyyymmdd”))
VBAなら、Format関数を利用すればいいと思います。
こんな感じで仕込んでおきます。
ExcelとACCESSの連携で、データ分析 作業手順 その2 中穴のデータを加工する
中穴とは、馬券の配当が、2,500円~7,500円のデータです。
こんな感じで、ACCESSから転送したデータを、ExcelのVBAで加工します。
このときに加工したデータを、加工中に、ACCESSへ転送します。
転送されたデータは、こんな感じで保存されます。
このように保存されます。
保存するときには、必ず、主キーを作成することです。
なんでも、かんでも、保存すればいいわけではありません。
この主キーを設定することで、さらに3次加工が楽になるからです。
ExcelとACCESSの連携で、データ分析 作業手順 その3 2次加工データを利用する
この2次加工のデータを、利用して、事前確立モデルを作りたいのです。
事前確立モデルというのは、ベイズ推定で、利用します。
ベイズ推定は、迷惑メールの振り分けや、渋滞の予測に利用されています。
この事前確立モデルが、正確であれば、あるほど、予測は、正しくなります。
この事前確立モデルを、AIで学習させて、的中馬券をGETしようという魂胆です。
ExcelとACCESSの連携で、データ分析 作業手順 その4 余談
余談ですが、こんなことしていると、会社の実務など、マジでカンタンです。
また、2次加工データから、様々なアイディアが生まれるでしょう。
このアイディアは、予想と検証の結果から、生まれます。
このデータは、必要なのか?
はっきり言いますが、不要なデータなどありません。
その結集が、BIGデータなのです。
ここがポイント
身近なBIGデータは、私にとっては、競馬です。今は、官公庁で、様々なデータを配布しています。
分析してみたけど、面白くないです。
勉強は、楽しみながら、やるのが一番です。
まとめ
ExcelとACCESSの連携は、絶対に覚えたほうがいいですね。
これを知っているだけで、本当に世界が変ります。
ぜひ、みなさんのスキルにしてください。
今回も最後まで読んでいただきありがとうございました。
今回のサンプルファイルは、ありません。
わからない事を延々と考えるのは、無駄です。
- なんで作動かないの?
- もうやだ!VBAなんか嫌い!
- ネットで調べても情報がない!
必ず作動するコードが、ここにあります。