今週のノルマ6冊目。累計39冊目。データ分析の凄さを実感できる本。コンピュータを駆使したデータ分析による予想がいかに専門家を圧倒するか。この事実が豊富な事例を用いてドンドン語られていき、内容の面白さに一気に引き込まれてしまいました。
本書が良いところは「データ分析最強!」と言っているわけではなく、人間にしかできない仮説の重要性と統計分析を組み合わせる必要性を強調しているところです。さらにはデータ分析がおちいりやすいゴミデータの問題にも言及しています。
ちなみにタイトルは「その数学が戦略を決める」とカッチョ良い邦題ですが、戦略の話は特にありません。基本的にはデータ分析の有効性について語っている本。
●あらゆる場所で使用されているデータマイニング
データマイニングとは大量のデータを解析し、その中から見えるパターンを探し出す技術のこと。これが最も使われているのがWEBサービス。アマゾンの本を買うと以前の略歴からその人の趣向を推測して他の本を推薦してくる。
僕が利用している洋楽専門のRhapsodyというオンラインジュークボックスサービスもこれを活用しています。自分の好きなアーティストをクリックすると、その歌手が影響を受けた歌手や、同じような系統のアルバムがズラリと並んで非常に便利。
本書ではグーグル検索からアマゾンまで、あらゆる分野で利用されているデータマイニングの技術が紹介されています。よく考えると携帯電話の予測変換もこの技術が使われていますな。
ただ、こういうサービスに浸りきってしまうと新たなジャンル開拓の時は障害になったりもします。知らない間に趣味や考え方が特定のジャンルに偏ってきて、発想が貧弱に。。なんてことにもなってしまうかも。
そういうわけで、音楽だったらあえてたくさんのジャンルが無作為に流れたり、本でもたくさんのジャンルからピックアップして紹介してくれる機能が逆に必要とされるんじゃないかと。
突き詰めていくと、周りの友達だったり知り合いからの紹介や影響が最も精度が高く、多様性も網羅されているはず。肝心なのはデータマイニングと口コミどちらがいいかではなく、全ての良い部分と悪い部分を理解するのが重要だと思いました。
●データ分析を駆使した素人に敗北する専門家
この本のテーマともいうべき部分。世の中の専門家は長年の経験や直感を信仰するあまり、客観的なデータでの検証を軽視しすぎていると批判しています。その結果、ワインの品質を予想する専門家が、収穫時期の天候を元に品質を分析する分析屋に完全敗北するエピソードなどが面白いです。
長年の経験や権威を重視する代表格が医者。なぜならコンピュータによる分析が医者の経験に勝ることになってしまうと、自分達の既得利権を脅かす存在になってしまうから。
逆に、データ分析の有効性をドンドン取り入れようとするのがビジネスの分野。ここでは有効な手法であれば取り込まないとすぐにライバルに出し抜かれてしまいます。この対比が読んでて面白かった。
データ分析とはちょっと関係ないけど、ここであらためて思ったのが今まで培ったものを否定する必要性。これは自分が当事者になってみたらそう簡単なことではないはず。今まで培ってきた経験による予測の精度がコンピュータにコロリと負けると否定したくもなるってもんです。
ただ、ここで長年の経験による直感とデータ分析を組み合わせることができれば引く手あまたの名医となれるんじゃないかなあと思いました。まあ、実際は政治的要素とかしがらみとかたくさんありそうですが。
●コンピュータにできない人間の強みは仮説を立てること
「人間に残された一番重要なことは、頭や直感を使って統計分析にどの変数を入れる、入れるべきでないか推測することだ。」
いくら統計分析が優れた手法であってもそれをどの場面で使えばよいか、どのように使えばよいかには人間が考えるしかないということ。逆にいえば、コンピュータが得意な分野はコンピュータに任せ、人間が優位な分野を強めていけばよいと改めて思います。
さらに、統計の元になったデータは適切な過程で集められたデータかどうかもやっぱり人間でないと判断できない分野。
街頭調査ひとつをとっても、質問の仕方を変えるだけで回答者の返答が大幅に変わってきます。このことは以前読んだ「鈴木敏文の統計心理学」でも“ゴミデータが新たなゴミデータを作り出す」と指摘されていた。
今後ますますコンピュータが進化する社会において、人間にしかできないことは何かと考えさせられるよい本でありました。