Big Data分析ってどうやるの?(後編)

一歩進んだ分析にチャレンジ!

分析から得られたインサイト(結論)を勇んで上司にもっていくと、「それ知ってた」となる事があります。せっかく頑張ったのに悲しいですよね。ビジネスの現場は厳しいものです。
前編でご紹介したのはすぐできる分析の一例です。実際のところ同様の分析をした人はtwitter上でも多かったように思われます。したがってこれは誰でも辿りつけることができるインサイトだったかもしれません。GPS ログから移動ルートを可視化できるのはよく考えたら当たり前ですよね。やはり簡単にできる分析(一手でできる分析)は、少し”浅い”のです。
そこで、他者との差別化を図るちょっとしたコツを、以下にご紹介したいと思います。

仮説をたてる

ここからは私が作ったVizの話です。
今回は鳥の生態の分析をする訳ですが、日本には”鳥目”という言葉がありますよね。(英語にもあるのかな?)
私は、鳥が一般には早起きと言われていて、また夜は行動できないのだという事を思い出し、彼らの生活パターンを可視化してみたいと思いました。また個体によって朝に強いタイプや、寝坊ばかりしているタイプがいたら、人間臭い一面が見えて面白いなと思っていました。
ここでいう、こんなことが分かったら面白いなというのは、ビジネスで言えば課題の原因を探る為に仮説をたてるという事と同意です(たぶん)。つまりそれによって分析の方向性が定まるのです。

データセットにひと手間加える

上記の仮説を検証するために、私が行ったことは緯度経度情報から、鳥たちの移動距離を算出することです。以下の計算式は緯度経度がある時に活用できる便利な計算式で、地球上の2点間の直線移動距離を算出できます。(近距離でも遠距離でも問題なく使えます)
turkey06
これによって、鳥たちが移動した距離をより定量的に比較できるようになります。さらにこれに時間軸を追加する事で手の込んだ分析が可能になります。もう少し具体的に言うと「どの個体が何時ごろに活発に(長距離)移動していて、何時ごろ休んでいるのか?」が分かるようになります。
デフォルトのデータセットを少し加工した事で新たな分析軸が生まれた事になります。ひと手間加える事で、分析に深みが出ます。

ユニークなインサイトを見逃さない

その結果、とても面白いことが分かりました。東海岸グループの個体達は活動のピーク時間帯が早く(17時頃)、西海岸グループは遅い(20時頃)という傾向が見えてきました。
最初は単純に、個体の性格とか群れの生活習慣の違いなんだろうと思っていましたが、よく考えると広いアメリカ大陸では、東西で日没時間が異なる事と関連があると気が付きました。
実際に両地域の時差は3時間あり、鳥たちの活動時間ピークの差異が3時間である事と一致します。つまり鳥たちにも人間と同じように時差があったのです。面白いですよね?



これは当初の仮説の想定を超えたインサイトだと思いました。この様に、分析をしているとまれに予想外に面白い法則や傾向を見出してしまう事があります。それを見逃さないようにしましょう。
実際、Make over Monday の投稿で、こんな事(笑)に着目したのはおそらく私だけだったと思います。
この様に誰も行わないユニークな分析には、オンリーワンな付加価値が生じます。もはや上司も「それ知ってた」とは言わない筈です。データにひと手間加えて、仮説をたてられたことで、”深い分析”になったと言えるのではないでしょうか?

Dataをディープに分析するすごい人たち

ここでもう一度、Make Over Mondayのサイトに掲載されている優秀作品をみてください。実に多様でディープなインサイトが得られています。そして美しいヴィジュアライズに目を奪われます。
Week 4: Migration of Turkey Vultures in North and South America
中でも、すごかったのは Matt Francis さんのコチラのViz。見ていただくと分かりますが、西海外グループの鳥の一羽である”モロンゴ”は南下する際に、移動ルートを間違ってメキシコ方面ではなくバハカリフォルニア半島 に迷い込んでいます。私はこの方の着眼点に驚愕しました。単なるGPSログから鳥たちが必死に生きている様子を捉えています。真にデータをディープに眺めるというのはこういう事だと思います。すごくユニークでオンリーワンな分析でした。






所詮、鳥の話?

これってビジネスで参考になる話かな?鳥の話なんでしょ?というご意見はあるかと思います。まあそうですよね・・・。分かります。
でも、今回の分析でできた事をビジネスに置き換えるとすると
  • イベント会場や商業施設などでの顧客の動きを可視化する
  • 物流事業における輸送ルートを可視化する
  • 交通渋滞が頻繁に起こる箇所を特定し、その原因を推測する
みたいな事に使えると思いませんか? いやたぶん使える! 使ってください!!

まとめ

  • 仮説を立てる事
  • データセットにひと手間加える事
これがBigDataに挑むときの合言葉かな?なんて思います。
もちろん実際には他のアプローチもあって、仮説があると客観性が薄れるから、恣意性を排除するために、まずは網羅的な分析をして、データを俯瞰するみたいな手法もあると思います。それについても、今後、Make Over Mondayなどであてはまる例が出てきたら、記事にしてみたいと思います。
そして、それをユーザーが簡単にできるようにサポートしてくれるのが、「たぶろう」です。すごい!