Big Data分析ってどうやるの?(前編)

TableauならBig Data分析ができるって聞いたけど、どうやるの?

これってなかなか切実な問題だと思います。いろいろ迷ってたぶろう導入を決めたもののどうやっていいのか分からない、みたいなことになると困りますよね。
最近のMakeOverMondayでなかなか秀逸なBIg-Dataがお題に上がっていたので、それを元にTableauにBIgDataを食べさせるとこんなことができる!というイメージをつかんで頂きたいと思います。

楽しい分析の時間

Week 4: Migration of Turkey Vultures in North and South America
今回のお題はコチラ!なのですが、英語を読みたくない人のためにざっくりいうと、アメリカ大陸に生息するTurkey Vulture(ヒメコンドル)という渡り鳥に数年間にわたってGPS発信機を取り付けて取得した移動ログがお題のData-Setです。正直、野鳥マニア以外の方には、これで何を分析すればいいの?という感じです。データをDLして、一度エクセルで開けてみると・・・データの個数が720万件!これはもうBig Dataでしょう。


選択と集中(切り口を決めましょう)

続いて、どんな項目があるのかを見てみましょう。
・タイムスタンプ・緯度経度・GPS機器のタイプ・移動パターン分類・鳥の名前・なんかのメモ・・・etc  書ききれません。
turkey04
こういう時は使う項目を限定するのが一番。どう考えても全てのディメンションを使い切る事は困難です。では何を選ぶのか?今回のGPSログという主旨からして緯度経度がもっとも重要な気がします。

レッツ・ビジュアライズ

緯度経度という位置情報で分析をすることが決まりました。
ここからはTableauの地図を使って、どの様にvizができあがっていくのかをご説明します。たぶろうのストーリー機能を使って、プロセスが分かる様にしてあります。




インサイト(結論)をまとめよう

上記のVizの最終頁にも書きましたが、この分析によって、
  • 北米に生息するヒメコンドルの渡りルートには、大きく3種類ある事。
  • 中部を渡るグループは中南米からカナダまでの長距離を移動している事。
  • 西部を渡るグループは基本海岸線沿いに移動している事。
  • 東部を渡るグループは他に比べて比較的移動距離が短く、冬場はフロリダで優雅に過ごしている事
という事が分かりました。分析なので必ず結論を明確に表現しましょう。
どうでしたでしょうか?、見事に720万件のデータを裁いて、 渡り鳥さんの移動パターンが可視化され、その行動範囲をグループ化して把握することができました。
初めて分析に挑戦した方なら、これで十分画期的だと思います。エクセルでは絶対マネできません。Congratulations!!