『データ解析の実務プロセス入門』を読んだ

データ解析の実務プロセス入門

データ解析の実務プロセス入門

この本は、データ解析のプロジェクトを進める上で必要になるプロセスと、各プロセスで気をつけることについて解説している本です。 データ解析の手法の本は数多くありますが、データ解析の進め方の本はあまり見ないので貴重な本です。

ソフトウェア開発の場合には、様々な本に書かれているようにやることが明確化されており、要件定義や設計・開発・運用といったプロセスが決まっています。また各プロセスで行う内容も大体決まっています。 もちろん経験やマネジメントによる差はありますが、そうしたプロセスを形式化していく流れではあります。

データ解析の場合には、まだ個人の経験に依存した部分が大きく、暗黙的に進め方がわかっている状態というのも珍しくないかと思います。 そばに経験豊富な人がいれば、その人の技術を見よう見まねで学ぶこともできますが、この本の帯にあるように「たったひとり、データ解析に挑むあなたへ・・・」といった状況になると、そもそも何を最初にやるべきか非常に難しいと思います。

この本では、特に仕事上で他のチームの企画者と連携して、データ解析を進めていくプロセスが述べられています。 担当者や意思決定者の明確化やKPIの運用など、趣味の範囲であればあまり意識しないが、仕事では必ず必要になってくる部分まで取り扱われているのが、すばらしいです。 最終章でストーリー形式で扱ったプロセスをおさらいされているのも、わかりやすいです。

1つ気になった点としては、唐突にテキストマイニングが出てきているように感じたことです。「テキストマイニング」の章と「分析手法手習い」の章は順番が逆の方が読みやすいのではないかと思いました。 そう感じるのは、数値の扱いの次に自然言語の扱いがくるという思い込みがあるせいかもしれません。

データ解析を初めてやる人にはもちろんのこと、既にやっている人でも頭の整理のために、おすすめできる本です。

関連エントリ