これからデータ分析をはじめる人・基礎を学び直したい人に「Pythonプログラミングとデータ分析」

「Pythonプログラミングとデータ分析」レビュー

 日経BP様より赤石様の書籍「最短コースでわかる Pythonプログラミングとデータ分析」(本記事では、Pythonプログラミングとデータ分析と記載)を献本いただきました。赤石さんとは同じ出版社(日経BP)から書籍を出している繋がりで親しくさせていただいています(つまりズブズブの関係です)。

 今回の「Pythonプログラミングとデータ分析」のレビューは、赤石さんの書籍シリーズ(通称、赤石本)「ディープラーニングの数学」「Python自然言語処理入門」「Pythonで儲かるAIをつくる」「最短コースでわかる PyTorch &深層学習プログラミング」に続き5冊目となります。

 本書は、赤石本の中では入門者向けかつ実践的な内容になります。

 書籍は、4章立てで分かりやすく分割されていますので、本記事では章ごとの読みどころを紹介していこうと思います。

 ちなみに、私自身はPythonを使ったプログラミング自体はある程度するものの、データ分析の専門家ではなく、あくまでたまに個人や仕事でデータを可視化(グラフ作成)がある、という程度の経験、レベルとなります。

1章 Pythonプログラミング入門

 書籍ではPython環境として、Google Colabを活用しているので、初心者でも環境構築でつまづくことなく始められると思います。Google Colabに関して知らない方は、以下記事参照ください。

 基礎的な内容なので、Pythonを知っている人は飛ばしてもOKとなるところですが、知らずに損していた意外な発見があったりするので、Pythonある程度知っている人でも、ざっと読んでおくことをオススメします。例えば、私はGoogle Colabのデフォルトのインデント幅変えれることを本書ではじめて知りました…

 このあたりは、さすがデータ分析の経験豊富で丁寧な解説に(自分の中で)定評のある赤石さんです。

2章/3章 データ分析ライブラリ入門編/中級編

 2章3章は一気に紹介します。Numpy, Matplotlib, pandasといった、データ分析に必要なライブラリの解説です。

 どれも豊富な図で分かりやすく解説してあるので、辞書代わりに使えそうです。また、これらのライブラリの便利なオプション含めた様々な機能が紹介されています。このあたり、周りにデータ分析に詳しい人がいない環境だと、最低限の使い方以外は、なかなか一人で身に付けられないので、この本が良いガイドになると思います。

 中級編になると、私も知らない/忘れていたオプションや機能(メソッド)がバンバン出てきました。

4章 データ分析実践編

 データ分析の実践として、Kaggle等の入門として使われる、タイタニックと呼ばれるデータセットを使ったデータ分析をします。Kaggle、タイタニックをよく知らない人は、以下記事も参考にしてみてください。

 この章に関しては「いまさらタイタニック?」と少し思ってしまったことをここに謝罪いたします。本を読んで、データからこんなに色々なことを読み取ったり深堀りできるのかと驚きました。逆にそれができないと、立派なデータサイエンティストになれないということですね。

 Pythonのテクニックだけでなく、データをどう読み解くかという仮説検証の考え方、インサイト(洞察)の導出方法が学べる、データサイエンティストの仕事の進め方が垣間見えるような内容となっています。

まとめ

 赤石本5冊目となる「Pythonプログラミングとデータ分析」をレビューさせていただきました。初心者向けということで、あまり新たな発見はないかなと思っていましたが、予想以上に多くの発見がありました。さすが赤石さんの本です。そして、自分の基礎に対する抜けの多さよ…

 これからデータ分析をはじめるPython初学者はもちろん、ちょっと基礎が心配・データ分析の考え方をより深く知りたいPython中級者にも役立つ内容になるかと思います。データ分析が仕事でない人(ちなみに私もそうです)にとっても、活用できる可能性は十分あると思います。今の時代、個人でも仕事でも何かしらデータを扱うこと多いですからね。

 GitHubにサポートサイトもあるため、すぐ手を動かして実践できますし、実際に必要になったときのリファレンスとして活用することもできると思います。

 書籍のよくなかった点を書くとするなら、私が初心者のときにこの本がなかったことくらいです。今初心者で、これからデータ分析始める人にとっては最高の書籍ではないかと思います。おすすめです。

関連記事