データ分析における一連の作業(データ収集、データクレンジング、モデリング)をコマンドラインで自由自在に進めるための考え方やツールの使い方を解説します。データの多様化、大規模化に伴い効率的にデータ分析を行う上でコマンドラインツールはかかせません。本書では、データ分析作業における各フェーズでのコマンドラインツールの使い方から、効率化のためのワークフローの管理や並列処理などまでを幅広く紹介します。 日本語版では監訳者による本書のテクニックを利用する時に壁になるであろう「日本語処理」と、実務で利用する場合の「ケーススタディ」を収録。エンジニアのみならず、データ分析に携わる全ての方に必携の一冊です。 監訳者まえがき はじめに 1章 イントロダクション 1.1 概要 1.2 データサイエンスはOSEMN 1.2.1 データの獲得 1.2.2 データのクレンジング 1.2.3 データの精査 1.2.4
