はじめに、先日Hadoop忘年会という大きな忘年会が浅草でありまして、その場で技術評論社の傳様から「はじめてのHadoop」という本をいただきました。この場を借りて御礼申し上げます。 CDH3だけでなくCDH4の設定、PigやHiveにも書かれているのでこれから入門される方の手元には象本(オライリー)や徹底入門と一緒に本棚に置くと便利だと思います。 —- あとこの文章は私的なものであり、会社とはなんら関わりがありません。 また憶測に基づくものであり、事実に反することもあるかと思うのでその際はご指摘ください。 日本において、大規模データの基盤構築や分析をするにあたり、大きな溝があります。先日のCloudera World Tokyoでも少し話がありましたが、データ解析の場では、分析する人と、基盤を用意する人で溝があるとは感じています。 基盤側はSQLサーバやHadoop、高速なインフラを用