[B! hadoop][spark] kakku22のブックマーク

Pythonで大量データ処理！�PySparkを用いたデータ処理と分析のきほん

PyConJP2017の資料　Python Spark PySpark PyConJP 2017 Apache Spark

kakku22 2020/02/12

リンク

Apache Sparkがスループットとレイテンシを両立させた仕組みと最新動向を、SparkコミッタとなったNTTデータ猿田氏に聞いた（前編）

Apache Sparkがスループットとレイテンシを両立させた仕組みと最新動向を、SparkコミッタとなったNTTデータ猿田氏に聞いた（前編）最近ビッグデータ処理基盤として急速に注目を集めているのが「Apache Spark」です。 Sparkは、Hadoopと比較されることも多く、Hadoopよりも高速かつ高機能な分散処理基盤だと言われています。Sparkとはいったい、どのようなソフトウェアなのでしょうか？今年6月にSparkのコミッタに就任したNTTデータの猿田浩輔氏に聞きました。以下は猿田氏から伺ったSparkの紹介をまとめたものです。また、後編では猿田氏がコミッタになった経緯などもインタビューしました。 Hadoopでは複雑な処理に時間がかかる Sparkとはなにかの前に、まずはHadoopの話から始めさせてください。 Hadoopとは、ざっくり言うと分散処理フレームワーク「

kakku22 2015/08/05

spark
Hadoop

リンク

Asakusa on Spark - 急がば回れ、選ぶなら近道

Asakusa on Spark AsakusaがSpark上で動くようになりました。 Asakusa on Spark (Developer Preview) — Asakusa Framework Developer Preview 0.2.2 documentation すでに実際に本番に利用しています。ノーチラス・テクノロジーズがさくらインターネットにAsakusa Frameworkで開発した大規模データの高速処理基盤を導入し、顧客単位での精度の高い原価計算を実現高速処理基盤はApache Spark™で構築 | NAUTILUS OSSとしての公開を行いましたので、内容や位置づけをまとめておきます。例によってノーチラスは社内でいろんな意見は当然出ていますが、今回は概ね一致している感じです。パフォーマンス概ね「業務バッチ処理という観点で見れば、すべからくHadoopMapR

kakku22 2015/07/08

hadoop
spark

リンク

『GMO プライベート DMP でビッグデータ解析をするためにアプリクラウドで Apache Spark の検証をしてみた』の資料を公開しました - べにやまぶろぐ

Apache Spark を今後活用していくに当たって行ったプレ検証の結果について slideshare にアップロードしました。もう少し詳細な内部の実装や挙動を見ていかないとと思いつつ、いい加減ワードカウントも飽きてきたのでデータ分析にトライしていきたいと考えております。

kakku22 2015/04/23

リンク

Spark MLlibではじめるスケーラブルな機械学習

1. 1Copyright © 2014 NTT DATA Corporation NTTデータ基盤システム事業本部 OSSプロフェッショナルサービス猿田浩輔 2014年12月17日 JJUG ナイト・セミナー Spark/MLlibではじめるスケーラブルな機械学習 2. 2Copyright © 2014 NTT DATA Corporation 自己紹介  所属/氏名  NTTデータ基盤システム事業本部 OSSプロフェッショナルサービス  猿田浩輔（さるたこうすけ）  何をしている人?  OSSを使ったR&Dやシステム開発、テクニカルサポートに携わっています  6年ほど大規模分散処理基盤「Hadoop」関連のR&Dやシステム開発に関わってきました  近年はHadoopから派生して、インメモリ分散処理基盤「Spark」にも携わっています  著作物(共著) 

kakku22 2014/12/19

リンク

はてなブックマーク

タグ

関連タグで絞り込む (5)

hadoopとsparkに関するkakku22のブックマーク (5)

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第4週）

今週のはてなブックマーク数ランキング（2025年2月第3週）

今週のはてなブックマーク数ランキング（2025年2月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

タグ

関連タグで絞り込む (5)

hadoopとsparkに関するkakku22のブックマーク (5)

Pythonで大量データ処理！�PySparkを用いたデータ処理と分析のきほん

Apache Sparkがスループットとレイテンシを両立させた仕組みと最新動向を、SparkコミッタとなったNTTデータ猿田氏に聞いた（前編）

Asakusa on Spark - 急がば回れ、選ぶなら近道

『GMO プライベート DMP で ビッグデータ解析をするために アプリクラウドで Apache Spark の検証をしてみた』の資料を公開しました - べにやまぶろぐ

Spark MLlibではじめるスケーラブルな機械学習

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第4週）

今週のはてなブックマーク数ランキング（2025年2月第3週）

今週のはてなブックマーク数ランキング（2025年2月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

『GMO プライベート DMP でビッグデータ解析をするためにアプリクラウドで Apache Spark の検証をしてみた』の資料を公開しました - べにやまぶろぐ