[B! gpu] yassのブックマーク

yass id:yass

gpuに関するyassのブックマーク (38)

AMD packs 1TB SSD into a GPU for better VR and gaming | ITNews
yass 2016/07/28
ssd

gpu
リンク
SSD-to-GPU Peer-to-Peer DMAとバッファ管理（その１） - KaiGaiの俺メモ
昨年の暮れ、JPUGカンファレンスのLTで『SQL+GPU+SSD=∞』と題したスピーチを行った。 SQL+GPU+SSD=∞ (Japanese) from Kohei KaiGai www.slideshare.net これはかいつまんで言えば、ストレージからデータをCPU+RAMへとロードするより前に一旦GPUへとデータを転送し、そこで不要なデータを削ぎ落してからCPU+RAMへと渡してやる事で、CPU負荷の軽減とRAMの有効活用が計れるというアイデアである。実装としては、PCI-Eデバイス間でのP2P DMA機能を利用する事によってNVMe SSDの特定ブロックからGPU RAM上の特定の領域へDMAを実行するというものなので、ここは別に新しくも何ともない。以下の図は、従来の仕組みにおけるデータの流れを示したもの。 SSDから読み出されたデータは先ずCPU+RAMにバッファされ
yass 2016/02/14
SSD

GPU

gpgpu

dma
リンク
SQL+GPU+SSD=∞ (Japanese)
2. 自己紹介 ▌Name: かぴばら＠品川 ▌PostgreSQL歴：９年ほど（2006~） ▌works: セキュリティ周り、FDW周り、諸々... ▌趣味：別業界のテクノロジを持ってきて PostgreSQLに組み合わせる事（混ぜるな危険？） PostgreSQL Conference Japan - LT: SQL+GPU+SSD=∞2 Very powerful computing capability Very functional & well-used database PG-Strom: なるものを作っています。 GPGPU 3. What’s PG-Strom – ざっくり説明すると PostgreSQL Conference Japan - LT: SQL+GPU+SSD=∞3 ▌コア機能 ① SQLからGPUネイティブバイナリを動的に生成する。 ② GPUによる
yass 2015/11/30
ssd

GPU

SQL

PostgreSQL
リンク
GitHub - Overv/vramfs: VRAM based file system for Linux
Unused RAM is wasted RAM, so why not put some of that VRAM in your graphics card to work? vramfs is a utility that uses the FUSE library to create a file system in VRAM. The idea is pretty much the same as a ramdisk, except that it uses the video RAM of a discrete graphics card to store files. It is not intented for serious use, but it does actually work fairly well, especially since consumer GPUs
yass 2015/02/01
" vramfs is a utility that uses the FUSE library to create a file system in VRAM. The idea is pretty much the same as a ramdisk, except that it uses the video RAM of a discrete graphics card to store files. "

gpu

fuse
リンク
Private Presentation
Private content!This content has been marked as private by the uploader.
yass 2014/10/18
hardware

memory

gpu
リンク
NVIDIA cuDNN | NVIDIA Developer
Accelerated Learning cuDNN provides kernels, targeting Tensor Cores, to deliver best available performance on compute-bound operations. It offers heuristics for choosing the right kernel for a given probl em size. Expressive Op Graph API The user defines computations as a graph of operations on tensors. The cuDNN library has both a direct C API and an open-source C++ frontend for convenience. Most
yass 2014/09/08
" NVIDIA cuDNN is a GPU-accelerated library of primitives for deep neural networks. "

machinelearning

gpu

gpgpu
リンク
【後藤弘茂のWeekly海外ニュース】 AMDの完成形APU「Kaveri」のアーキテクチャ
yass 2014/01/14
" 今回サポートされたメモリモデル「hUMA」とキューイングモデル「hQ」は、中でも最重要の機能だ。なぜなら、この2つの機能によって、GPUで走るグラフィックス以外のプログラムを書くことが飛躍的に簡単になるからだ "

AMD

cpu

gpu

gpgpu

hsa
リンク
GPUでレコメンデーションの計算の高速化 - Thinking out loud
実際のところ、リアルタイムでレコメンデーションを走らせるためには、速い計算機が必要である。　計算量を食わない簡略化したロジックを動かすとか、計算機をクラスタ化して環境を構築する、などのアプローチもあるが、GPUを使って計算を高速化するというアプローチはなかなか見かけないので面白い。（社内でやっているところはあるかもしれないけれど、公開をしていないだけ、だったりして。） "You Might Also Like: A Multi-GPU Recommendation System" You Might Also Like: A Multi-GPU Recommendation System from NVIDIA GPU演算で、(Simpleながらも)レコメンデーション(recommendation)の計算が、CPUと比べて20倍〜300倍の早さになったよ、というスライド。要は、Util
yass 2013/12/07
gpu

gpgpu

recommend
リンク
サービス終了のお知らせ
サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。
yass 2013/11/23
" AmazonのクラウドでNVIDIAのGRID GPU / GRID K2 GPUはGK104チップを使っており，倍精度の浮動小数点演算性能は，2個で190GFlopsとあまり高くは有りませんが，単精度の性能は2個で4577GFlopsと高く，3Dグラフィックスでは高い性能を発揮"

ec2

gpu

gpgpu

nvidia
リンク
About NVIDIA
統合メモリ、ドロップイン・ライブラリなどのプログラミング機能により、次世代のGPU開発者を支援 2013年11月14日－カリフォルニア州サンタクララ－NVIDIA（本社：米国カリフォルニア州サンタクララ、社長兼CEO：ジェンスン・フアン(Jen-Hsun Huang)、Nasdaq：NVDA）は本日、世界で最も普及している並列コンピューティングのプラットフォームおよびプログラミングモデルの最新バージョン、NVIDIA® CUDA® 6を発表しました。 CUDA 6プラットフォームでは並列プログラミングがいままで以上にやりやすくなり、科学や工学、エンタープライズのアプリケーションをGPUで高速化するために必要な時間と労力が大幅に削減されます。いままで使っていたCPUベースのライブラリを置き換えるだけで実行速度を最大8倍に高められるパフォーマンスの拡張機能も用意されています。CUD
yass 2013/11/23
" 統合メモリ－CPUとGPUのメモリへアプリケーションが自由にアクセスできるため、プログラミングがシンプルになります。両者の間でデータをいちいちコピーする必要がなくなるのです。"

CUDA

gpgpu

gpu
リンク
【連載】Kepler GPUアーキテクチャとプログラム最適化
NVIDIAの「GK110(Kepler)」GPUを使う「Tesla K20/K20x」と「GeForce Titan」は、現状では最強の科学技術計算能力を誇っており、K20xは2012年11月のTop500で1位を獲得したオークリッジ国立研究所のTitanスパコンにも採用されている。GPUは高い浮動小数点演算能力を持っているが、単に、浮動小数点演算器の数を増やして従来のCPUを相似形で拡大したものではなく、かなり異なった作り(アーキテクチャ)となっている。そのため、GPUの高い演算能力を引き出すためには、CPUのプログラムとは異なる注意が必要である。そこで本連載では、Kepler GPUを例にとり、そのアーキテクチャとCUDAプログラムの最適化のポイントを見ていきたいと思う。
yass 2013/11/23
gpu

gpgpu
リンク
AWS News Blog
AWS Week in Review – AWS Documentation Updates, Amazon EventBridge is Faster, and More – May 22, 2023 Here are your AWS updates from the previous 7 days. Last week I was in Turin, Italy for CloudConf, a conference I’ve had the pleasure to participate in for the last 10 years. AWS Hero Anahit Pogosova was also there sharing a few serverless tips in front of a full house. Here’s a picture I […] Amaz
yass 2013/11/23
" cg1.4xlarge / 2つのNVIDIA Tesla M2050 "Fermi" GPU / 2つのquad-core Intel "Nehalem" X5570プロセッサ、合計33.5 ECUs / 22 GBのRAM / 個々のTesla M2050は448コア、3GBのECC RAMを含み、倍精度浮動小数点演算で515gigaflopsまで可能 "

ec2

aws

gpu

gpgpu
リンク
進化するGPU仮想化技術でワークステーションをデータセンターに - NVIDIA GRID VGXソリューション
yass 2013/11/23
NVIDIA

GPU

gpgpu

NVIDIA GRID
リンク
【仮想化道場】【GTC 2013レポート】NVIDIAが提供するクラウド/仮想環境向けのGPU「NVIDIA GRID」
yass 2013/11/23
NVIDIA

GPU

gpgpu

NVIDIA GRID
リンク
AWS News Blog
Announcing Amazon Managed Service for Apache Flink Renamed from Amazon Kinesis Data Analytics Today we are announcing the rename of Amazon Kinesis Data Analytics to Amazon Managed Service for Apache Flink, a fully managed and serverless service for you to build and run real-time streaming applications using Apache Flink. We continue to deliver the same experience in your Flink applications without
yass 2013/11/23
" NVIDIA GRID™ (GK104 "Kepler") GPU, 1,536 CUDA コアと 4 GB ビデオRAM / cg1の GPGPU は、倍精度浮動小数点演算とエラー訂正メモリ / それに比べ g2.2xlarge のGPUは、単精度浮動小数点演算をサポート / エラー訂正メモリはサポートしません"

ec2

GPU

NVIDIA

AWS

gpgpu

NVIDIA GRID
リンク
GTC Japan 2013 - CUDAの発明者のIan Buck氏に聞いたGPUソフトの将来
NVIDIAが7月30日に開催した「GTC Japan 2013」においてGPU Computing Software部門のジェネラルマネージャのIan Buck氏から、GPUソフトウェアの将来像について話を聞いた。Buck氏はCUDAの生みの親であり、現在もNVIDIAのGPUソフトウェア開発の中心となっている人物である。今回のGTCにおいて、NVIDIAがコンパイラのメーカーであるPGI(Portland Group International)を買収したことが発表された。これに関して、NVIDIAとPGIの分担はどうなるのかを質問したところ、PGIは、これまでのコンパイラのライセンス・販売を続ける。しかし、NVIDIAの一員となったので、MaxwellやVoltaといった将来のGPUやCUDA6/7の技術情報にアクセスできるようになり、より緊密な協力が行えるようになる。また、PGI
yass 2013/10/17
"OpenCLは GPUデバイスを制御するという思想で作られた言語であるのに対して、CUDAは、C言語をベースに並列計算のための最小限の拡張を付け加えたもので、デバイス制御とは逆方向の拡張を目指すものであり、方向性が違う"

cuda

gpu

opencl

gpgpu
リンク
The 13 application areas where OpenCL and CUDA can be used - StreamHPC
Our Services and ProductsWe are a software house that writes extremely fast code for the world's most demanding companies. Software Development – From architecture to delivery, making fast softwareDevelop Fast SoftwareMaking the release version of prototype codeMaking CUDA-code work on AMD hardware (HIP)Porting CUDA to OpenCLTraining – From crash-course to full in-house trainings1-day Crash Course
yass 2013/10/12
" what kind of algorithms are faster when using accelerators and OpenCL? "

opencl

gpgpu

gpu
リンク
长沙陶沽电子科技有限公司
yass 2013/10/11
" Ersatz provides efficient implementations of cutting edge deep neural network architectures along with a GPU cloud to train and run them on. With an intuitive web interface and a simple API, Ersatz makes it easy to build sophisticated intelligence into any application. "

deep learning

machinelearning

gpu
リンク
GPUへのMapReduceの適用に関する調査 - nishio-dens's diary
概要近年、GPUの性能は飛躍的に向上しており、グラフィック専用の処理装置としてではなく、数値計算等の汎用向けの処理に利用する、GPGPUに関する研究が盛んに行われている。GPUは内部に多くのコアを備えており、NVIDIA社のGeForce GTX 580では、512個ものコアを保持している。これらのコアすべてを効率よく利用することで、GPUの持っている高いパフォーマンスを引き出すことが出来るが、GPUの高い並列性を利用するためにはGPU特有の処理を実装する必要があり、GPUプログラミングになじみの無い利用者にとっては処理の記述が困難である。そこで、GPUを大量のコアを持ったプロセッサだと考え、これらに対してMapReduceを適用することを検討する。親しみやすいMapReduceインターフェースにあてはめて処理を記述するだけで、GPUの高い並列性を生かしたプログラムが実装可能となる。加
yass 2013/09/29
" GPUプログラミングになじみの無い利用者にとっては処理の記述が困難である。そこで、GPUを大量のコアを持ったプロセッサだと考え、これらに対してMapReduceを適用することを検討する。"

gpgpu

MapReduce

gpu
リンク
2009/12/10 GPUコンピューティングの現状とスーパーコンピューティングの未来
PFI社内セミナー 2009年12月10日 20:00-21:00(予定) GPUコンピューティングの現状とスーパーコンピューティングの未来発表者: 村主崇行（プリファードインフラストラクチャー研究開発部門・京都大学大学院　物理学第二教室）セミナー録画URL: http://www.ustream.tv/recorded/2837689 このスライドは、発表後にみなさまからいただいた貴重な意見をもとに改訂した版です。発表時点での版はこちら: http://www.slideshare.net/pfi/20091210-gpu-2735685Read less
yass 2013/09/26
gpgpu

gpu

HPC
リンク
1 2 次のページ