「ProRes」を含む日記

はてなキーワード: ProResとは

2022-07-02

■

■パソコンってもう劇的に処理能力上がらないのか？
ベンチマークの数字としては上がってくのだろうが。
CPUのクロックは微妙に速くなっているがシングルコアの性能はほぼ変わらない。
マルチコアになったとして、ThreadripperのようにIOダイを使って大きくしても、劇的に速くならない。
3D V-Cacheで積層してキャッシュを増やしても、アプリレベルでは劇的に速くなってない。
更に積層するのはあるかもしれないが、熱問題に対する解決策がないので出来ないでいる。
UCIe規格経由で複数のチップレットを接続するのが今後出てくると思うが、どれだけ専用の回路を搭載し利用するかで処理能力は変わるが、
Apple M1 UltraのようにProResの本数が増えても使いこなす人が居そうにないというのと似たことになりそうじゃないか。
GPUのように広帯域のHBM/GDDRと、データ依存性がない場合は処理能力高くなるが、
CPU側のメモリーとGPU側のメモリーとのコピーやらオーバーヘッドが合ったり、ゲームがAIの一部といった感じだし、
ゲームもベンチ上は数字が変わるが体感変わらねーなってのに金額が高くなるのもな。
ユニファイドメモリーにするとApple M1系のように性能でないしさ。
メモリーだとDDR4とDDR5で体感的にほぼ変わらない。
レイテンシは変わらないし、DDRの代わりになるものも出て来てない。
インテルがフォトニクスに注力してたり、日本の半導体戦略でもフォトニクスとしてが上がっていたりするが、
光は早いようで遅く、メリットだと低電力か発熱源の分散でしかない。
HPEがフォトニクスで先行していたが、処理能力というより、発熱源分散での設計のし易さアピールだった。
DPU(データプロセッシングユニット)、OPU(Optical Processing Unit）はスパコンやクラウドでは追加されるかもしれないが、
パソコンにはまだ遠そう。
DVDが不要になり5インチベイがなくなり、SATA SSDがなくなって2.5インチベイもなくなり、
GPU カードも2枚以上搭載しても性能上がらず1枚のみ、
ケースがバカでかい割に、中がスカスカになってしまっている。
ちょっとずつパーツ買って性能上げるなんてことはなくなって、全部とっかえ。
もう少しなんとかならないか。
GPUでレイトレ対応と言っているが、映画やプロダクトでやっているようなレイトレとは全然かけ離れていて、
ゲームのレイトレはまだなんちゃってでしかない。
https://anond.hatelabo.jp/20220702145051

Permalink | 記事への反応(0) | 15:13

■パソコンってもう劇的に処理能力上がらないのか？

ベンチマークの数字としては上がってくのだろうが。

CPUのクロックは微妙に速くなっているがシングルコアの性能はほぼ変わらない。

マルチコアになったとして、ThreadripperのようにIOダイを使って大きくしても、劇的に速くならない。

3D V-Cacheで積層してキャッシュを増やしても、アプリレベルでは劇的に速くなってない。

更に積層するのはあるかもしれないが、熱問題に対する解決策がないので出来ないでいる。

UCIe規格経由で複数のチップレットを接続するのが今後出てくると思うが、どれだけ専用の回路を搭載し利用するかで処理能力は変わるが、

Apple M1 UltraのようにProResの本数が増えても使いこなす人が居そうにないというのと似たことになりそうじゃないか。

GPUのように広帯域のHBM/GDDRと、データ依存性がない場合は処理能力高くなるが、

CPU側のメモリーとGPU側のメモリーとのコピーやらオーバーヘッドが合ったり、ゲームがAIの一部といった感じだし、

ゲームもベンチ上は数字が変わるが体感変わらねーなってのに金額が高くなるのもな。

ユニファイドメモリーにするとApple M1系のように性能でないしさ。

メモリーだとDDR4とDDR5で体感的にほぼ変わらない。

レイテンシは変わらないし、DDRの代わりになるものも出て来てない。

インテルがフォトニクスに注力してたり、日本の半導体戦略でもフォトニクスとしてが上がっていたりするが、

光は早いようで遅く、メリットだと低電力か発熱源の分散でしかない。

HPEがフォトニクスで先行していたが、処理能力というより、発熱源分散での設計のし易さアピールだった。

DPU(データプロセッシングユニット)、OPU(Optical Processing Unit）はスパコンやクラウドでは追加されるかもしれないが、

パソコンにはまだ遠そう。

DVDが不要になり5インチベイがなくなり、SATA SSDがなくなって2.5インチベイもなくなり、

GPU カードも2枚以上搭載しても性能上がらず1枚のみ、

ケースがバカでかい割に、中がスカスカになってしまっている。

ちょっとずつパーツ買って性能上げるなんてことはなくなって、全部とっかえ。

もう少しなんとかならないか。

GPUでレイトレ対応と言っているが、映画やプロダクトでやっているようなレイトレとは全然かけ離れていて、

ゲームのレイトレはまだなんちゃってでしかない。

Permalink | 記事への反応(5) | 14:50

2022-03-15

■M1 Ultra、同じチップを繋げたのは駄目だったのでは

今後、別構成のチップが出てくる可能性はあるだろうが・・・。

まず、あまり現時点では使い道が少ないニューラルネットの回路が倍になっても、意味がない。

ProRes周りの回路が増えたとしても、誰がそんな何本も流すんだ？という感じになっている。

クラウドで大量に処理したい動画がある場合はいいだろうが・・・。

価格が安ければ、動かないダークシリコンがあったとしても納得するだろうが、価格が高いので納得感はない。

個人的には、GPUコアのみのダイを結合した方が使い勝手はいいように感じる。

（Appleですら先端プロセスの価格に苦労してそうなので、作れるかわからんが)

1つ目のダイはCPUのシングルコア性能アップとキャッシュアップ、GPUは最低限にする

2つ目のダイはGPUのみにする

という構成の方がいいのではないだろうか。

GPU カードを挿す代わりに、GPU ダイを選ぶ。

Permalink | 記事への反応(0) | 17:02

2022-03-10

■「M1 Ultra」の感想

インテルやAMDなどのCPUと、NVIDIAなどのGPUとの間の接続はPCIeが速くなってきたとはいえ、

双方向にデータのやり取りが発生するような場合は帯域の狭さがネックになる。

ゲームのようにGPUに投げっぱなしにして、GPUとGPU側のメモリー、そしてディスプレイへの出力だけで閉じても大丈夫な場合は問題にならないが、

世の中そういうアプリケーションだけではない。

GPU カードが高くなっているのにも関わらず、CPU側のメモリーとGPU側のメモリーで似たようなデータをコピーしないといけないという、

部品代とコピーにかかるオーバーヘッドもある。

なので、「M1 Ultra」のように、CPUとGPU間の帯域が大きく、ユニファイドメモリでCPUとGPUで共通のメモリーにアクセス出来るというのはメリットがある。

インターポーザを介して帯域は確保出来ているが、遠いメモリーへのアクセスへのレイテンシは防ぎ用がないので、

チューニングしようとするとインターポーザを介するメモリーアクセスが発生するかどうかは、プログラミングで気にする必要はあると想像する。

さすがのAppleも最先端プロセスを使う、予約していたTSMCのキャパを使い切る状態にしないといかず、数を出荷しないといかないのだろう。

良品選別したダイをインターポーザで接続して、出荷するチップ数を増やすというのは選択肢としてよかったのだろう。

トランジスタ数も多くなりすぎて、EDA ツールで設計する時に必要になるシミュレーション時間も馬鹿にならないはずで、

タイミング検証が済、動くことが保証できている領域があるというのは、段階を踏んで設計するということでも合理的だ。

ただ機能面では、単純に倍になってしまっているため、ProResの本数が増えて、使い切るような状況があるのか？という不安はある。

「M1 Max」でそれなりにバランスを取っているわけで、「M1 Ultra」では多くなりすぎて使われない部分も出てくるだろう。

価格がそれなりに高いので、使われない部分があるというのは、あまり許してもらえないのではないだろうか。

インターポーザで接続する技術は確率出来たので、そこのIF周りは変更せずに「GPUだけ増やしたチップ」と「M1 Max」を接続する

といったのは考えられるが、数がでないといかず、そういうのを作れるかどうか。

他にデスクトップ向けだが低消費電力を売りにしているのは気になっている。

Apple内に、電力を消費するがパフォーマンスを上げるという技術があるかどうかだ。

Permalink | 記事への反応(1) | 00:55