OpenClとそのためのツール。レビューとインプレッション - ページ 27

 
これらは、OpenCL 1.0時代の根拠のない脅し文句です。2009年から2010年にかけてのテキストのように感じられる。
 
Renat:
これらは、OpenCL 1.0時代の根拠のない脅し文句です。2009年から2010年の文章のような気がします。

何言ってるんだ、リナト?

Catalyst Drivers 11.7 WHQL と 11.8 Preview のダウンロードが開始され、AMD は OpenCL を加速するための APP-SDK を移動させました。

アプリケーションがバージョン2.5となり、cl_khr_fp64を介して倍精度/倍精度/FP64/watchamacallitをようやくサポートするようになりました。

ただし、注意点としては、CypressベースのGPUにのみ搭載されており、Caymanや64bitの精密計算が可能な古いチップには 搭載されていないことです。

http://www.gpu-tech.org/content.php/167-AMD-Catalyst-Driver-11.7-AMD-APP-SDK-2.5-bring-double-precision-for-Cypress-AVX-for-CPUs

Radeon HD 6990/6970/6950 (Caymanベース)。

- 1/4倍速で倍精度
Radeon HD 6870/6850/6790 (Bartsベース)。
- 倍精度のサポートなし

Radeon HD 6 770/6750(Juniperベース、OEM使用時に名称変更)。
- 倍精度のサポートなし

Radeon HD 6670/6650 (Turksベース)。
- 倍精度のサポートなし

Radeon HD 6450 (カイコスベース)。
- 倍精度のサポートなし

Radeon HD 5970 (Cypressベース)。
- 1/5倍速で倍精度を実現

Radeon HD 5870/5850/5830 (Cypressベース)。
- 1/5倍速で倍精度を実現

Radeon HD 5 770/5750 (Juniperベース)。
- 倍精度のサポートなし

Radeon HD 5670/5650/5570 (Redwoodベース)。
- 倍精度のサポートなし

Radeon HD 5450 (Cedarベース)。
- 倍精度のサポートなし

Radeon HD 4890/4870/4850/4830/4730 (RV770/790 ベース)。
- 1/5倍速で倍精度を実現

Radeon HD 4770 (RV740ベース)。
- 1/5倍速で倍精度を実現

Radeon HD 4670/4650 ( RV730ベース):
- 倍精度のサポートなし

Radeon HD 4550/4350 (RV710ベース)。
- 倍精度サポートなし

Radeon HD 3870/3850 (RV670ベース)。
- 倍精度(1/5倍速時)

Radeon HD 3650 (RV635ベース)。
- 倍精度のサポートなし
Radeon HD 3470/3450 (RV615ベース)。
- 倍精度サポートなし

Radeon HD 2900 XT/Pro/GT/OEM(R600ベース)。
- 倍精度サポートなし

Radeon HD 2600 XT/Pro (RV630ベース)。
- 倍精度のサポートなし

Radeon HD 2400 XT/Pro(RV610ベース):- DirectX 10(ただしCompute Shaderはなし)以下。

- 倍精度のサポートなし

http://developer.download.nvidia.com/compute/cuda/4_1/rel/toolkit/docs/CUDA_Toolkit_Release_Notes_And_Errata.txt

//フォーラムnvidia.com/index.php?showtopic=34744Windows 2003 Server は CUDA と共に使用するためのテストや認定はされて いません。


Rinat、WinXP、Win Server 2008、Vista-Win7で動作し、同時にWin Server 2003で動作しない ように、意図せずに Win32プログラムを書くことが可能であるか教えてください? 3+バージョンのnVidia CUDA SDKインストーラはServer 2003にインストールさえしません
(解凍しません!)、愚かなWin 3.1のように、無効なセル参照を書き込んでいるのです。
 

GPUの構造精度については、FIXEDソフトウェアのプログラマは、非常に、非常に慎重にする必要があり、よく、例えばNvidia自体からもあります。

http://developer.nvidia.com/content/precision-performance-floating-point-and-ieee-754-compliance-nvidia-gpus

4.7 x86 との違い NVIDIA GPU は、丸めモードが、発泡ポイント制御ワードを動的に使用 するのではなく、各発泡ポイント命令内にエンコードされているという点で、 x86 アーキテクチャと異なっています。浮動小数点例外のトラップハンドラはサポートされていません。GPUには、オーバーフロー、アンダーフロー、不正確な演算を行ったことを示すステータスフラグがありません。SSEと同様に、各GPU演算の精度は命令にエンコードされています(x87の場合、精度は浮動小数点制御語によって動的に制御されます)。

CUDAとOpenCLを研究していると、鉄のメーカーがその「革命」とマーケティングのワウ・ヒステリーでついに数学を殺すことに決めたという超常的な印象を受けることがあります - 彼らは人為的に、何が、どのように正確にMYコンピュータがすべきかという誤った感覚を作り出すときです。正確で予測可能な数学的計算の代わりに、彼らの熱狂的なゲーマー中心のスピードが提案されているのです。

プログラマーは計算の精度に気を配り、CPUで計算するかGPUで計算するか決めなければならない。しかも、ハードメーカーとマイクロソフトが一緒になって、こっそり、CPUにも迷惑をかけたのだ。

さて、私は仕事があります。さようなら。

 

まだ議論されていないようですが...。

関連リンク: AMD C++ AMP library integrated in Visual Studio 11http://blogs.amd.com/developer/2012/03/01/amd-and-the-visual-studio-11-beta/ すでにベータ版がダウンロードできるそうです。

 
alsu:

まだ議論されていないようですが...。

関連リンク: AMD C++ AMP library integrated in Visual Studio 11http://blogs.amd.com/developer/2012/03/01/amd-and-the-visual-studio-11-beta/ ベータ版は既にダウンロード可能とのことです。

特に興味深いのは、これです。

自動ベクトル化

また、Visual Studio 11のC++の新機能として、オートベクタライザがデフォルトでオンになっています。 コンパイラは、プロセッサのベクトル命令(SSE2やSSE4.xなど)を使用してパフォーマンスを向上させるために、可能な限りループをベクトル化します。 次のコードスニペットを例にとって説明します。

float A[1000]、B[1000]、C[1000]。

for (i = 0; i < 1000; i++) {.

A[i] = B[i] + C[i]である。

}

C++コンパイラは、このループをベクトル化して複数の反復処理を同時に実行することができ、最新のプロセッサで利用可能な命令で性能を大幅に向上させることができる。

ベクトル化器に加えて、自動並列化器はシステム内の複数のCPUプロセッサにまたがってループを実行し、基盤となるハードウェアをより有効に活用することができます。 並列化するループはプログラマが入力する必要があり、自動ベクトル化装置と併用することも可能です。

 
気になるのは、この中にどれだけAMD64のサポートが含まれるのか...ということですね。インテルにこだわらない
 
joo:

特に興味深いのは、これです。

自動ベクトル化

また、Visual Studio 11のC++では、新たにオートベクタライザが搭載され、デフォルトでオンになっています。 コンパイラは、プロセッサのベクトル命令(SSE2やSSE4.xなど)を使用してパフォーマンスを向上させるために、可能な限りループをベクトル化します。 次のコードスニペットを例にとって説明します。

float A[1000]、B[1000]、C[1000]。

for (i = 0; i < 1000; i++) {.

A[i] = B[i] + C[i]である。

}

C++コンパイラは、このループをベクトル化して複数の反復処理を同時に実行することができ、最新のプロセッサで利用可能な命令で性能を大幅に向上させることができる。

ベクトル化器に加えて、自動並列化器はシステム内の複数のCPUプロセッサにまたがってループを実行し、基盤となるハードウェアをより有効に活用することができます。 並列化するループはプログラマが入力する必要があり、自動ベクトル化装置と併用することも可能です。

これは強い。 本当に強い。 コンピュータ技術の並列化への進化は、文字通り目の前で起きています。
 
AlexEro:

何言ってるんだ、リナト?

Catalyst Drivers 11.7 WHQL と 11.8 Preview のダウンロードが開始され、AMD は OpenCL を加速するための APP-SDK を移動させました。

私が言いたいのは、今日がないことにして、あからさまに間違った結論を出そうとすることです。

例えば、ビデオカードの最も古いバージョンを証拠として掲載し、7XXXモデルやCatalyst 12.xドライバを頑なに無視することで

Windows 2003に関するあなたの発言から判断すると、あなたは「THEY must support ALL」の支持者であり、そのような神聖な条件に違反したことを根拠に(あなたにはそう見える)、世界はその無価値を認めて赦しを祈りに行くべきだというのです。世界はただ、進化し、より良い新製品をリリースしていくだけです。

この非常に大量生産されるソフトウェアを開発しないので、互換性のないソフトウェアがどのように書かれるかを知らないし、技術的な問題や必要な妥協点がわからないのです。ビデオカードメーカーに旧サーバー 版Windows 2003のサポートを要求するのは、消費者側の過激な要求です。ソフトウェアメーカーは、古いOSのズーを悪い夢として忘れて喜んでいる。そして、ドライバーメーカーも夢を見ているに過ぎない。

追伸:根本原因の真の理解ではなく、「なぜ彼らは2008年を支持するのか」というつまらない比較方法に飛びつく必要はない

syl: Windows 2003 Server の壊れたバージョンを使うのはやめましょう - それは 2012 です。

 
Renat:

今日をなかったことにして、率直に言って誤った結論を導き出そうとする、ということです。

例えば、ビデオカードの最も古いバージョンを証拠として掲載し、7XXXモデルやCatalyst 12.xドライバを頑なに無視することである。

Windows 2003に関するあなたの発言から判断すると、あなたは「THEY must support ALL」の支持者であり、そのような神聖な条件に違反したことを根拠に(あなたにはそう見える)、世界はその無価値を認めて赦しを祈りに行くべきだというのです。世界はただ、進化し、より良い新製品をリリースしていくだけです。

この最も大量生産されるソフトウェアを開発しないので、互換性のないソフトウェアがどのように書かれるかを知らないし、技術的な問題や必要なトレードオフが何であるかも知らない。ビデオカードメーカーに旧サーバー 版Windows 2003のサポートを要求するのは、消費者側の過激な要求です。ソフトウェアメーカーは、古いOSのズーを悪い夢として忘れて喜んでいる。そして、ドライバーメーカーも夢を見ているに過ぎない。

注:根本的な原因の真の理解に取って代わる、「ではなぜ彼らは2008年を支持するのか」という陳腐な比較方法に飛びつく必要はない

syl: Windows 2003 Server の壊れたバージョンを使うのはやめましょう - それは 2012 です。

なるほど、その答えはよくわかりました。あはは、他の人もそうだといいんですけどね。

それがね、あなたのアドバイスに従おうかな、私の意図と全く同じなんです。ですから、しばらく、つまり1年か2年の間、みなさんをここに置いておきます。

さようなら。

 
AlexEro:

なるほど、お答えはよくわかりました。ははは、みんなもそうだといいんだけどね。

そして、あなたのアドバイスは、私の意図と一致しているので、それに従うことにします。だから、皆さんとは少しの間、つまり1年か2年の間、ここでお別れすることにします。

さようなら。

投稿から、その著者がトピックスターターであることを想像することはないだろう...。なぜスレッドを立ち上げたのかは不明です。