OpenCl 및 도구. 리뷰 및 인상. - 페이지 27

 
이것들은 OpenCL 1.0 시대의 입증되지 않은 공포 이야기입니다. 2009-2010년의 텍스트처럼 느껴집니다.
 
Renat :
이것들은 OpenCL 1.0 시대의 입증되지 않은 공포 이야기입니다. 2009-2010년의 텍스트처럼 느껴집니다.

무슨 소리야, 리나트?

Catalyst Drivers 11.7 WHQL 및 11.8 Preview 다운로드가 준비되었으며 AMD는 OpenCL 가속화를 위해 APP-SDK를 이동했습니다.

이제 cl_khr_fp64를 통해 Double Precision/Doubles/FP64/watchamacallit를 마침내 지원하는 버전 2.5로 응용 프로그램.

하지만 주의 사항: Cypress 기반 GPU에만 포함되며 Cayman에는 포함되지 않으며 64비트 정밀 계산이 가능한 구형 칩에는 포함되지 않습니다.

http://www.gpu-tech.org/content.php/167-AMD-Catalyst-Driver-11.7-AMD-APP-SDK-2.5-bring-double-precision-for-Cypress-AVX-for-CPUs

Radeon HD 6990/6970/6950(Cayman 기반):

• 1/4 속도의 배정밀도
Radeon HD 6870/6850/6790(바트 기반):
• 배정밀도 지원 없음

Radeon HD 6 770/6750(Juniper 기반, OEM 사용을 위해 이름 변경):
• 배정밀도 지원 없음

Radeon HD 6670/6650(터키 기반):
• 배정밀도 지원 없음

Radeon HD 6450(Caicos 기반):
• 배정밀도 지원 없음

Radeon HD 5970(Cypress 기반):
• 1/5 속도의 배정밀도

Radeon HD 5870/5850/5830(Cypress 기반):
• 1/5 속도의 배정밀도

Radeon HD 5 770/5750(주니퍼 기반):
• 배정밀도 지원 없음

Radeon HD 5670/5650/5570(레드우드 기반):
• 배정밀도 지원 없음

Radeon HD 5450(삼나무 기반):
• 배정밀도 지원 없음

Radeon HD 4890/4870/4850/4830/4730(RV770/790 기반):
• 1/5 속도의 배정밀도

Radeon HD 4770(RV740 기반):
• 1/5 속도의 배정밀도

Radeon HD 4670/4650(RV730 기반):
• 배정밀도 지원 없음

Radeon HD 4550/4350(RV710 기반):
• 배정밀도 지원 없음

Radeon HD 3870/3850(RV670 기반):
• 배정밀도(1/5배속)

Radeon HD 3650(RV635 기반):
• 배정밀도 지원 없음
Radeon HD 3470/3450(RV615 기반):
• 배정밀도 지원 없음

Radeon HD 2900 XT/Pro/GT/OEM(R600 기반):
• 배정밀도 지원 없음

Radeon HD 2600 XT/Pro(RV630 기반):
• 배정밀도 지원 없음

Radeon HD 2400 XT/Pro(RV610 기반): • DirectX 10(컴퓨트 셰이더 없음) 이하,

• 배정밀도 지원 없음

 각 Readeon 시리즈에 대한 추가 및 세부 정보:
http://radeon.ru/reference/cardtable/


이제 nVidia의 트릭:

=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
Windows, Linux 및 Mac OS X용 NVIDIA CUDA Toolkit v4.1 프로덕션 릴리스 노트
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=

http://developer.download.nvidia.com/compute/cuda/4_1/rel/toolkit/docs/CUDA_Toolkit_Release_Notes_And_Errata.txt

 =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
Windows, Linux 및 MAC OS X에 지원되는 운영 체제
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
------------------
창
------------------
* 지원되는 운영 체제(32비트 및 64비트)
 - 윈 서버 2008  
 - WinXP 
 -비스타윈7 	


http://forums.nvidia.com/index.php?showtopic=34744

Windows 2003 Server는 CUDA와 함께 사용할 수 있도록 테스트되거나 검증되지 않았습니다.


Rinat, WinXP, Win Server 2008, Vista-Win7에서 작동하는 Win32 프로그램을 실수로 작성하는 방법을 알려주세요. 
그리고 동시에 Win Server 2003에서 작동하지 않았습니까 ??
버전 3 이상의 nVidia CUDA SDK 설치 프로그램은 Server 2003 에도 설치되어 있지 않습니다(풀 수 없습니다!). 어리석게도 호소력이 있습니다. 
Win 3.1 시대와 같이 유효하지 않은 셀에.
nVidia가 특별히 Win32 프로그램이 아닌 경우 어떻게 이 작업을 수행할 수 있습니까? 

 

GPU의 설계 정확도에는 여러 가지가 있습니다. COMPLEX 프로그램의 프로그래머는 Nvidia 자체에서도 매우, 매우 조심해야 합니다. 예를 들면 다음과 같습니다.

http://developer.nvidia.com/content/precision-performance-floating-point-and-ieee-754-compliance-nvidia-gpus

4.7 x86과의 차이점 NVIDIA GPU는 반올림 모드가 부동 소수점 제어 단어를 동적으로 사용하는 대신 각 부동 소수점 명령어 내에서 인코딩된다는 점에서 x86 아키텍처와 다릅니다. 부동 소수점 예외에 대한 트랩 처리기는 지원되지 않습니다. GPU에는 계산이 오버플로, 언더플로 또는 부정확한 산술과 관련된 경우를 나타내는 상태 플래그가 없습니다. SSE와 마찬가지로 각 GPU 작업의 정밀도는 명령어로 인코딩됩니다(x87의 경우 정밀도는 부동 소수점 제어 단어에 의해 동적으로 제어됨).

CUDA와 OpenCL을 연구할 때 때때로 하드웨어 사람들이 "혁명"과 마케팅 와우-히스테리로 수학을 완전히 망치기로 결정한 초자연적인 인상이 만들어집니다. 개념의 대체가 인위적으로 만들어졌을 때 내 컴퓨터는 정확히 무엇을, 어떻게 해야 합니다. 수학적 계산의 정확성과 예측 가능성 대신 열광적인 게이머 중심의 속도가 제공됩니다.

이제 프로그래머는 계산이 필요한 정확한 정확도에 특별한 주의를 기울여야 하며 여기에서 CPU 또는 GPU에 대한 결정을 내려야 합니다. 그리고 CPU에서도 하드웨어는 Microsoft와 함께 조용히 더러운 속임수를 사용합니다.

알았어, 난 일하러 가야 해. 안녕.

 

아직 논의가 안된듯...

관련 링크: Visual Studio 11에 통합된 AMD C++ AMP 라이브러리는 이미 다운로드할 수 있습니다.

 
alsu :

아직 논의가 안된듯...

관련 링크: Visual Studio 11에 통합된 AMD C++ AMP 라이브러리는 이미 다운로드할 수 있습니다.

이것은 특히 흥미 롭습니다.

자동 벡터화

또한 Visual Studio 11의 C++에 새로 추가된 기능은 기본적으로 켜져 있는 자동 벡터화 도구입니다. 컴파일러는 가능한 경우 루프를 벡터화하여 프로세서(예: SSE2 및 SSE4.x)의 벡터 명령을 사용하여 성능을 향상시킵니다. 다음 코드 스니펫을 예로 들어 보겠습니다.

float A[1000], B[1000], C[1000];

(i = 0, i < 1000, i++) {

A[i] = B[i] + C[i];

}

C++ 컴파일러는 여러 반복을 동시에 실행하기 위해 이 루프를 벡터화하여 최신 프로세서에서 사용할 수 있는 명령으로 성능을 크게 향상시킬 수 있습니다.

벡터라이저 외에도 자동 병렬화는 시스템의 여러 CPU 프로세서에서 루프를 실행하여 기본 하드웨어에서 더 효과적인 활용도를 얻습니다. 병렬화는 병렬화되어야 하는 루프를 나타내기 위해 프로그래머의 입력이 필요하며 자동 벡터화와 함께 사용할 수도 있습니다.

 
이 모든 것이 AMD64에 대한 지원을 얼마나 포함할지 궁금합니다... Intel에 매달리고 싶지 않습니다
 
joo :

이것은 특히 흥미 롭습니다.

자동 벡터화

또한 Visual Studio 11의 C++에 새로 추가된 기능은 기본적으로 켜져 있는 자동 벡터화 도구입니다. 컴파일러는 가능한 경우 루프를 벡터화하여 프로세서(예: SSE2 및 SSE4.x)의 벡터 명령을 사용하여 성능을 향상시킵니다. 다음 코드 스니펫을 예로 들어 보겠습니다.

float A[1000], B[1000], C[1000];

(i = 0, i < 1000, i++) {

A[i] = B[i] + C[i];

}

C++ 컴파일러는 여러 반복을 동시에 실행하기 위해 이 루프를 벡터화하여 최신 프로세서에서 사용할 수 있는 명령으로 성능을 크게 향상시킬 수 있습니다.

벡터라이저 외에도 자동 병렬화는 시스템의 여러 CPU 프로세서에서 루프를 실행하여 기본 하드웨어에서 더 효과적인 활용도를 얻습니다. 병렬화는 병렬화되어야 하는 루프를 나타내기 위해 프로그래머의 입력이 필요하며 자동 벡터화와 함께 사용할 수도 있습니다.

강하다 정말 강하다. 병렬화를 향한 컴퓨팅 기술의 진화가 우리 눈앞에서 빠르게 진행되고 있습니다.
 
AlexEro :

무슨 소리야, 리나트?

Catalyst Drivers 11.7 WHQL 및 11.8 Preview 다운로드가 준비되었으며 AMD는 OpenCL 가속화를 위해 APP-SDK를 이동했습니다.

오늘이 없는 척 하고 솔직하게 거짓된 결론을 내리려고 하는 것입니다.

예를 들어 비디오 카드의 가장 오래된 버전을 증거로 게시하고 7XXX 모델 및 Catalyst 12.x 드라이버를 완고하게 무시합니다.

Windows 2003에 대한 귀하의 진술로 판단하면 귀하는 "THEY must support EVERYTHING"의 지지자이며 그러한 신성한 조건(귀하가 보기에)의 위반에 기초하여 세상은 그 가치가 없음을 인정하고 용서를 위해 기도해야 합니다. 세상은 계속해서 새롭고 더 발전된 제품을 개발하고 출시합니다.

이 가장 방대한 소프트웨어를 개발하지 않았고 기술적 문제와 필요한 절충안이 무엇인지 모르기 때문에 호환되지 않는 소프트웨어를 작성하는 방법을 모릅니다. 비디오 카드 제조업체가 Windows 2003의 이전 서버 버전을 지원하도록 요구하는 것은 소비주의적 극단주의입니다. 소프트웨어 제조업체는 오래된 운영 체제의 동물원을 악몽으로 잊게 되어 기쁩니다. 그리고 드라이버 제조업체는 단지 그것을 꿈꿉니다.

추신: 근본적인 원인에 대한 진정한 이해를 대체하여 "그때 2008년을 지원하는 이유"라는 진부한 비교 방법으로 전환할 필요가 없습니다.

추신: 손상된 Windows 2003 Server 버전 사용 중지 - 이미 2012년입니다.

 
Renat :

오늘이 없는 척 하고 솔직하게 거짓된 결론을 내리려고 하는 것입니다.

예를 들어 비디오 카드의 가장 오래된 버전을 증거로 게시하고 7XXX 모델 및 Catalyst 12.x 드라이버를 완고하게 무시합니다.

Windows 2003에 대한 귀하의 진술로 판단하면 귀하는 "THEY must support EVERYTHING"의 지지자이며 그러한 신성한 조건(귀하가 보기에)의 위반에 기초하여 세상은 그 가치가 없음을 인정하고 용서를 위해 기도해야 합니다. 세상은 계속해서 새롭고 더 발전된 제품을 개발하고 출시합니다.

이 가장 방대한 소프트웨어를 개발하지 않았고 기술적 문제와 필요한 절충안이 무엇인지 모르기 때문에 호환되지 않는 소프트웨어를 작성하는 방법을 모릅니다. 비디오 카드 제조업체가 Windows 2003의 이전 서버 버전을 지원하도록 요구하는 것은 소비주의적 극단주의입니다. 소프트웨어 제조업체는 오래된 운영 체제의 동물원을 악몽으로 잊게 되어 기쁩니다. 그리고 드라이버 제조업체는 단지 그것을 꿈꿉니다.

추신: 근본적인 원인에 대한 진정한 이해를 대체하여 "그때 2008년을 지원하는 이유"라는 진부한 비교 방법으로 전환할 필요가 없습니다.

추신: 손상된 Windows 2003 Server 버전 사용 중지 - 이미 2012년입니다.

글쎄, 나는 당신의 대답을 완벽하게 이해했습니다. ㅎㅎ 다른 분들도 이해해주셨으면 좋겠습니다.

그리고 그것이 바로, 나는 아마도 당신의 조언을 따를 것입니다. 그것들은 내 의도와 일치합니다. 그러므로 나는 약 2 년 동안 짧은 시간 동안 여러분 모두를 여기에 남겨 둘 것입니다.

작별.

 
AlexEro :

글쎄, 나는 당신의 대답을 완벽하게 이해했습니다. ㅎㅎ 다른 분들도 이해해주셨으면 좋겠습니다.

그리고 그것이 바로, 나는 아마도 당신의 조언을 따를 것입니다. 그것들은 내 의도와 일치합니다. 그러므로 나는 약 2 년 동안 짧은 시간 동안 여러분 모두를 여기에 남겨 둘 것입니다.

작별.

결국, 게시물에서 작성자가 topikstarter라는 것을 추측할 수 없을 것입니다. .... 그가 지점을 시작한 이유는 명확하지 않습니다.