19. MetaTester: 테스트 에이전트에서 OpenCL 프로그램 사용에 대한 지원이 추가되었습니다.
OpenCL 프로그램은 OpenCL 1.1 표준 이상을 지원하는 비디오 카드에서 계산을 수행하도록 설계되었습니다. 최신 비디오 카드에는 들어오는 데이터 스트림에 대해 간단한 수학 연산을 동시에 수행할 수 있는 수백 개의 소형 특수 프로세서가 포함되어 있습니다. OpenCL 언어는 이러한 병렬 컴퓨팅의 구성을 처리하고 특정 클래스의 작업에 대해 엄청난 가속을 달성할 수 있도록 합니다.
감사합니다. 보고서를 여는 줄 몰랐습니다.
그 증가폭은 더욱 커졌다.
나는 놀랐습니다. 이것은 최대 $80의 가치가 있는 예산 카드입니다! 따라서 NVidia는 드라이버에 대해 매우 열심히 일했습니다.
다음은 새로운 결과입니다.
이해합니다: 1. 순수 CPU, 2. OpenCL이 있는 CPU, 3. OpenCL이 있는 GPU?
그리고 여전히 - 422.
나는 놀랐습니다. 이것은 최대 $80의 가치가 있는 예산 카드입니다! 따라서 NVidia는 드라이버에 대해 매우 열심히 일했습니다.
그리고 누더기에서 재물에 이르기까지 얼마나 놀랐는지. NVidia가 이 포럼을 읽고 비슷한 테스트를 하고 버그를 찾아 수정한 것 같습니다.
이제 전략 테스터 자신이 모델링할 대상을 선택한 경우, 즉 코드를 강제로 작성하지 않으면 매우 좋을 것입니다. 그래도 7분에 대한 1초(동영상이 허용하지 않거나 누락된 경우 11초)가 파워입니다.
최신 운영 체제와 멀티 코어 프로세서는 GetTickCount 를 통해 측정 분산 문제를 심각하게 제거했습니다. 내 원래 의견은 "GetTickCount의 평균 오류는 최소 수십 밀리초입니다"라는 잘못된 진술에 관한 것입니다.
레지스트리에서 다음과 같이 보입니다.
"nvcuda.dll"=dword:00000000
"amdocl.dll"=dword:00000000
"amdocl64.dll"=dword:00000000
"IntelOpenCL64.dll"=dword:00000000
Intel의 기본 드라이버(녹색으로 강조 표시)보다 약 1.5배 더 느리게 작동합니다(빨간색으로 강조 표시).
해당 레지스트리 값을 삭제할 수 있지만 만일을 대비하여 분기를 저장하십시오.
친애하는 관리자. 나는 오랫동안 당신의 포럼에 없었습니다. 아마도 이 순간을 놓쳤을 것입니다.
클라우드 요구 사항에 맞는 비디오 카드 제공이 구현됩니까?
친애하는 관리자. 나는 오랫동안 당신의 포럼에 없었습니다. 아마도 이 순간을 놓쳤을 것입니다.
클라우드 요구 사항에 맞는 비디오 카드 제공이 구현됩니까?
거의 준비 https://www.mql5.com/ru/forum/23/page15#comment_201948
OpenCL 프로그램은 OpenCL 1.1 표준 이상을 지원하는 비디오 카드에서 계산을 수행하도록 설계되었습니다. 최신 비디오 카드에는 들어오는 데이터 스트림에 대해 간단한 수학 연산을 동시에 수행할 수 있는 수백 개의 소형 특수 프로세서가 포함되어 있습니다. OpenCL 언어는 이러한 병렬 컴퓨팅의 구성을 처리하고 특정 클래스의 작업에 대해 엄청난 가속을 달성할 수 있도록 합니다.
네, 그러죠.
그리고 첨부된 스크립트를 스크랩하고 결과를 올릴 수는 없나요? 정말 흥미롭습니다.
많은 숫자를 두려워하지 마십시오. 그들은 단지 계산의 정확성을 확인하기 위한 것입니다.
스크립트는 또한 모든 장치에서 실행됩니다. 주요 작업은 두 개의 큰 행렬을 곱하는 것입니다.
설정은 코드 내에서만 변경할 수 있습니다. 이 행에서 행렬의 선형 크기 _size:
#define _size 2000
메모리가 충분하지 않은 경우에만 변경하십시오. 이것의 신호는 개별 GPU에서 실행할 때 배열 수의 불일치입니다. 숫자의 차이가 10^(-4)보다 크면 명백한 오류입니다. 하지만 당신은 충분한 기억력을 가지고 있는 것 같습니다.
예를 들어 Radeon 6930 비디오 카드가 있고 1280 스트림 프로세서가 있습니다. 에이전트 목록에 어떻게 표시됩니까? 장치 1개 또는 1280개 모두와 같습니다.
이것만으로도 프로세서 10개보다 몇 배나 빠르며 추가된 장치 1개에 대해 보너스가 사라지지 않습니다.
그리고 첨부된 스크립트를 스크랩하고 결과를 올릴 수는 없나요? 정말 흥미롭습니다.
아니요, 스크랩이 아닙니다. 가장 흥미로운. 설정에서 아무것도 변경하지 않았습니다.
이 수치에서 나는 아무것도 이해하지 못했습니다. 설명하다? 글쎄, 적어도 손가락에 : 좋은지 아닌지? 장치마다 다르며 5-6행에서 이미 소수점 위치가 다릅니다.
이해하는 것 같습니다. 이것은 반복 작업에 대한 다중 테스트이며 총 시간은 각 장치의 평균입니다. 그래서?
이것은 단지 테스트 숫자입니다. 약 0.00001의 정확도로 일치하면 모든 것이 정상입니다. 인덱스는 무작위로 선택됩니다 - 계산의 정확성에 대한 선택적 검증. 글쎄, 우리는 결과 행렬의 모든 400만 요소에 대한 완전한 검사의 결과를 여기에 인쇄하지 않을 것입니다?!
이해하는 것 같습니다. 이것은 반복 작업에 대한 다중 테스트이며 총 시간은 각 장치의 평균입니다. 그래서?
아니오, 이것은 두 개의 큰 행렬의 단일 곱셈 연산입니다.
성능 면에서: 이 카드에 매우 좋습니다. 이제 내 결과입니다. 기기(아래에서 위로 - 초기화 순서 ):
저것들. 먼저 Intel의 OCL 엔진이 탑재된 Intel CPU, 다음에는 내 공룡 HD 4870, 그리고 다시 AMD 엔진이 탑재된 돌입니다. 스크립트: