최적화를 위한 CPU 코어 평가 - 페이지 12

 
Aleksey Vyazmikin :

불행히도 저는 바보입니다. 그러나 같은 위치에서 X>=0은 다른 어떤 숫자보다 클 수 있습니다. 많은 조합이 있습니다. 코드에서 모든 것을 예측할 수 없으며, 조합.

같은 값을 반복하는 경우도 꽤 많습니다. 그러나 도움이 되지 않을 것입니다.

 
Ryzen 3700x를 테스트할 수 있습니다. 세 명의 고문이 각각 a) 8명의 에이전트가 포함된 16개의 패스 b) 16명의 에이전트가 포함된 16개의 패스를 수행해야 한다는 것을 정확히 이해했습니다.
 
Quantum_Logic :
Ryzen 3700x를 테스트할 수 있습니다. 세 명의 고문이 각각 a) 8명의 에이전트가 포함된 16개의 패스 b) 16명의 에이전트가 포함된 16개의 패스를 수행해야 한다는 것을 정확히 이해했습니다.

시도 해봐.

 
Aleksey Vyazmikin :

최적화 모드에서 전략 테스터에 대한 효율성을 평가하기 위해 다양한 프로세서의 성능에 대한 통계를 수집할 것을 제안합니다.

보다 객관적으로 " 수학적 계산 " 모드에서 작동하는 어드바이저를 사용하는 것이 좋습니다. 이렇게 하면 하드 디스크와 컴퓨터 메모리를 최소한으로 사용할 수 있습니다. 가능하면 프로세서 이름, 마더보드 및 RAM 주파수를 포함하십시오.

이것은 이러한 알고리즘에 대한 성능 테스트가 될 것입니다. 그 이상은 아닙니다. 벤치마크를 기반으로 미리 "대략" 예측할 수 있습니다. https://www.cpubenchmark.net/high_end_cpus.html

예를 들어, 메모리에 모든 것이 있고 디스크가 주로 사용됩니다(메모리가 충분하지 않고 모든 것이 스왑됨). 그리고 여기에서 동일한 제온은 동일한 가격에 대해 총 "성능" 측면에서 최신 i7-8700k를 우회할 수 있으며 여기에 설명된 대로 8채널 모드에서 작동합니다. https://pikabu.ru/story/domashniy_komp_s_servernoy_nachinkoy_6442138

그러나 이것은 우리가 검색에 대해 이야기할 때입니다. 혼자 정리하고 헤쳐나가야 합니다. 따라서 https://www.cpubenchmark.net/singleThread.html , 특히 AMD 3600X - 3900X(지갑에 따라 다름) 테이블에 주의를 기울이겠습니다. 사실, 거의 전체 데스크탑에는 2개의 메모리 채널이 있습니다. 핵심 성능을 갖춘 4채널 서버 솔루션은 비용이 많이 듭니다.

또한 MQ가 N 스레드에 대한 공통 기록을 만들고 메모리 문제가 없을 것이라고 생각합니다.

그리고 비디오 카드에 대한 후속 병렬화와 함께 CUDA에 대한 조언자의 일부를 작성할 기회를 주고 싶습니다. 왜냐하면 관점이 훨씬 더 흥미롭기 때문입니다.

 
Andrey Pogoreltsev :

예를 들어, 메모리에 모든 것이 있고 디스크가 주로 사용됩니다(메모리가 충분하지 않고 모든 것이 스왑됨).

그리고 당신의 퍼센트와 메모리는 무엇입니까? SSD/HDD 드라이브?

 
Andrey Pogoreltsev :

이것은 이러한 알고리즘에 대한 성능 테스트가 될 것입니다. 그 이상은 아닙니다. 벤치마크를 기반으로 미리 "대략" 예측할 수 있습니다. https://www.cpubenchmark.net/high_end_cpus.html

예를 들어, 메모리에 모든 것이 있고 디스크가 주로 사용됩니다(메모리가 충분하지 않고 모든 것이 스왑됨). 그리고 여기에서 동일한 제온은 동일한 가격에 대해 총 "성능" 측면에서 최신 i7-8700k를 우회할 수 있으며 여기에 설명된 대로 8채널 모드에서 작동합니다. https://pikabu.ru/story/domashniy_komp_s_servernoy_nachinkoy_6442138

그러나 이것은 우리가 검색에 대해 이야기할 때입니다. 혼자 정리하고 헤쳐나가야 합니다. 따라서 https://www.cpubenchmark.net/singleThread.html , 특히 AMD 3600X - 3900X(지갑에 따라 다름) 테이블에 주의를 기울이겠습니다. 사실, 거의 전체 데스크탑에는 2개의 메모리 채널이 있습니다. 핵심 성능을 갖춘 4채널 서버 솔루션은 비용이 많이 듭니다.

또한 MQ가 N 스레드에 대한 공통 기록을 만들고 메모리 문제가 없을 것이라고 생각합니다.

그리고 비디오 카드에 대한 후속 병렬화와 함께 CUDA에 대한 조언자의 일부를 작성할 기회를 주고 싶습니다. 왜냐하면 관점이 훨씬 더 흥미롭기 때문입니다.

따라서 openCL이 있으므로 비디오 카드에서 이미 병렬화할 수 있습니다.
 
Pavel Verveyko :

그리고 당신의 퍼센트와 메모리는 무엇입니까? SSD/HDD 드라이브?

이제 Ryzen 5 2600이 있으므로 더 강력한 것을 가져갈 생각입니다.

메모리 4 x 8GB CORSAIR Vengeance 3000

기본 NVMe 드라이브는 Samsung 970 500GB이지만 테스터가 매번 최대로 강간하기 때문에 멀티 스레드 테스트를 위해 SATA-3이 있는 1Gb SSD를 구입했습니다.

 
Maxim Romanov :
따라서 openCL이 있으므로 비디오 카드에서 이미 병렬화할 수 있습니다.

전략 테스터 에서 병렬입니까? 저것들. 하나의 CPU 코어에서 OpenCL에서 N 최적화 스레드를 실행할 수 있습니까?

 
Andrey Pogoreltsev :

전략 테스터 에서 병렬입니까? 저것들. 하나의 CPU 코어에서 OpenCL에서 N 최적화 스레드를 실행할 수 있습니까?

테스터에서 Expert Advisor의 내부 로직은 OpenCL에서 병렬 처리될 수 있지만 히스토리 패스는 불가능합니다.

 

OpenCL은 물론 아름답지만 개발자의 하드웨어에서 해결된 특정 작업에 대해 이야기하는 경우에만 해당됩니다. 그렇지 않으면 제품에 대한 요구 사항이 급격히 증가합니다. 이러한 작업은 다음과 같습니다.

  1. 3D 그래프/모델 그리기(의심스러운 작업)
  2. 신경망 계산
  3. Expert Advisor 최적화의 병렬화는 매우 멋질 것입니다. EA가 병렬화할 수 있는 OpenCL 코드를 포함할 수 있는 경우. 그러나 이를 위해 전략 테스터는 프로세서 코어 수와 상관없이 N개의 어드바이저 인스턴스를 실행할 수 있어야 합니다. 그리고 물론 먼저 인스턴스에 대한 틱이 있는 공유 메모리를 생성해야 합니다.
  4. 채광))))
추신. 그건 그렇고, 클라우드 머신에서 OpenCL 마이닝을 실행하고 얼마나 높은 컴퓨팅 파워를 얻을 수 있는지 확인하는 것은 흥미롭습니다)