Alım-satım fırsatlarını kaçırıyorsunuz:
- Ücretsiz alım-satım uygulamaları
- İşlem kopyalama için 8.000'den fazla sinyal
- Finansal piyasaları keşfetmek için ekonomik haberler
Kayıt
Giriş yap
Gizlilik ve Veri Koruma Politikasını ve MQL5.com Kullanım Şartlarını kabul edersiniz
Hesabınız yoksa, lütfen kaydolun
Pekala, kendi kodunuza bakın: Ve son satırda, 240'ı kendiniz 18'e bölersiniz (bunlar haritanız için birimlerdir).
Bir şeyi açıkça karıştırıyorsunuz. İşte tartışmalı kısım:
Çıktı: global=30 yerel=1
Ve bir arabellek oluştururken 240 bayt.
Bir şeyi açıkça karıştırıyorsunuz. İşte tartışmalı kısım:
Çıktı: global=30 yerel=1
Ve bir arabellek oluştururken 240 bayt.
global_work_size[ 0 ]
Ve local_work_size[0] = (uint) 240/18 = 13
PS Evet, haklısınız. Afedersiniz. Biraz kafam karıştı.
local_work_size[0] = (uint) 30/18 = 1 birim=28.
Bir kez daha, Roffield :
Mathemat: Давай тупо прикинем. 18 задач, выполняемых одновременно на мухах GPU, - это максимум то, что можно сделать на 4-5 нитках CPU. А CPU на x86 эмуляции может организовать гораздо больше ниток. Во всяком случае, если это Intel. Мой бывший Pentium G840 (2 ядра) дал ускорение примерно в 70 раз - на двух unit'ах! Я уже не говорю о том, что вытворяет мой текущий... условно говоря, i7.
İyi paralel bir görev ( MetaDriver 'ocl ile ilgili ilk daldan bir komut dosyasına bakın), GPU'da 1000 veya daha fazla hızlanma elde etmenize olanak tanır (MQL5'te CPU üzerinde 1 iş parçacığında yürütmeye kıyasla). Bulamazsan atarım, haritanda test ederim.
Tamponu ve hızını anladınız mı?
Ve UNITS, vb. hakkında AMD CodeXL ile çözmek daha iyi - performans grafikleri orada güzel.
AMD CodeXL'in kendisi buggy bir enfeksiyondur, ancak onsuz herhangi bir sonuç çıkarmak zordur.
Test cihazı CPU'ya izin verene veya arabellek sayısı * 0,353 ms'den daha uzun süren bir görev gelene kadar artık OpenCL ile uğraşmayacağım.
not
Sonunda kodumu optimize etmeyi bitirdim ve şimdi son sürüm testi 33 saniyede geçiyor (320 saniye - optimizasyondan önce, 55 saniye - "OpenCL tarzında").
Ve bir şeyi anlamak için orada ne var. Bunun yavaş bir işlem olduğu açıktır. Sonuç, çekirdeğin içindeki işi arttırmaktır (kodunuzda çok az şey var).
Ve daha modern vidyahi alın, bununla daha iyi hale geldiler.
AMD CodeXL'in kendisi buggy bir enfeksiyondur, ancak onsuz herhangi bir sonuç çıkarmak zordur.
Intel yardımcı programı da çok kullanışlıdır - ancak Intel taşları için. Peki, çekirdekteki en bariz hataları yakalamak için.
PS Sonunda kodumu optimize etmeyi bitirdim ve şimdi son sürüm testi 33 saniyede geçiyor (320 saniye - optimizasyondan önce, 55 saniye - "OpenCL tarzında").
Zaten çok daha iyi.
Bugün sayılarda 1 bitlik bir dizi oluşturmam gerekiyordu.
Aynı zamanda OpenCL üzerinde çalıştım.
Kodu global_work_size ve local_work_size hesaplamak için ilginç bir yöntemin gösterimi olarak gönderiyorum. Bu fikrin kendisi IntrotoOpenCL.pdf'den alınmıştır (bir kopyam var), ama düzelttim.