Ti stai perdendo delle opportunità di trading:
- App di trading gratuite
- Oltre 8.000 segnali per il copy trading
- Notizie economiche per esplorare i mercati finanziari
Registrazione
Accedi
Accetti la politica del sito e le condizioni d’uso
Se non hai un account, registrati
BMI2 (complementare a BMI1).
Dato che MPX e SGX riguardano la protezione, azzarderei l'ipotesi che il compilatore usi attivamente le istruzioni/tecnologie BMI2 e che ci sia un effetto di TSX, il che è meno probabile.
OpenCL su una scheda sarà a priori molto più efficiente di più processori.
E dimenticate questa seccatura di confrontare i processori.
Ma sì, devi capire come scrivere codice per OpenCL.
Non posso dire quanto sia informativo - sto cercando di leggerlo per conto mio.
Alexey, penso che sarebbe più efficiente imparare a scrivere codice OpenCL e ottenere una buona scheda per questo.
OpenCL su una scheda sarà a priori molto più efficiente di diversi processori.
E dimenticate questa seccatura di confrontare i processori.
Ma sì, devi capire come scrivere codice per OpenCL.
Non posso dire quanto sia informativo - sto cercando di leggerlo per conto mio.
Non è così facile scrivere in OpenCL, ho studiato un po' la teoria, è più facile fare un agente con la tecnologia OpenCL, non come adesso, più facile in termini di consumatori.
E poi, OpenCL non è sempre efficiente, così stavo confrontando su software da Yandex(CatBoost) scheda 1060 e FX-8350 processore - si è scoperto che il processore è due volte più veloce, e se tale tendenza è economicamente più redditizio per acquistare un potente processore di cinque 1080i, da cui ci sarà certamente un effetto, ma costoso ... in generale, non è chiaro e non è una soluzione per tutti.
E poi, penso che nel compilatore si possa semplicemente disabilitare il supporto per le ultime tecnologie e per i veterani tutto funzionerà più velocemente, l'opzione per disabilitare.Non è così facile scrivere in OpenCL, ho studiato un po' la teoria, è più facile fare un agente con la tecnologia OpenCL, non come adesso, più facile in termini di consumatori.
E poi, OpenCL non è sempre efficiente, così stavo confrontando su software da Yandex (CatBoost) scheda 1060 e FX-8350 processore - si è scoperto che il processore è due volte più veloce, e se tale tendenza è economicamente più redditizio per acquistare un potente processore di cinque 1080i, da cui ci sarà certamente un effetto, ma costoso ... in generale, non è chiaro e non è una soluzione per tutti.
Per i calcoli matematici, quelli verdi non sono particolarmente adatti.
Quelli rossi sono migliori per la matematica, hanno anche una modalità matematica come standard, che può essere impostata attraverso l'app ufficiale.
Ho una vecchia Radeon 7970 di riferimento, supporta ancora il mining. Questo non vuol dire che io mini su una carta, no, non è redditizio, ma che tira i calcoli.
Per i calcoli matematici sulla scheda, devi guardare il numero di shader, più ce ne sono e meglio è, il resto degli fps, ecc. non ha importanza, soprattutto i blocchi shader.
Per i calcoli matematici quelli verdi non sono particolarmente adatti.
Per la matematica, quelli rossi sono migliori. Hanno anche una modalità matematica come standard, che può essere impostata attraverso l'app ufficiale.
Ho una vecchia Radeon 7970 reference, supporta ancora il mining. Questo non vuol dire che io miniera su una carta, no non è redditizio, ma che tira i calcoli.
Per i calcoli matematici sulla scheda, devi guardare il numero di shader, più ce ne sono meglio è, il resto degli fps, ecc. non ha importanza, soprattutto i blocchi shader.
Per quanto ne so, i rossi sanno solo lavorare con il doppio e i verdi no - lo so. Ma, nell'apprendimento automatico (CatBoost) c'è un affinamento sulle operazioni di confronto, che per idea dovrebbe funzionare velocemente come nel rosso e nel verde. E i rossi non sono supportati da CatBoost, ahimè.
In ogni caso, non posso farlo da solo, e gli artisti per trovarlo non era così facile per un prezzo adeguato e comprensione.
Mi è stato suggerito che il codice potrebbe essere accelerato usando l'enumerazione degli switch.
Una volta era così:
E ora è così:
Secondo le prime stime, FX-8350 è il 30% più veloce, ma i processori Phenom II sono circa 3 volte più veloci! Farò dei test di confronto più tardi, quando le macchine saranno libere dall'ottimizzazione.
Vi allego la nuova versione di Tree_Brut_TestPL Expert Advisor, e ho aggiunto "_Fast" al suo nome. Per favore, testatelo anche voi, perché è molto interessante sapere su quali architetture il guadagno sarà. C'è la speranza che queste ricerche aiutino a migliorare il compilatore ME.
Ho ricevuto ulteriori dati dal membro del forumFast528 (attualmente incapace di scrivere sul forum)
Ryzen 2700 non overcloccato, memoria 3333
Tree_Brut_TestPL 8 core 16 thread
Tree_Brut_TestPL_F8 core 16 thread
Questo test non è completo perché abbiamo bisogno di una variante con 8 core e 8 thread a causa dell'attivazione di 8 agenti e anche 16 passaggi dovrebbero essere specificati nella scheda "Optimization" - secondo il numero di thread (Start 0, Step 1, Stop 15).
Quando esegui di nuovo il test, non dimenticare di cancellare la cache, che si trova in ..\Tester\cache
Aggiungerò i risultati intermedi alla tabella per ora come 8 core / 8 agenti.
Purtroppo non posso più modificare il primo post, quindi sto pubblicando la valutazione qui
Ecco il risultato di fx8320e frequenza 4GHz, memoria 1866 2 canali, rango 2.
Albero_Brut_TestPL_F_Veloce
4 agenti 8 passaggi
8 agenti 8 passaggi
8 agenti quasi 2x più veloce
Ecco il risultato di fx8320e frequenza 4GHz, memoria 1866 2 canali, rango 2.
Albero_Brut_TestPL_F_Veloce
4 agenti 8 passaggi
8 agenti 8 passaggi
8 agenti quasi 2 volte più veloci
Grazie, ma aggiungete i risultati di Tree_Brut_TestPL_F e Tree_Brut_TestPL per la valutazione!