Vous manquez des opportunités de trading :
- Applications de trading gratuites
- Plus de 8 000 signaux à copier
- Actualités économiques pour explorer les marchés financiers
Inscription
Se connecter
Vous acceptez la politique du site Web et les conditions d'utilisation
Si vous n'avez pas de compte, veuillez vous inscrire
BMI2 (complémentaire de BMI1).
Puisque MPX et SGX concernent la protection, je me risquerais à supposer que le compilateur utilise activement les instructions/technologies BMI2 et qu'il y a un effet de TSX, ce qui est moins probable.
OpenCL sur une carte sera a priori beaucoup plus efficace que des processeurs multiples.
Et oubliez les tracas de la comparaison des processeurs.
Mais oui, vous devez découvrir comment écrire du code pour OpenCL.
Je ne peux pas vraiment dire à quel point il est instructif - j'ai essayé de le lire par moi-même.
Alexey, je pense qu'il serait plus efficace d'apprendre à écrire du code OpenCL et d'obtenir une bonne carte pour cela.
OpenCL sur une carte sera a priori beaucoup plus efficace que plusieurs processeurs.
Et oubliez ces tracas de comparaison de processeurs.
Mais oui, vous devez découvrir comment écrire du code pour OpenCL.
Je ne peux pas vraiment dire à quel point il est instructif - j'ai essayé de le lire par moi-même.
Ce n'est pas si facile d'écrire en OpenCL, j'ai étudié un peu la théorie, c'est plus facile de faire un agent avec la technologie OpenCL, pas comme maintenant, plus facile en termes de consommateurs.
Et puis, OpenCL n'est pas toujours efficace, alors j'ai été comparer sur le logiciel de Yandex(CatBoost) carte 1060 et FX-8350 processeur - il s'est avéré que le processeur est deux fois plus rapide, et si cette tendance est économiquement plus rentable d'acheter un processeur puissant que cinq 1080i, dont il y aura certainement un effet, mais coûteux ... en général, ce n'est pas évident et ce n'est pas une solution pour tout le monde.
Et puis, je pense que dans le compilateur, vous pouvez simplement désactiver le support des dernières technologies et pour les anciens, tout fonctionnera plus vite, l'option de désactivation.Ce n'est pas si facile d'écrire en OpenCL, j'ai étudié un peu la théorie, c'est plus facile de faire un agent avec la technologie OpenCL, pas comme maintenant, plus facile en termes de consommateurs.
Et puis, OpenCL n'est pas toujours efficace, alors j'ai été comparer sur le logiciel de Yandex (CatBoost) carte 1060 et FX-8350 processeur - il s'est avéré que le processeur est deux fois plus rapide, et si cette tendance est économiquement plus rentable d'acheter un processeur puissant que cinq 1080i, dont il y aura certainement un effet, mais coûteux ... en général, ce n'est pas évident et ce n'est pas une solution pour tout le monde.
Pour les calculs mathématiques, les verts ne sont pas particulièrement adaptés.
Les rouges sont meilleurs pour les maths, ils ont même un mode maths en standard, qui peut être configuré via l'application officielle.
J'ai une vieille Radeon 7970 de référence, elle supporte toujours le minage. Cela ne veut pas dire que j'exploite une seule carte, non, ce n'est pas rentable, mais cela permet de faire les calculs.
Pour les calculs mathématiques sur la carte, vous devez regarder le nombre de shaders, plus il y en a, mieux c'est, le reste des fps, etc. n'a pas d'importance, le plus important étant les blocs de shaders.
Pour les calculs mathématiques, les verts ne sont pas particulièrement adaptés.
Pour les maths, les rouges sont meilleurs. Ils ont même un mode maths en standard, qui peut être configuré via l'application officielle.
J'ai une vieille Radeon 7970 de référence, elle supporte toujours le minage. Cela ne veut pas dire que je mine sur une seule carte, non ce n'est pas rentable, mais que cela tire les calculs.
Pour les calculs mathématiques sur la carte, vous devez regarder le nombre de shaders, plus il y en a, mieux c'est, le reste des fps, etc. n'a pas d'importance, le plus important étant les blocs de shaders.
Pour autant que je sache, les rouges savent travailler en double et les verts non - je le sais. Mais, dans l'apprentissage automatique (CatBoost), il y a un renforcement des opérations de comparaison, qui par idée devraient fonctionner aussi vite que dans le rouge et le vert. Et les rouges ne sont pas supportés par CatBoost, hélas.
De toute façon, je ne peux pas le faire moi-même, et les artistes pour le trouver n'étaient pas si faciles pour un prix adéquat et la compréhension.
Il m'a été suggéré que le code pourrait être accéléré en utilisant l'énumération des commutateurs.
C'était comme ça avant :
Et maintenant c'est comme ça :
Selon les premières estimations, le FX-8350 est 30 % plus rapide, mais les processeurs Phenom II sont environ 3 fois plus rapides ! Je ferai des tests de comparaison plus tard, lorsque les machines seront libérées de l'optimisation.
Je joins la nouvelle version de Tree_Brut_TestPL Expert Advisor, et j'ai ajouté "_Fast" à son nom. Veuillez le tester aussi, car il est très intéressant de savoir sur quelles architectures le gain sera. On peut espérer que ces recherches permettront d'améliorer le compilateur ME.
J'ai reçu des données supplémentaires du membre du forumFast528 (actuellement incapable de poster sur le forum)
Ryzen 2700 non overclocké, mémoire 3333
Tree_Brut_TestPL 8 cœurs 16 threads
Tree_Brut_TestPL_F8 cœurs 16 threads
Ce test n'est pas complet car nous avons besoin d'une variante avec 8 cœurs et 8 threads en raison de l'activation de 8 agents et aussi 16 passes doivent être spécifiées dans l'onglet "Optimisation" - selon le nombre de threads (Start 0, Step 1, Stop 15).
Lorsque vous relancez le test, n'oubliez pas de vider le cache, qui se trouve à l'adresse suivante : ..\Tester\cache
Je vais ajouter les résultats intermédiaires au tableau pour l'instant sous la forme 8 cœurs / 8 agents.
Malheureusement, je ne peux plus éditer le premier message, alors je publie le classement ici.
Voici le résultat de fx8320e fréquence 4GHz, mémoire 1866 2 canaux, rang 2.
Arbre_Brut_TestPL_F_Fast
4 agents 8 passes
8 agents 8 passes
8 agents presque 2x plus rapide
Voici le résultat de fx8320e fréquence 4GHz, mémoire 1866 2 canaux, rang 2.
Arbre_Brut_TestPL_F_Fast
4 agents 8 passes
8 agents 8 passes
8 agents presque 2x plus rapide
Merci, mais ajoutez les résultats de Tree_Brut_TestPL_F et Tree_Brut_TestPL pour l'évaluation !