Sie verpassen Handelsmöglichkeiten:
- Freie Handelsapplikationen
- Über 8.000 Signale zum Kopieren
- Wirtschaftsnachrichten für die Lage an den Finanzmärkte
Registrierung
Einloggen
Sie stimmen der Website-Richtlinie und den Nutzungsbedingungen zu.
Wenn Sie kein Benutzerkonto haben, registrieren Sie sich
BMI2 (ergänzend zu BMI1).
Da es bei MPX und SGX um den Schutz geht, würde ich die Vermutung wagen, dass der Compiler aktiv BMI2-Befehle/Technologien verwendet und es eine Auswirkung von TSX gibt, was weniger wahrscheinlich ist.
OpenCL auf einer Karte ist a priori viel effizienter als mehrere Prozessoren.
Und vergessen Sie das lästige Vergleichen von Prozessoren.
Aber ja, man muss herausfinden, wie man Code für OpenCL schreibt.
Ich kann nicht wirklich sagen, wie informativ es ist - ich habe versucht, es selbst zu lesen.
Alexey, ich denke, es wäre effizienter zu lernen, wie man OpenCL-Code schreibt und eine gute Karte dafür zu bekommen.
OpenCL auf einer Karte wird von vornherein viel effizienter sein als mehrere Prozessoren.
Und vergessen Sie die Mühe, Prozessoren zu vergleichen.
Aber ja, man muss herausfinden, wie man Code für OpenCL schreibt.
Ich kann nicht wirklich sagen, wie informativ es ist - ich habe versucht, es selbst zu lesen.
Es ist nicht so einfach, in OpenCL zu schreiben, ich habe die Theorie ein wenig studiert, es ist einfacher, einen Agenten mit OpenCL-Technologie zu machen, nicht wie jetzt, einfacher in Bezug auf die Verbraucher.
Und dann, OpenCL ist nicht immer effizient, so war ich auf Software von Yandex(CatBoost) Karte 1060 und FX-8350-Prozessor zu vergleichen - es stellte sich heraus, dass der Prozessor doppelt so schnell ist, und wenn dieser Trend ist wirtschaftlich profitabler, einen leistungsstarken Prozessor als fünf 1080i, von denen es sicherlich einen Effekt zu kaufen, aber teuer ... Im Allgemeinen ist es nicht eindeutig, und es ist keine Lösung für alle.
Und dann, ich denke, dass in den Compiler können Sie einfach deaktivieren Sie die Unterstützung für die neuesten Technologien und für Oldtimer alles schneller funktionieren wird, die Option zu deaktivieren.Es ist nicht so einfach, in OpenCL zu schreiben, ich habe die Theorie ein wenig studiert, es ist einfacher, einen Agenten mit OpenCL-Technologie zu machen, nicht wie jetzt, einfacher in Bezug auf die Verbraucher.
Und dann, OpenCL ist nicht immer effizient, so war ich auf Software von Yandex (CatBoost) Karte 1060 und FX-8350-Prozessor zu vergleichen - es stellte sich heraus, dass der Prozessor doppelt so schnell ist, und wenn dieser Trend ist wirtschaftlich profitabler, einen leistungsstarken Prozessor als fünf 1080i, von denen es sicherlich einen Effekt zu kaufen, aber teuer ... Im Allgemeinen ist es nicht eindeutig, und es ist keine Lösung für alle.
Für mathematische Berechnungen sind die grünen nicht besonders geeignet.
Die roten sind besser für Mathe, sie haben sogar standardmäßig einen Mathe-Modus, der über die offizielle App eingestellt werden kann.
Ich habe eine alte Referenz Radeon 7970, sie unterstützt noch Mining. Das soll nicht heißen, dass ich nur auf eine Karte setze, nein, das ist nicht rentabel, aber es zieht die Berechnungen nach sich.
Für mathematische Berechnungen auf der Karte, müssen Sie auf die Anzahl der Shader schauen, je mehr von ihnen die besser, der Rest der fps, etc. spielt keine Rolle, vor allem die Shader-Blöcke.
Für mathematische Berechnungen sind die grünen nicht besonders geeignet.
Für Mathe sind die roten besser. Sie haben sogar standardmäßig einen Mathe-Modus, der über die offizielle App eingestellt werden kann.
Ich habe eine alte Radeon 7970 Referenz, sie unterstützt noch Mining. Das soll nicht heißen, dass ich auf eine Karte setze, nein, das ist nicht rentabel, aber es zieht die Berechnungen nach sich.
Für mathematische Berechnungen auf der Karte, müssen Sie auf die Anzahl der Shader schauen, je mehr von ihnen die besser, der Rest der fps, etc. spielt keine Rolle, vor allem die Shader-Blöcke.
Soweit ich weiß, wissen die Roten nur, wie man mit dem Doppelten arbeitet und die Grünen nicht - das weiß ich. Aber beim maschinellen Lernen (CatBoost) gibt es eine Schärfung der Vergleichsoperationen, die von der Idee her genauso schnell funktionieren sollte wie bei Rot und Grün. Und rote Farben werden von CatBoost leider nicht unterstützt.
Auf jeden Fall kann ich es nicht selbst tun, und die Künstler zu finden, war nicht so einfach für einen angemessenen Preis und Verständnis.
Es wurde mir vorgeschlagen, dass der Code durch die Verwendung von Switch-Enumerationen beschleunigt werden könnte.
Früher war es so:
Und jetzt ist es so:
Ersten Schätzungen zufolge ist der FX-8350 um 30 % schneller, aber die Phenom II-Prozessoren sind etwa dreimal so schnell! Ich werde später Vergleichstests durchführen, wenn die Maschinen frei von Optimierungen sind.
Ich hänge die neue Version von Tree_Brut_TestPL Expert Advisor an, und ich habe "_Fast" zu seinem Namen hinzugefügt. Bitte testen Sie es auch, da es sehr interessant ist, zu wissen, auf welchen Architekturen der Gewinn sein wird. Es besteht die Hoffnung, dass diese Forschungen dazu beitragen werden, ME-Compiler zu verbessern.
Ich habe zusätzliche Daten von ForumsmitgliedFast528 erhalten(derzeit nicht in der Lage, im Forum zu posten)
Ryzen 2700 nicht übertaktet, Speicher 3333
Tree_Brut_TestPL 8 Kerne 16 Threads
Tree_Brut_TestPL_F8 Kerne 16 Threads
Dieser Test ist nicht vollständig, da wir aufgrund der Aktivierung von 8 Agenten eine Variante mit 8 Kernen und 8 Threads benötigen und auch 16 Durchläufe in der Registerkarte "Optimierung" angegeben werden sollten - entsprechend der Anzahl der Threads (Start 0, Step 1, Stop 15).
Wenn Sie den Test erneut ausführen, vergessen Sie nicht, den Cache zu löschen, der sich unter ..\Tester\cache
Ich werde die Zwischenergebnisse als 8 Kerne / 8 Agenten in die Tabelle eintragen.
Leider kann ich den ersten Beitrag nicht mehr bearbeiten, deshalb poste ich die Bewertung hier
Hier ist das Ergebnis des fx8320e Frequenz 4GHz, Speicher 1866 2 Kanäle, Rang 2.
Baum_Brut_TestPL_F_Fast
4 Agenten 8 Pässe
8 Agenten 8 Pässe
8 Agenten fast 2x schneller
Hier ist das Ergebnis des fx8320e Frequenz 4GHz, Speicher 1866 2 Kanäle, Rang 2.
Baum_Brut_TestPL_F_Fast
4 Agenten 8 Pässe
8 Agenten 8 Pässe
8 Agenten fast 2x schneller
Danke, aber fügen Sie die Ergebnisse von Tree_Brut_TestPL_F und Tree_Brut_TestPL zur Auswertung hinzu!