DF 013:27:26.728 Core 4 pass 6 returned result 1001000.00in0:00:28.342
HL 013:27:26.732 Core 1 pass 2 returned result 1001000.00in0:00:28.414
PE 013:27:26.844 Core 3 pass 4 returned result 1001000.00in0:00:28.476
PJ 013:27:26.936 Core 2 pass 0 returned result 1001000.00in0:00:28.619
QP 013:27:53.132 Core 4 pass 7 returned result 1001000.00in0:00:26.406
KI 013:27:53.219 Core 1 pass 3 returned result 1001000.00in0:00:26.489
MN 013:27:53.337 Core 3 pass 5 returned result 1001000.00in0:00:26.495
ND 013:27:53.571 Core 2 pass 1 returned result 1001000.00in0:00:26.637
OR 013:27:53.571 Tester optimization finished, total passes 8
OF 013:27:53.582 Statistics optimization done in0 minutes 57 seconds
PI 013:27:53.582 Statistics shortest pass 0:00:26.406, longest pass 0:00:28.619, average pass 0:00:27.484
NM 013:27:53.582 Statistics 8000 frames (3.14 Mb total, 412 bytes per frame) received
HL 013:27:53.582 Statistics local 8 tasks (100%), remote 0 tasks (0%), cloud 0 tasks (0%)
8家代理公司8次通过
DI 013:30:59.789 Core 2 pass 1 returned result 1001000.00in0:00:33.072
KN 013:30:59.887 Core 1 pass 0 returned result 1001000.00in0:00:33.177
PD 013:31:00.132 Core 3 pass 2 returned result 1001000.00in0:00:33.422
PM 013:31:00.245 Core 4 pass 3 returned result 1001000.00in0:00:33.531
RR 013:31:00.590 Core 8 pass 7 returned result 1001000.00in0:00:32.922
IH 013:31:00.615 Core 5 pass 4 returned result 1001000.00in0:00:33.197
CQ 013:31:00.981 Core 6 pass 5 returned result 1001000.00in0:00:33.506
GF 013:31:01.111 Core 7 pass 6 returned result 1001000.00in0:00:33.614
CS 013:31:01.111 Tester optimization finished, total passes 8
KG 013:31:01.122 Statistics optimization done in0 minutes 35 seconds
RN 013:31:01.122 Statistics shortest pass 0:00:32.922, longest pass 0:00:33.614, average pass 0:00:33.305
NO 013:31:01.122 Statistics 8000 frames (3.14 Mb total, 412 bytes per frame) received
HJ 013:31:01.122 Statistics local 8 tasks (100%), remote 0 tasks (0%), cloud 0 tasks (0%)
BMI2(对BMI1的补充)。
由于MPX和SGX是关于保护的,我大胆猜测,编译器积极使用BMI2指令/技术,并且有TSX的影响,这不太可能。
一张卡上的OpenCL先验地比多个处理器的效率高得多。
并且忘记比较处理器的这种麻烦。
但是,是的,你必须弄清楚如何为OpenCL写代码。
我真的不能说它的信息量有多大--我一直在努力自己去读它。
Alexey,我认为学习如何编写OpenCL代码并为此获得一块好卡会更有效率。 而忘记比较处理器的这种麻烦。但是,是的,你必须弄清楚如何为OpenCL写代码。我真的不能说它的信息量有多大--我一直在努力自己去读它。
用OpenCL写不是那么容易的,我研究了一下理论,用OpenCL技术做一个代理比较容易,不像现在,在消费者方面比较容易。
然后,OpenCL并不总是有效的,所以我在软件上比较从Yandex(CatBoost)卡1060和FX-8350处理器 - 事实证明,处理器是两倍快,如果这种趋势是经济上更有利可图,购买一个强大的处理器比五个1080i,从这肯定会有一个效果,但昂贵...一般来说,这不是明确的,也不是每个人的解决方案。
然后,我认为在编译器中,你可以简单地禁用对最新技术的支持,对于老手来说,一切都会工作得更快,选项是禁用的。用OpenCL写不是那么容易的,我研究了一下理论,用OpenCL技术做一个代理比较容易,不像现在,在消费者方面比较容易。
然后,OpenCL并不总是有效的,所以我在软件上比较从Yandex(CatBoost)卡1060和FX-8350处理器 - 事实证明,处理器是两倍快,如果这种趋势是经济上更有利可图,购买一个强大的处理器比五个1080i,从这肯定会有一个效果,但昂贵...一般来说,这不是明确的,也不是每个人的解决方案。
对于数学计算,绿色的不是特别适合。
红色的更适合做数学题,它们甚至有一个数学模式作为标准,可以通过官方应用程序进行设置。
我有一个老的Radeon 7970参考,它仍然支持采矿。这并不是说我在一张卡上挖矿,不,这是不赚钱的,而是说它拉开了计算的序幕。
对于卡上的数学计算,你需要看着色器的数量,越多越好,其余的fps等并不重要,最重要的是着色器块。
对于数学计算,绿色的不是特别适合。
对于数学来说,红色的更好。 他们甚至有一个数学模式作为标准,可以通过官方应用程序进行设置。
我有一个老的Radeon 7970参考,它仍然支持采矿。这并不是说我在一张卡上挖矿,不,这并不赚钱,而是说它拉开了计算的序幕。
对于卡上的数学计算,你需要看着色器的数量,越多越好,其余的fps等并不重要,最重要的是着色器块。
据我所知,红色的人只是知道如何与双倍的人合作,绿色的人不知道--我知道。但是,在机器学习(CatBoost)中,有一个关于比较操作的锐化,按照想法,它应该像红色和绿色那样快速工作。而且红色不被CatBoost支持,唉。
在任何情况下,我不能自己做,而找到它的艺术家也不是那么容易的,要有足够的价格和理解。
有人向我建议,可以通过使用开关枚举来加快代码的速度。
以前是这样的。
而现在是这样的。
根据最初的估计,FX-8350的速度要快30%,但Phenom II处理器的速度要快3倍左右!我将在以后机器没有优化的时候进行比较测试。
我附上新版本的Tree_Brut_TestPL专家顾问,我在它的名字中加入了"_Fast"。 请也测试一下,因为知道在什么架构上会有收益是非常有趣的。人们希望这些研究将有助于改进ME编译器。
我从论坛成员Fast528(目前无法在论坛上发帖) 那里得到了额外的数据
Ryzen 2700未超频,内存3333
Tree_Brut_TestPL 8核16线程
Tree_Brut_TestPL_F8核 16线程
这个测试是不完整的,因为我们需要一个具有8个核心和8个线程的变体,由于激活了8个代理,还应该在 "优化 "选项卡中指定16个通道--根据线程的数量(开始0,步骤1,停止15)。
当再次运行测试时,不要忘记清除缓存,它位于./Tester/cache中。
我将暂时把中间结果添加到表中,作为8个核心/8个代理。
不幸的是,我不能再编辑第一篇文章,所以我在这里发布评分。
下面是fx8320e频率4GHz,内存1866 2通道,等级2的结果。
树_Brut_TestPL_F_Fast
4个代理8个通过
8家代理公司8次通过
8个代理几乎快了2倍
下面是fx8320e频率4GHz,内存1866 2通道,等级2的结果。
树_Brut_TestPL_F_Fast
4个代理8个通过
8家代理公司8次通过
8个代理几乎快了2倍
谢谢,但要加上Tree_Brut_TestPL_F和Tree_Brut_TestPL的评估结果 !