OpenCl和它的工具。评论和印象。 - 页 5 123456789101112...29 新评论 Andrey Dik 2012.01.29 11:29 #41 Mathemat: 很好,这将为比较MQL和C/C++提供一个基础。我只是提供了事实。而且,无论如何,我到底为什么要做托马斯的信徒? 在神经上可能会有更多的差异,这一点没有争议。 还有,我想看看你的 "公正的事实",顺便说一下。 我的 "公正的事实 "就在那里。"几乎"--因为我挖出了我以前测试的来源。我将对它们进行一些更新,然后我将把来源与测试结果以表格的形式发布在这里。 Sceptic Philozoff 2012.01.29 11:34 #42 joo: 还有,我想看看你的 "公正的事实",顺便说一下。 就在这里。见我在该页的第二个帖子。 顺便说一句,你已经用链接回复了我的帖子。上面的C语言代码可以很容易地在MQL4中进行重做。请看附件。 附加的文件: pi.mq4 1 kb Andrey Dik 2012.01.29 11:42 #43 Mathemat: 就在这里。见我在该页的第二个帖子。 顺便说一下,你已经用链接回复了我的帖子。上面的C语言代码很容易为MQL4重新制作。请看附件。 请把测试结果做成表格,贴在这里,这样,读这个主题的人就不必跳过这些链接了。 TheXpert 2012.01.29 12:15 #44 AlexEro: 我在私信中给你发了这些庞然大物的图片链接--不是为了迎合职业学校学生的数字******。 来吧,相信我,你的照片不会改变他们在这里的数字,哪怕是一个百分比。来吧,发布它。 但它能持续多久呢?在一个好的方面,你应该为这样的装备安装一个好的冷却装置,比如说水冷,就像下一张图片那样。 Sceptic Philozoff 2012.01.29 12:23 #45 joo: 请把测试结果写成表格,贴在这里,这样,读这个主题的人就不必跳过这些链接了。 这不是一张桌子。几张照片。 在不同的编译设置下对parallelpi_x.cpp程序进行测试。当与MQL4比较时,只有第一个结果是重要的:6.723秒。 这里没有使用加速器(SSE*,IPP,OML)。 但是,如果有人想自慰,看看启用加速器后,结果是如何变化的,下面的附件是一个带有编译的EA和所需的并行库的档案。你所需要的是把它们都放在一个目录下,然后从命令行运行。 当然,这些结果并不代表对显卡阵列上的怪物的任何竞争。 用MQL4重写的同一程序。 结果是:22.98秒,也就是3.4倍。但那里没有关于阵列的工作,而对我们来说,这可能是至关重要的。附上该脚本的代码。 附加的文件: release.zip 278 kb pi_1.mq4 1 kb Andrey Dik 2012.01.29 19:52 #46 joo: MQL5比MQL4快20倍。 C++比MQL5快6倍(当使用自动并行化执行的库时)。 总计:20*6=120次。 如果你使用GPU计算,它将会更快。 总计:10/120=0.083c。 类似这样的事情。 所以,大张旗鼓地宣传!擂台上有四个不同的编译器,竞争的是...来进行编译。 嗯,这当然是个笑话。但说真的,已经写了六个测试。结果显示在下面的表格中。而评论则更低。:) #测试 描述 可执行名称 测试结果,s 1Ex5脚本和Ex5库1 MLP MQL编译器.ex597.2 2Ex5脚本和C++ dll库,MS编译器,所有优化功能都被禁用2 MLP MS编译器nonOpt.ex542.6 3Ex5脚本和C++ dll库,MS编译器,所有的优化功能都在3 MLP MS 编译器 Opt.ex527.1 4Ex5脚本和C++ dll库,英特尔编译器,包括所有优化功能4 MLP英特尔编译器.ex512.5 5Ex4脚本和Ex4库5 MLP MQL4编译器.ex4669.6 6Ex4脚本和C++ dll库,英特尔编译器,所有优化功能已启用6 MLP MQL4英特尔编译器.ex410.7 作为测试重计算,使用了4层神经网络MLP 80-100-100-10,设计为可插拔库ex4、ex5和dll。 我们看到,。 - 连接的ex5库和ex4库的结果相差6.8倍(1次和5次测试)。 - 连接的eX5库和英特尔编译器的dll库的结果相差7.8倍(1和4个测试)。 - 连接eX4库和英特尔编译器的dll-库的结果相差62.5倍(测试5和6) 结论。 当然,关于MQL4和MQL5之间20倍的差异,我有点夸大其词。在密集使用二维数组的情况下,会出现这样的差异(我记得这个数字是在我脑海中出现的),但我太懒了,不能为这个具体的特征专门调整测试(此外,它不会对应于 "重 "计算的典型案例--典型案例在测试中呈现),因此,你可以相信我的话或自己写一个测试。因此,我们可以谈论MQL4和MQL5之间6.8倍的速度差异,MQL4和C++之间62.5倍的差异。 而我对这一事实感到气馁--Ahtung!-调用dll的MQL4脚本比使用相同dll的MQL5脚本工作得更快。它是什么意思?- 我检查了它,运行了几次,没有错误。开发者似乎已经说过,与MT4相比,MT5已经优化了dll调用。要么是构建的特殊性(MT5 574和MT4 409)和测试不完全正确,要么是...我不知道。 谁需要它,可以使用grid(4或6个测试的编译dll - 非常快的grid),来源附后。每层中的神经元数量是可配置的。但优化器(4和5)不支持超过64个参数,此外,你必须使用一个大的步骤,所以这个怪物(如在测试中,80-100-100-10,19210个参数要优化!)不能用标准手段来训练,你必须使用自定义优化算法。顺便说一下,为此(不仅如此)我决定做一个付费工具(当然会在商店 里),它将允许使用4步和5步自定义优化器来训练无限数量的参数,甚至0步。 附加的文件: tests_mlp.zip 71 kb OpenCl and the tools Sceptic Philozoff 2012.01.29 20:39 #47 这很有说服力,朱,甚至非常有说服力。但有两点。 首先,当由MS编译时,即使是最好的结果(选项3)也比选项1好不到4倍。 第二,我不相信英特尔的全包式编译器比MS好2倍以上。所以你启用了英特尔的更多优化功能。 在任何情况下--令人印象深刻。等到桌子被填满的时候,就可以结束了。 现在我知道这些显卡阵列的作用了:在每一个 刻度上进行这些计算!这就是为什么我在这里看到的是一个个的视频。 Andrey Dik 2012.01.30 05:58 #48 Mathemat: 第二,我不相信英特尔的全包式编译器比MS的编译器好两倍以上。因此,英特尔启用了更多的优化功能。 有哪些--所有的都有。使用一个编译器而不使用它的所有功能是没有意义的--鱼儿寻找最深的地方,而程序员则寻找最好的编译器。在这个意义上,来自MQ的编译器并不是定制的,所以我们可以假设它们是经过优化调整的。 [删除] 2012.01.30 06:01 #49 而且,我对这一事实感到灰心,阿克纠!-调用dll的MQL4脚本比使用相同dll的MQL5脚本工作得更快...它是什么意思?- 我检查了它,运行了几次,没有错误。开发者似乎已经说过,与MT4相比,MT5已经优化了dll调用。要么是构建的特殊性(MT5 574和MT4 409)和测试不完全正确,要么是...我不知道。 谢谢你,这很能说明问题,也很能说明问题。 我想我们不应该如此比较个别的百分比:因为悬浮 计算机的 CPU速度(好吧,如果你以百万赫兹兆赫,或千兆赫兹,吉赫)......为零。 当速度差异约为10-20%时,更关注程序及其环境的可靠性和错误处理是有意义的。例如,当使用在MSC中制作的DLL时,你应该注意它是如何与MSVCRT.DLL链接的,是什么版本,因为它必须在复杂的terminal.exe进程的环境中和MSVCRT.DLL初始化块的环境中工作,不同的版本可能不同,等等。对于DLL中的正常错误处理,MetaTrader建立(并监控)了一连串的异常,这本身就拖慢了整个系统和调用DLL等等。 关于神经元速度的问题。 这里有一个人把FANN神经网络库翻译成OpenCL,并声称在平均GTX285卡上有20倍的加速。 "在我目前的GPU(GeForce 9500 GT)上,我在普通版本和OpenCL版本之间得到的速度大致相同。我目前正在订购GTX285,它的速度应该至少是10倍。使用现代GPU,如GTX 480,我预计它至少比我的2.26GHz Nehalem Mac Pro快20倍。" ... "是的,新卡(GTX285)运行内核的速度快了大约20倍。" http://leenissen.dk/fann/forum/viewtopic.php?f=2&t=658&start=0 http://leenissen.dk/fann/wp/ Vladimir Gomonov 2012.01.30 21:31 #50 当然,几乎每个人都去过那里。 对于不访问mql5.com的狂热的B4粉丝:OpenCL:MQL5的内部实现测试 然而,几乎在那里。 我怀疑它对使用其他平台的自动交易商将非常有吸引力。 123456789101112...29 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
很好,这将为比较MQL和C/C++提供一个基础。我只是提供了事实。而且,无论如何,我到底为什么要做托马斯的信徒?
在神经上可能会有更多的差异,这一点没有争议。
还有,我想看看你的 "公正的事实",顺便说一下。
我的 "公正的事实 "就在那里。"几乎"--因为我挖出了我以前测试的来源。我将对它们进行一些更新,然后我将把来源与测试结果以表格的形式发布在这里。
就在这里。见我在该页的第二个帖子。
顺便说一句,你已经用链接回复了我的帖子。上面的C语言代码可以很容易地在MQL4中进行重做。请看附件。
就在这里。见我在该页的第二个帖子。
顺便说一下,你已经用链接回复了我的帖子。上面的C语言代码很容易为MQL4重新制作。请看附件。
我在私信中给你发了这些庞然大物的图片链接--不是为了迎合职业学校学生的数字******。
来吧,相信我,你的照片不会改变他们在这里的数字,哪怕是一个百分比。来吧,发布它。
但它能持续多久呢?在一个好的方面,你应该为这样的装备安装一个好的冷却装置,比如说水冷,就像下一张图片那样。
请把测试结果写成表格,贴在这里,这样,读这个主题的人就不必跳过这些链接了。
这不是一张桌子。几张照片。
在不同的编译设置下对parallelpi_x.cpp程序进行测试。当与MQL4比较时,只有第一个结果是重要的:6.723秒。 这里没有使用加速器(SSE*,IPP,OML)。
但是,如果有人想自慰,看看启用加速器后,结果是如何变化的,下面的附件是一个带有编译的EA和所需的并行库的档案。你所需要的是把它们都放在一个目录下,然后从命令行运行。
当然,这些结果并不代表对显卡阵列上的怪物的任何竞争。
用MQL4重写的同一程序。
结果是:22.98秒,也就是3.4倍。但那里没有关于阵列的工作,而对我们来说,这可能是至关重要的。附上该脚本的代码。
MQL5比MQL4快20倍。
C++比MQL5快6倍(当使用自动并行化执行的库时)。
总计:20*6=120次。
如果你使用GPU计算,它将会更快。
总计:10/120=0.083c。
类似这样的事情。
所以,大张旗鼓地宣传!擂台上有四个不同的编译器,竞争的是...来进行编译。
嗯,这当然是个笑话。但说真的,已经写了六个测试。结果显示在下面的表格中。而评论则更低。:)
作为测试重计算,使用了4层神经网络MLP 80-100-100-10,设计为可插拔库ex4、ex5和dll。
我们看到,。
- 连接的ex5库和ex4库的结果相差6.8倍(1次和5次测试)。
- 连接的eX5库和英特尔编译器的dll库的结果相差7.8倍(1和4个测试)。
- 连接eX4库和英特尔编译器的dll-库的结果相差62.5倍(测试5和6)
结论。
当然,关于MQL4和MQL5之间20倍的差异,我有点夸大其词。在密集使用二维数组的情况下,会出现这样的差异(我记得这个数字是在我脑海中出现的),但我太懒了,不能为这个具体的特征专门调整测试(此外,它不会对应于 "重 "计算的典型案例--典型案例在测试中呈现),因此,你可以相信我的话或自己写一个测试。因此,我们可以谈论MQL4和MQL5之间6.8倍的速度差异,MQL4和C++之间62.5倍的差异。
而我对这一事实感到气馁--Ahtung!-调用dll的MQL4脚本比使用相同dll的MQL5脚本工作得更快。它是什么意思?- 我检查了它,运行了几次,没有错误。开发者似乎已经说过,与MT4相比,MT5已经优化了dll调用。要么是构建的特殊性(MT5 574和MT4 409)和测试不完全正确,要么是...我不知道。
谁需要它,可以使用grid(4或6个测试的编译dll - 非常快的grid),来源附后。每层中的神经元数量是可配置的。但优化器(4和5)不支持超过64个参数,此外,你必须使用一个大的步骤,所以这个怪物(如在测试中,80-100-100-10,19210个参数要优化!)不能用标准手段来训练,你必须使用自定义优化算法。顺便说一下,为此(不仅如此)我决定做一个付费工具(当然会在商店 里),它将允许使用4步和5步自定义优化器来训练无限数量的参数,甚至0步。
这很有说服力,朱,甚至非常有说服力。但有两点。
首先,当由MS编译时,即使是最好的结果(选项3)也比选项1好不到4倍。
第二,我不相信英特尔的全包式编译器比MS好2倍以上。所以你启用了英特尔的更多优化功能。
在任何情况下--令人印象深刻。等到桌子被填满的时候,就可以结束了。
现在我知道这些显卡阵列的作用了:在每一个 刻度上进行这些计算!这就是为什么我在这里看到的是一个个的视频。
第二,我不相信英特尔的全包式编译器比MS的编译器好两倍以上。因此,英特尔启用了更多的优化功能。
而且,我对这一事实感到灰心,阿克纠!-调用dll的MQL4脚本比使用相同dll的MQL5脚本工作得更快...它是什么意思?- 我检查了它,运行了几次,没有错误。开发者似乎已经说过,与MT4相比,MT5已经优化了dll调用。要么是构建的特殊性(MT5 574和MT4 409)和测试不完全正确,要么是...我不知道。
谢谢你,这很能说明问题,也很能说明问题。
我想我们不应该如此比较个别的百分比:因为悬浮 计算机的 CPU速度(好吧,如果你以百万赫兹兆赫,或千兆赫兹,吉赫)......为零。
当速度差异约为10-20%时,更关注程序及其环境的可靠性和错误处理是有意义的。例如,当使用在MSC中制作的DLL时,你应该注意它是如何与MSVCRT.DLL链接的,是什么版本,因为它必须在复杂的terminal.exe进程的环境中和MSVCRT.DLL初始化块的环境中工作,不同的版本可能不同,等等。对于DLL中的正常错误处理,MetaTrader建立(并监控)了一连串的异常,这本身就拖慢了整个系统和调用DLL等等。
关于神经元速度的问题。
这里有一个人把FANN神经网络库翻译成OpenCL,并声称在平均GTX285卡上有20倍的加速。
"在我目前的GPU(GeForce 9500 GT)上,我在普通版本和OpenCL版本之间得到的速度大致相同。我目前正在订购GTX285,它的速度应该至少是10倍。使用现代GPU,如GTX 480,我预计它至少比我的2.26GHz Nehalem Mac Pro快20倍。"
...
"是的,新卡(GTX285)运行内核的速度快了大约20倍。"
http://leenissen.dk/fann/forum/viewtopic.php?f=2&t=658&start=0
http://leenissen.dk/fann/wp/
当然,几乎每个人都去过那里。
对于不访问mql5.com的狂热的B4粉丝:OpenCL:MQL5的内部实现测试
然而,几乎在那里。
我怀疑它对使用其他平台的自动交易商将非常有吸引力。