交易中的机器学习：理论、模型、实践和算法交易

mytarmailS 2022.10.28 15:56 #28061

Aleksey Vyazmikin #:

我把它换了一下，似乎没什么问题。

.

Aleksey Vyazmikin 2022.10.28 21:28 #28062

mytarmailS #:

.

你的脚本在我的样本上消耗了将近 9GB 内存，但它似乎还能工作，文件也保存了下来。我甚至不知道内存消耗在哪里，而样本只占用了 1GB 多一点。

Aleksey Vyazmikin 2022.10.28 23:15 #28063

mytarmailS #:

.

我还发现，表格中的标题（列名）是用引号保存的，如何关闭？

Maxim Dmitrievsky 2022.10.29 04:05 #28064

这段代码要做什么？要想更快，您应该将所有列转换为相同的数据类型（浮点 32、16 - 没必要，这样会更慢），并通过快速数组计算 coRRR。

如果我们讨论的是 kaRma 的实际修正

mytarmailS 2022.10.29 07:30 #28065

Aleksey Vyazmikin #:

在我的样本上，你的脚本消耗了将近 9GB 内存，但它似乎还能工作，文件也保存了下来。我甚至不知道内存用在了哪里，而样本只占用了一千兆字节多一点。

所以呢？

可能是 R 坏了）

Aleksey Vyazmikin#:

我还发现了一个问题--表格中的标题（列名）用引号保存--如何关闭？

您是如何解决这个问题的？

Aleksey Vyazmikin 2022.10.29 08:58 #28066

mytarmailS #:

那又怎样？

我想，R 是不好的）。

你是怎么解决问题的？

坏/好的判断太关键了。

很明显，软件包代码的内存效率不高，但速度可以很快，或者脚本多次复制整个 table/selection。

而你所做的--你发现了问题，并向专业人士报告，希望得到帮助。

Aleksey Vyazmikin 2022.10.29 09:01 #28067

Maxim Dmitrievsky #:

这段代码要做什么？为提高速度，应将所有列转换为相同的数据类型（浮点 32、16 - 不需要，速度会变慢），并使用快速数组计算列数。

如果我们谈论的是 kaRma 的实际修正

据我所知，R 中根本没有不同数据类型（int、float 等）的概念。而且，这会减少内存大小，但对速度影响不大。在显卡上，是的，会有所增加。

Maxim Dmitrievsky 2022.10.29 09:05 #28068

Aleksey Vyazmikin #:

据我所知，在 R 中没有不同数据类型（int、float 等）的概念。而且，这会减少内存大小，但对速度影响不大。在显卡上，是的，会有增加。

一切都在那里。这将对速度产生灾难性的影响。数据帧是速度最慢、开销最大的 "野兽"。

这与显卡无关，关键是要明白，在清醒状态下，数据帧是不计成本的。

mytarmailS 2022.10.29 09:16 #28069

Aleksey Vyazmikin #:

提示：是否有必要使用 100,000 个观测值的向量来查看它们之间的相关性？

我正在寻找高度相关的向量，即相关性大于 0.9。

mytarmailS 2022.10.29 11:41 #28070

不客气

交易中的机器学习：理论、模型、实践和算法交易 - 页 2807