交易中的机器学习:理论、模型、实践和算法交易 - 页 3196

 
Maxim Dmitrievsky #:
你是做什么的?你的背景是什么? 是什么让你干这行的?

男人为自己的快乐而活不要干涉他的生活方式

 
Maxim Dmitrievsky #:
包括 )

这是主题的延续

关于交易、自动交易系统和交易策略测试的论坛

交易中的机器学习:理论、模型、实践和算法交易

Aleksey Nikolayev, 2023.08.17:45 PM

我建议修改我的实验。假设有十个盒子,里面装有从 1 到 10 的数字、一百个白球和一百个黑球(数字 10 和 100 按常规取值)。这些球以某种方式排列在盒子里,然后你看看每个盒子里有多少球,并试着了解排列算法是否有规律可循--在哪个数字的盒子里,某种颜色的球占多数。

因此,如果每个球(两种颜色的球)都以 0.1 的概率随机地放在其中一个抽屉里,那么最终颜色的比例是不均匀的!几乎总是会有一个盒子里几乎全是白色,而另一个盒子里几乎全是黑色。问题根本不在于 DSP 的质量,你可以使用真正的量子 DSP,一切都会是一样的。这与概率随机性的本质有关。不规则性总是存在的,但在下一次布局中发现不规则性的盒子数量是绝对不可预测的。上一个例子中的星期几也是如此(星期几与方格数类似)。

有两种方法可以解决这个问题。一是试图证明实际中的不均匀性比等概率情况下的不均匀性要大得多。这可以通过某种统计检验来实现。或者只是确定不均匀性虽然很小,但却是由于某种规律性造成的,只是由于噪音而表现得很微弱。但这是信仰和实践的问题,如果可行,那就没问题。

我希望大家清楚,方框数字(星期几)是对你们的量子的一种类比。


 
Aleksey Vyazmikin #:

这是一个主题的延续

为什么需要更改目标?

您需要对原始的洗牌序列进行多次变异,然后计算出新的目标。

然后运行 10k 次模拟,查看最佳平均四分位数,并与原始四分位数进行比较。


平均而言,最佳平均四分位数将是最好的。
 
СанСаныч Фоменко #:

SanSanych,你的 mt-R 软件包有可能在 Linux 下运行吗?我指的是两种可能的 R 安装方式--直接在 Linux 中安装和通过 wine 安装(我还没试过这种方式)。

我感兴趣的原因是他们将关闭俄罗斯的窗口。

 
Aleksey Nikolayev #:

SanSanych,你的 mt-R 软件包有可能在 Linux 下运行吗?我指的是两种可能的 R 安装方式--直接在 Linux 中安装和通过 wine 安装(我还没试过这种方式)。

我感兴趣的原因是他们将关闭俄罗斯的窗口。

与其他方案相比,该软件包有哪些优势?

 
Maxim Dmitrievsky #:

为什么要改变目标

您需要从原始的洗牌数列中提取许多变量,并为它们计算出新的目标。

然后运行 10k 次模拟,查看平均较好的四分段,并与原始目标进行比较。


平均而言,最好的平均qua 切分将是最好的。

你没搞清楚上下文--你说的不是这个。

如果按照你的想法,你从哪里得到 10k - 你想要那么多时间序列吗?这太多了--不合理。

还有另一种选择--使用其他工具并在那里进行尝试,看看量化分段的有效百分比。

这将突出不同工具的共同模式。

 
Aleksey Vyazmikin #:

你搞不清楚上下文--那是关于别的事情的。

如果是关于你的想法,你从哪里得到 10k - 你想要这么多时间序列吗?太多了--这不理性。

还有另一种选择--使用其他工具并在那里进行尝试,看看有多少百分比的量子细分仍然有效。

这将突出不同工具的共同模式。

为什么要使用不同的工具?

你可以做得少一些,这没有什么区别,但也不能太少(少的程度由直觉和经验决定)。

模拟次数越多,结果越平均。偏差是权衡的一种变体。

也就是说,当模拟次数达到某个临界值时,quatraffic 在提取利润方面将不再有用,而是过于平均。也就是说,它们将获得大致相同的重要性。前提是市场真的是随机的。如果到了这个阶段,你就会真正认为市场是随机的。或者说,你的芯片价值捆绑是低效的。

将是一个健康人的正常蒙特卡洛 )

 
Aleksey Nikolayev #:

SanSanych,你的 mt-R 软件包有可能在 Linux 下运行吗?我指的是两种可能的 R 安装方式--直接在 Linux 中安装和通过 wine 安装(我还没试过这种方式)。

我感兴趣的原因是他们将关闭俄罗斯的窗口。

该软件包使用的是 dlls。
我查阅了相关新闻--我只看到了一年前关于下载 W10 和 W11 发行版的限制,以及 2022 年底的取消限制。是否有更新?
 
Maxim Dmitrievsky #:

我不需要其他的,你可以用一个

你可以少一点,没关系,但不能太少(少的程度由直觉和经验决定)。

模拟越多,结果越平均。偏差是 traidoff 的一种变体。

也就是说,当模拟次数达到某个临界值时,四则运算在提取利润方面就不再有用了,因为它们太平均了。前提是市场是真正随机的。如果到了这个阶段,你就会真正认为市场是随机的。那么,或者你的芯片符号捆绑是低效的。

将是一个健康人的正常蒙特卡洛 )

根据我的理解,您的建议实质上如下:

  1. 在原始样本上找到量化区段,并在其上为整个样本创建一个量化网格。
  2. 创建一个与原始样本特征相似的 n 次符号。
  3. 根据生成符号的数量制作样本。
  4. 使用第 1 点的表格,在 n 个样本上搜索量子片段。
  5. 计算相对于原始样本,在生成的样本中发现了多少量子片段。

也许我可以做几十个样本,但是:

1.我不知道如何生成与原始符号 真正相似的符号 -- 没有工具。

2.如果 "命中 "的数量很多,如果很少,您打算如何解释量子片段的范围?

 
Forester #:
该软件包使用的是 dlls。 翻阅新闻,我只看到一年前对下载 W10 和 W11 发行版的限制,以及 2022 年底取消限制的消息。是否有更新?

他们说企业客户将通过密钥关闭激活功能。