交易中的机器学习:理论、模型、实践和算法交易 - 页 3005 1...299829993000300130023003300430053006300730083009301030113012...3399 新评论 mytarmailS 2023.04.07 22:56 #30041 Maxim Dmitrievsky #: 这是在呼吁大家在把初始数列转化为图形、量子、水平、正弦或其他你发明的东西之前先思考一下。 问题设置不正确,我在这里已经说了很久,上一次是在 10-20 页之前,所以没什么好教的,我自己完全明白一切......要转换任务,就必须转换数据...所以,当你让我考虑的时候,我已经考虑过了,我正在考虑我的选择。 Maxim Dmitrievsky 2023.04.08 00:14 #30042 mytarmailS #: 事实上,任务的设置并不正确,这一点我在这里已经说了很久,上一次是在 10-20 页之前,所以好像没有什么可以教我的,我完全明白一切.....。要转换任务,就必须转换数据...所以,当你让我思考的时候,我已经想好了,我正在浏览选项。 同样,你会得到记忆,而不是概括。 Aleksey Vyazmikin 2023.04.08 01:38 #30043 Maxim Dmitrievsky #: 如果数据中存在恒定的信号,则几乎立即意味着泛化,而噪声则会导致错误。如果没有信号,就会出现记忆化,即分类错误仅仅是重叠了具有不同标签和相同特征值的样本。第二个模型没有预测价值。这就是我提出的问题的答案。 在有模式(小波、小形状等)但没有信号的情况下,只有分为训练有素和未经训练两种模式才能起作用。可训练的被分类,不可训练的被过滤。在这里,良好的记忆可以起到过滤的作用,而泛化则是模式的泛化。 当没有明显的持续模式(如市场),但存在低效率时,方法必须更加精细,因为低效率不一定能用模式来描述。在这种情况下,你必须从中找出一个:哪些需要记住,哪些需要归纳。算法。 对数据进行转换会改变其表现形式,但本身并不能解决问题,因为最终要交易的是原始数据序列。 规律具有浮动概率,可能是周期性的,也可能完全消失。我工作的时间范围很大,也观察到了这些现象。 我想说的是,有可能训练出一个 2008-2017 年(10 年)的模型,它可以一直运行到今天。这样一个模型的信号会很少--召回率最多不超过 30%,但这也说明,10 年中能在未来几年(测试样本)发挥作用的模式很少。 但究竟是哪种模式--周期性的还是一次性的(也许周期为数十 年)--目前还无法确定,因此也就不可能选择一种持续有效的模式。 理想情况下,有必要找到至少每 3 个月出现一次的周期性模式,这样我们就可以期望模型能够摆脱缩减。 根据不同的周期模式训练出的一揽子此类模型将减少缩减。 因此,重要的是初始信号 + 目标 + 相对于目标具有周期性正规律的预测因子。 你的方法--摇晃和筛选--类似于探矿者的工作--当然,你可以找到很多有趣的和没有学到的东西,但你怎么能确定这些东西会是稳定的呢? 我喜欢自己破解日期,我有这方面的想法,但现在我想朝着提高模型稳定性概率的方向挖掘。 Maxim Dmitrievsky 2023.04.08 01:44 #30044 Aleksey Vyazmikin #:你的方法--摇晃和筛选--就像一个探矿者的工作--当然你可以找到很多有趣的和没有学到的东西,但如何确保它的稳定性呢?我自己喜欢 "摇枣",也有这方面的想法,但现在我想朝着提高模型稳定性概率的方向挖掘。 我写了一个基本的理解,如果没有这个理解,就根本不值得做任何事情。如果只是为了确认每一点的话(如果你第一次没有理解的话 🙂 )要验证稳定性,就必须进行测试、测试和更多的测试,除此之外别无他法。MO 最适合做这个。因为理论界的抱怨者们显然连 MO 的基本原理都不懂,就大谈特谈 tsos 和其他废话。这种娱乐不适合精神和道德上的弱者,发牢骚更容易:)。 Aleksey Vyazmikin 2023.04.08 02:09 #30045 Maxim Dmitrievsky #: 我写了一个基本的理解,没有它就根本不值得做任何事情。如果只是为了确认每一点的话(如果你第一次没有理解的话 🙂) 要验证稳定性,就必须进行测试、测试和更多的测试,除此之外别无他法。MO 最适合做这个。 我对您的描述和方法总体上没有异议--我自己也在很久以前对其进行了本质上的描述,尽管实现方式不同。 我的人工实验表明,通常情况下,只要抽取出具有 10 个简单规律性的行(在我的案例中,就是预测值下降的量子段),整个样本的概率就会向 1 的方向移动 15-20%,而样本则会减少 35%。机器学习方法无法实现这一点。从本质上讲,这是对无用/矛盾数据的剔除。但我们想在更接近当前日期的情况下做到这一点,即不是通过统计了解历史,而是通过一些方法只选择虚假/矛盾的模式。 如果我们设定一个任务,根据这个任务,模型应该在任何仪器上都能工作,那么测试是可能的,但这样稳定的模式就更少了。而只是在历史中狂奔,或者更糟糕的是,进行合成--我不认为这是有效的。顶多是可以通过洗日的方式从每日增量中提取合成数据,但我还没有这种能力。您尝试过吗? Aleksey Nikolayev 2023.04.08 04:18 #30046 mytarmailS #: 我完全不懂,但我想知道价格是否可以用图表来表示,与通常的二维表示法相比是否有任何优势。 谁知道这方面的情况? 您可以将曼德尔布罗特(Mandelbrot)的价格表示法视为三元树森林,其中每一步棋都分为三步(同方向的两步棋和两步棋之间的修正)。 这样做的好处是可以收集有关价格分形结构的统计数据。缺点是算法复杂,难以避免瞻前顾后。 Slava 2023.04.08 06:55 #30047 Stanislav Korotky #:这与我上面举的 "并行 "平台的矩阵和例子有什么关系?例如,我从 keras 的链接中获取矩阵,并调用它们:并得到零。 对照示例不适合。 分类交叉熵用于有两个以上类别的分类模型。而在 softmax 之后。Softmax 将一组值转换为一组概率,其总和为 1。 试试这样一个控制示例 pred: 0.1, 0.1, 0.2, 0.5, 0.1 true: 0, 0, 1, 0, 0, 0 Maxim Dmitrievsky 2023.04.08 07:07 #30048 Aleksey Vyazmikin #:最多,我们可以通过调整天数,从每日增量中提取合成数据--但我还无法做到这一点。你尝试过吗? 我不明白这样的假设是基于什么,而且这又是在利用特质,而不是改进学习方法。所以这是次要的。这就像学校一样。你可以用一本教科书来教,也可以用另一本教科书来教。信息在本质上不会改变,就像变换一样。但它会飞进一个脑袋,又从另一个脑袋飞出来:)在最终目标不明确的情况下,很难使用综合法。最好的办法是用它来测试序列的某些属性,将其混合到不同的部分,看看结果会如何变化。比如如果?对齐数据中的偏移。一般来说,通过减少对原始数据的记忆来提高通用性是很有用的,但就创建现成的 TS 而言,它仍然是不完整的。在原始数据上训练不同的模型集合(包括简单到线性模型),也能得到类似的结果。好了,你知道大概的答案了吧,通过它仍然不可能得到极好的东西,但改进它是可能的。 mytarmailS 2023.04.08 08:35 #30049 Aleksey Nikolayev #:我们可以将曼德尔布罗特的价格表示法视为三元树的森林,其中每一次移动都被分解为三次(两次同方向移动和中间的修正)。这样做的好处是可以收集价格分形结构的统计数据。缺点是算法复杂,难以避免瞻前顾后。 能否以关联规则的形式呈现? Aleksey Nikolayev 2023.04.08 08:54 #30050 mytarmailS #: 可以用关联规则来表示吗? 我没有想过这个问题,但我认为不太可能,因为运动的顺序对价格很重要。 为了以防万一,我想用一幅图来说明曼德布罗特的想法。如果可能的话,每个价格变动都会被分成三个变动(通过选择其中的最大修正),然后成为树的一个节点。如果运动中没有修正(或修正小于给定值),则成为树的叶子。 1...299829993000300130023003300430053006300730083009301030113012...3399 新评论 您错过了交易机会: 免费交易应用程序 8,000+信号可供复制 探索金融市场的经济新闻 注册 登录 拉丁字符(不带空格) 密码将被发送至该邮箱 发生错误 使用 Google 登录 您同意网站政策和使用条款 如果您没有帐号,请注册 可以使用cookies登录MQL5.com网站。 请在您的浏览器中启用必要的设置,否则您将无法登录。 忘记您的登录名/密码? 使用 Google 登录
这是在呼吁大家在把初始数列转化为图形、量子、水平、正弦或其他你发明的东西之前先思考一下。
事实上,任务的设置并不正确,这一点我在这里已经说了很久,上一次是在 10-20 页之前,所以好像没有什么可以教我的,我完全明白一切.....。
如果数据中存在恒定的信号,则几乎立即意味着泛化,而噪声则会导致错误。如果没有信号,就会出现记忆化,即分类错误仅仅是重叠了具有不同标签和相同特征值的样本。第二个模型没有预测价值。这就是我提出的问题的答案。
规律具有浮动概率,可能是周期性的,也可能完全消失。我工作的时间范围很大,也观察到了这些现象。
我想说的是,有可能训练出一个 2008-2017 年(10 年)的模型,它可以一直运行到今天。这样一个模型的信号会很少--召回率最多不超过 30%,但这也说明,10 年中能在未来几年(测试样本)发挥作用的模式很少。
但究竟是哪种模式--周期性的还是一次性的(也许周期为数十 年)--目前还无法确定,因此也就不可能选择一种持续有效的模式。
理想情况下,有必要找到至少每 3 个月出现一次的周期性模式,这样我们就可以期望模型能够摆脱缩减。
根据不同的周期模式训练出的一揽子此类模型将减少缩减。
因此,重要的是初始信号 + 目标 + 相对于目标具有周期性正规律的预测因子。
你的方法--摇晃和筛选--类似于探矿者的工作--当然,你可以找到很多有趣的和没有学到的东西,但你怎么能确定这些东西会是稳定的呢?
我喜欢自己破解日期,我有这方面的想法,但现在我想朝着提高模型稳定性概率的方向挖掘。
你的方法--摇晃和筛选--就像一个探矿者的工作--当然你可以找到很多有趣的和没有学到的东西,但如何确保它的稳定性呢?
我自己喜欢 "摇枣",也有这方面的想法,但现在我想朝着提高模型稳定性概率的方向挖掘。
我写了一个基本的理解,没有它就根本不值得做任何事情。如果只是为了确认每一点的话(如果你第一次没有理解的话 🙂)
我对您的描述和方法总体上没有异议--我自己也在很久以前对其进行了本质上的描述,尽管实现方式不同。
我的人工实验表明,通常情况下,只要抽取出具有 10 个简单规律性的行(在我的案例中,就是预测值下降的量子段),整个样本的概率就会向 1 的方向移动 15-20%,而样本则会减少 35%。机器学习方法无法实现这一点。从本质上讲,这是对无用/矛盾数据的剔除。但我们想在更接近当前日期的情况下做到这一点,即不是通过统计了解历史,而是通过一些方法只选择虚假/矛盾的模式。
如果我们设定一个任务,根据这个任务,模型应该在任何仪器上都能工作,那么测试是可能的,但这样稳定的模式就更少了。而只是在历史中狂奔,或者更糟糕的是,进行合成--我不认为这是有效的。顶多是可以通过洗日的方式从每日增量中提取合成数据,但我还没有这种能力。您尝试过吗?
我完全不懂,但我想知道价格是否可以用图表来表示,与通常的二维表示法相比是否有任何优势。
您可以将曼德尔布罗特(Mandelbrot)的价格表示法视为三元树森林,其中每一步棋都分为三步(同方向的两步棋和两步棋之间的修正)。
这样做的好处是可以收集有关价格分形结构的统计数据。缺点是算法复杂,难以避免瞻前顾后。
这与我上面举的 "并行 "平台的矩阵和例子有什么关系?
例如,我从 keras 的链接中获取矩阵,并调用它们:
并得到零。
对照示例不适合。
分类交叉熵用于有两个以上类别的分类模型。而在 softmax 之后。Softmax 将一组值转换为一组概率,其总和为 1。
试试这样一个控制示例
pred: 0.1, 0.1, 0.2, 0.5, 0.1
true: 0, 0, 1, 0, 0, 0
最多,我们可以通过调整天数,从每日增量中提取合成数据--但我还无法做到这一点。你尝试过吗?
我们可以将曼德尔布罗特的价格表示法视为三元树的森林,其中每一次移动都被分解为三次(两次同方向移动和中间的修正)。
这样做的好处是可以收集价格分形结构的统计数据。缺点是算法复杂,难以避免瞻前顾后。
可以用关联规则来表示吗?
我没有想过这个问题,但我认为不太可能,因为运动的顺序对价格很重要。
为了以防万一,我想用一幅图来说明曼德布罗特的想法。如果可能的话,每个价格变动都会被分成三个变动(通过选择其中的最大修正),然后成为树的一个节点。如果运动中没有修正(或修正小于给定值),则成为树的叶子。