交易中的机器学习：理论、模型、实践和算法交易

Uladzimir Izerski 2020.06.24 17:48 #18421

Mihail Marchukajtes:

不要以为没有人把你拒之门外，只是这里有一些特定的人不能忍受蛊惑人心。人工智能系统有能力给出一个非显而易见的答案，但它仍然是一门精确的科学，其中1+1=2，而不是大约，据说或其他。同样，市场是一个非常具体的活动类型，其中有实际的新闻，也有伪的教义。比如优素福的，就是这样。

我们来看看维基百科，你相信它吗？

市场-- 一套确保特定商品和服务的买家（消费者）和卖家（供应商）之间交流的过程和程序。

因此，也许关于买家和卖家之间关系的信息是重要的，而不是波浪、随机指标、布林等？你怎么看？你知道，有很多伪实验都在试图夺取最高点....。我想我要再拍一个视频，但这次是文字。而且我想我必须对声音做一些处理。伙计，没有人知道为什么GOPRO写的声音有噪音????

甚至读到借口））。

[删除] 2020.06.25 11:02 #18422

Uladzimir Izerski:

我甚至读过那些借口））。

嗨，沃洛佳，你好，你赚了多少钱？)

Mihail Marchukajtes 2020.06.25 20:42 #18423

你知道，有一天我想到了一个想法。

我发布的视频的质量还有待提高，但从观众来看，没有人对崇高的事情和科学推理感兴趣。每个人都有兴趣看一个漂亮的小妞，她在高尔基公园里吐槽了半个小时关于废除自我封闭的问题。它真的在我眼前，在24小时内获得了50万的浏览量，而我只有70岁。结论：科学课题在最近并不流行。最主要的是一张漂亮的脸蛋和悦耳的声音，没有人对AI感兴趣。太糟糕了 :-(

Aleksey Vyazmikin 2020.06.25 20:44 #18424

elibrarius:

我想听听大家的建议。
在Darch软件包中，我发现了以下的模型评估选项：
我们计算轨道和oob部分的误差。
然后，最终的误差计算为：
err = oob_error * comb_err_tr + train_err * (1 - comb_err_tr) 。

在我看来，训练应该由整个样本的完整性和准确性指标的平均值来控制，将样本分为，比如10%-20%的窗口。我自己也是通过这种方法来选择树叶，但我也考虑到了财务结果。

Maxim Dmitrievsky 2020.06.26 01:19 #18425

Mihail Marchukajtes:

你知道，有一天我想到了一个想法。

我发布的视频的质量还有待提高，但从观众来看，没有人对崇高的事情和科学推理感兴趣。每个人都有兴趣看一个漂亮的小妞，她在高尔基公园里吐槽了半个小时关于废除自我封闭的问题。它真的在我眼前，在24小时内获得了50万的浏览量，而我只有70岁。结论：科学课题在最近并不流行。最主要的是一张漂亮的脸蛋和悦耳的声音，没有人对AI感兴趣。太糟糕了 :-(

没有人想知道真相，米沙））。每个人都想要美丽的幻觉。

你不需要自己成为一个漂亮的假人--创造一个观众的印象，开启他的想象力，然后说出真相 ))

仅仅是背景中的千斤顶的声音让你感到困扰 )

Mihail Marchukajtes 2020.06.26 05:14 #18426

Maxim Dmitrievsky:

没有人想知道真相，Misha ))每个人都想要美丽的幻觉。

你不必自己是一个漂亮的乳头--在观众的脑海中创造一个想法，开启他的想象力，然后切入事实））。

只是背景中的千斤顶让人困扰 )

嗯，是的，我将单独处理声音问题...

Forester 2020.06.26 05:17 #18427

Aleksey Vyazmikin:

在我看来，应该通过对整个样本的完整性和准确性进行平均来监测训练，将样本分成例如10%-20%的窗口。我自己也是用这种方法选择树叶，但我也考虑到了财务结果。

这就是交叉验证。或者你也可以向前滚动，这样验证集总是比训练集晚。
让我们澄清一下术语：
- 准确性，你是指标准准确性（正确分类的例子比例）
- 完整性。是训练的例子数量/样本大小吗？你如何选择它？通过选择？

Aleksey Vyazmikin 2020.06.26 21:06 #18428

elibrarius:

这就是交叉验证。或者你也可以向前滚动，这样验证集总是比训练集晚。

重要的是要检查整个样本的信号稳健性，而不是看最后的分数--可能有不同的方法，我已经简要介绍了其中的一种。

elibrarius。

让我们澄清一下术语：
- 准确性，你是指标准准确性（正确分类的例子比例）
- 完整性。是训练的例子数量/样本大小吗？你如何选择它？通过选择？

精确率是指准确性，召回率是指完整性。如果有一个以上的类，并且信号类是集合中的一个，这些数字就很重要。例如，如果三重分类--买入(1)/等待(0)/卖出(-1)或波动性搜索--会有一个强势(1)的运动或一个弱势(0)的运动。如果在逻辑上这两个类是等价的，那么这些指标的意义就有点模糊了。

Метрики в задачах машинного обучения

habr.com

В задачах машинного обучения для оценки качества моделей и сравнения различных алгоритмов используются метрики, а их выбор и анализ — непременная часть работы датасатаниста. В этой статье мы рассмотрим некоторые критерии качества в задачах классификации, обсудим, что является важным при выборе метрики и что может пойти не так. Метрики в задачах...

mytarmailS 2020.06.27 08:17 #18429

马克西米卡怎么样了？你读过什么吗？有任何削减吗？

办法好一点，结果也好一点......所有的投入都显示+:))

但也有问题...

1）没有足够的信号。

2）该模型在时间上已经死亡。

但我认为我已经开始了解这个该死的市场的一些情况，而且突破口也不远了 ))

Forester 2020.06.27 09:09 #18430

Aleksey Vyazmikin:

重要的是要检查整个样本的信号稳健性，而不是看最后的数字--可能有不同的方法，我已经简单介绍了其中的一种。

精确率是指准确性，召回率是指完整性。如果有一个以上的类，并且信号类是集合中的一个，这些指标就很重要。例如，在三重分类的情况下--买入(1)/等待(0)/卖出(-1)或波动性搜索--会有一个强势(1)的运动或一个弱势(0)的运动。如果在逻辑上，这两个阶层是平等的，那么这些指标的意义就有点模糊了。

谢谢。我使用了 "精确"，（对我自己而言）称其为 "准确"，用于一个班。我现在就用普通的术语来称呼它）。
而一般来说，当有类 "等待 "时，Precision可以被认为是一个基本指标。精度的错误是错误分类造成的直接损失。
而召回意味着利润损失，即我们等待而不是采取行动。
底线是最大限度地提高F1，这将在预测错误最小和错过利润最小的情况下找到最佳价值。

交易中的机器学习：理论、模型、实践和算法交易 - 页 1843