交易中的机器学习:理论、模型、实践和算法交易 - 页 1843

 
Mihail Marchukajtes:

不要以为没有人把你拒之门外,只是这里有一些特定的人不能忍受蛊惑人心。人工智能系统有能力给出一个非显而易见的答案,但它仍然是一门精确的科学,其中1+1=2,而不是大约,据说或其他。同样,市场是一个非常具体的活动类型,其中有实际的新闻,也有伪的教义。比如优素福的,就是这样。

我们来看看维基百科,你相信它吗?

市场-- 一套确保特定商品服务买家(消费者)和卖家(供应商)之间交流 的过程和程序。

因此,也许关于买家和卖家之间关系的信息是重要的,而不是波浪、随机指标、布林等?你怎么看?你知道,有很多伪实验都在试图夺取最高点....。我想我要再拍一个视频,但这次是文字。而且我想我必须对声音做一些处理。伙计,没有人知道为什么GOPRO写的声音有噪音????

甚至读到借口))。

 
Uladzimir Izerski:

我甚至读过那些借口))。

嗨,沃洛佳,你好,你赚了多少钱?)
 

你知道,有一天我想到了一个想法。

我发布的视频的质量还有待提高,但从观众来看,没有人对崇高的事情和科学推理感兴趣。每个人都有兴趣看一个漂亮的小妞,她在高尔基公园里吐槽了半个小时关于废除自我封闭的问题。它真的在我眼前,在24小时内获得了50万的浏览量,而我只有70岁。结论:科学课题在最近并不流行。最主要的是一张漂亮的脸蛋和悦耳的声音,没有人对AI感兴趣。太糟糕了 :-(

 
elibrarius:

我想听听大家的建议。
在Darch软件包中,我发现了以下的模型评估选项:
我们计算轨道和oob部分的误差。
然后,最终的误差计算为:
err = oob_error * comb_err_tr + train_err * (1 - comb_err_tr) 。

在我看来,训练应该由整个样本的完整性和准确性指标的平均值来控制,将样本分为,比如10%-20%的窗口。我自己也是通过这种方法来选择树叶,但我也考虑到了财务结果。

 
Mihail Marchukajtes:

你知道,有一天我想到了一个想法。

我发布的视频的质量还有待提高,但从观众来看,没有人对崇高的事情和科学推理感兴趣。每个人都有兴趣看一个漂亮的小妞,她在高尔基公园里吐槽了半个小时关于废除自我封闭的问题。它真的在我眼前,在24小时内获得了50万的浏览量,而我只有70岁。结论:科学课题在最近并不流行。最主要的是一张漂亮的脸蛋和悦耳的声音,没有人对AI感兴趣。太糟糕了 :-(

没有人想知道真相,米沙))。每个人都想要美丽的幻觉。

你不需要自己成为一个漂亮的假人--创造一个观众的印象,开启他的想象力,然后说出真相 ))

仅仅是背景中的千斤顶的声音让你感到困扰 )

 
Maxim Dmitrievsky:

没有人想知道真相,Misha ))每个人都想要美丽的幻觉。

你不必自己是一个漂亮的乳头--在观众的脑海中创造一个想法,开启他的想象力,然后切入事实))。

只是背景中的千斤顶让人困扰 )

嗯,是的,我将单独处理声音问题...
 
Aleksey Vyazmikin:

在我看来,应该通过对整个样本的完整性和准确性进行平均来监测训练,将样本分成例如10%-20%的窗口。我自己也是用这种方法选择树叶,但我也考虑到了财务结果。

这就是交叉验证。或者你也可以向前滚动,这样验证集总是比训练集晚。
让我们澄清一下术语:
- 准确性,你是指标准准确性(正确分类的例子比例)
- 完整性。是训练的例子数量/样本大小吗?你如何选择它?通过选择?

 
elibrarius:

这就是交叉验证。或者你也可以向前滚动,这样验证集总是比训练集晚。

重要的是要检查整个样本的信号稳健性,而不是看最后的分数--可能有不同的方法,我已经简要介绍了其中的一种。

elibrarius

让我们澄清一下术语:
- 准确性,你是指标准准确性(正确分类的例子比例)
- 完整性。是训练的例子数量/样本大小吗?你如何选择它?通过选择?

精确率是指准确性,召回率是指完整性。如 果有一个以上的类,并且信号类是集合中的一个,这些数字就很重要。例如,如果三重分类--买入(1)/等待(0)/卖出(-1)或波动性搜索--会有一个强势(1)的运动或一个弱势(0)的运动。如果在逻辑上这两个类是等价的,那么这些指标的意义就有点模糊了。

Метрики в задачах машинного обучения
Метрики в задачах машинного обучения
  • habr.com
В задачах машинного обучения для оценки качества моделей и сравнения различных алгоритмов используются метрики, а их выбор и анализ — непременная часть работы датасатаниста. В этой статье мы рассмотрим некоторые критерии качества в задачах классификации, обсудим, что является важным при выборе метрики и что может пойти не так. Метрики в задачах...
 

马克西米卡怎么样了?你读过什么吗? 有任何削减吗?

办法好一点,结果也好一点......所有的投入都显示+:))


但也有问题...

1)没有足够的信号。

2)该模型在时间上已经死亡。


但我认为我已经开始了解这个该死的市场的一些情况,而且突破口也不远了 ))

 
Aleksey Vyazmikin:

重要的是要检查整个样本的信号稳健性,而不是看最后的数字--可能有不同的方法,我已经简单介绍了其中的一种。

精确率是指准确性,召回率是指完整性。如 果有一个以上的类,并且信号类是集合中的一个,这些指标就很重要。例如,在三重分类的情况下--买入(1)/等待(0)/卖出(-1)或波动性搜索--会有一个强势(1)的运动或一个弱势(0)的运动。如果在逻辑上,这两个阶层是平等的,那么这些指标的意义就有点模糊了。

谢谢。我使用了 "精确",(对我自己而言)称其为 "准确",用于一个班。我现在就用普通的术语来称呼它)。
而一般来说,当有类 "等待 "时,Precision可以被认为是一个基本指标。精度的错误是错误分类造成的直接损失。
而召回意味着利润损失,即我们等待而不是采取行动。
底线是最大限度地提高F1,这将在预测错误最小和错过利润最小的情况下找到最佳价值。