交易中的机器学习:理论、模型、实践和算法交易 - 页 2755

 
mytarmailS #:
争论

不一定,也不一定相同。有一些相同的模式是由不完全相同的事件造成的,我们的累积影响是我们无法控制的。也就是说,在不控制 FA 事件的情况下,案例错误总是会出现。这就是为什么不一样。

总的来说,我倾向于认为目标是决策行为/我们的行动对价格行为的影响。我觉得价格函数有点狭隘,毕竟函数是确定的东西,即使有一些概率、走廊,但也有规则和相互关系。

我正在寻找一种通过网格水平(统一水平或历史极值水平)来定义行为的方法,如果有必要应用这两种方法,那么在我解决问题的同时,应该如何计算出一个数字来设定正确的网格步长,以及多久需要改变一次网格)))))。

 
Valeriy Yastremskiy #:

我正在寻找一种通过网格水平、均匀或历史极值水平来确定行为的方法,如果有必要同时应用这两种方法,那么在解决问题的过程中,应该如何计算出一个数字,从而设置正确的网格步长,以及需要多长时间来改变这个网格)))))。

也许更好的做法是,先在市场上找到某种情况,然后找到类似的情况,将它们组合成一组,然后尝试将这组情况与其他情况分开....。

 
mytarmailS #:

也许最好的办法是,先在市场上找到一些有水平的情况,然后找到类似的情况,把它们归为一组,再试着把这组情况与其他情况区分开来。

也许这样更好。这是一项不同的工作,起初,您可以利用新闻(至少在某种程度上是正规化的)和事件(有必要正规化)的图表,追寻相同的模式,但这已经做过,而且正在做。问题是如何正规化,我们今天所拥有的并不能带来有利的结果。

使用相同的时间间隔更有利可图。

我仍然对正确定义状态的想法非常着迷。Sanych 喜欢这个结论,行为变化往往会在没有警告的情况下耗尽存款)))))。我的结论是,价格经常发生变化,而且变化范围足够大,在变化之前显然有不同的模式。我还不能更准确地说明这意味着什么。在数学中,似乎需要无穷多的模式来描述 SB。对于市场来说,我们仍然没有足够的模式来准确地描述它。

一般来说,应该在行上计算什么,才能正确计算网格的步长)))))。以及多久改变一次步长))))

为什么是网格,因为它是状态控制最简单的变体之一,水平之间的一切都不是固定的,从一个水平到另一个水平的过渡、趋势、返回,意味着极端....。好吧,好像是有问题,但这种状态的橡木形式化。
 
JeeyCi #:

是的,我喜欢这个词(事件驱动编程的 原生词)。

SanSanych Fomenko 提出 的变体中 似乎实现了这样的功能:离群值 -> 平均输入(或输出)......我在上面混合了各种 dim_reduction 和多维分类方法(LDA、聚类)......但无论如何,Mahalanobis 的本质可能一直主要是在多维空间中作为离群值/新奇事物检测...因此,利用离群值进行交易的方案看起来非常不错(只应正确进行特征工程,而不是搜索一组愚蠢的初始数据)......

但 "滑动窗口"仍然令人困惑(尽管通常的自回归模型在时间序列跟踪交易中很常见)....- 窗口内)也可能一团糟...-- 我假设窗口的边界是聪明人进入市场的时间,而他们在投资组合管理中使用的是均值-方差优化...当然,我们不知道他们的投资组合(只能大致从 SoTs 追溯),但在此方差范围内,他们可能会对投资组合进行再平衡------同时固定或加载有关零售的内容......

在离群值上进行交易当然是一个有趣的选择,但考虑到谁在对抗离群值--OTF 或 DTF(日间交易者)--对于正确解释离群值也很重要...

p.s...

好吧,或者不采用 Mahalanobis 离群值,而采用预测分布的极端十分位数--用于风险接受(与风险规避)行为,例如 actor'a(根据环境参数相应地切换其状态)。

无论滑动窗口的形状和属性如何,也无论它包含哪些属性,你仍然是在滑动窗口中移动。否认这一显而易见的事实是愚蠢的。

在窥探者学习到基础知识之前,是无法进行交流的

除了简单的表格示例,强化学习与代理影响环境这一事实息息相关。而且,统计数字的数量是有限的,或者说,政策的变化是缓慢的,而不是突飞猛进的。基于这一点,不可能在外汇中实现代理,你将始终得到一个常规分类。

在形式上,它看起来就像 "哇",演员在特定环境中做了一些事情。而实质上,它并没有实现,只是对实例进行了分类。对于机器人或游戏来说,这更合适。

如果不满足这一条件,RL 可以被视为一种优化,是...
 
Maxim Dmitrievsky #:
除了简单的表格示例,强化学习与代理影响环境 这一事实息息相关。基于这一点,我们不可能在外汇交易中实施代理,你总是会得到一个常规的分类。

从形式上看,代理会在特定环境中做一些事情。而实质上,它并没有实现,只是对案例进行了分类。对于机器人或游戏来说,它更适合。

如果不满足这一条件,RL 可以被视为一种优化。

同意...因此,我倾向于认为代理是 OTF(大盘股、智能股)--通过超高 交易量(如标准 VSA)--既限制又突破交易量,以正式....这就是我认为 ML 在数据准备方面的主要目的 -- 确定特定资产上的 uhv...应将智能视为行为者,而非日常交易者....当然,仍然需要正规化....

 

顺便说一下,我正在尝试查看您关于因果推论链接 -- 顺便说一下,该链接 相当笨拙的俄语描述了这一现象的含义....。但从该链接到本书和其他 书的链接表明,我们谈论的是部分相关系数 的研究(用俄语来说)--即与研究对象以外的固定因素相关....即找到部分相关系数(学术界或任何标准统计书籍中都有统计数学公式),通过零假设 (H0)评估其显著性,并得出关于影响或非影响(即所选变量的依赖性或独立性)的结论, 如俄语:

при фиксированном качестве посевного материала, мин. удобрений и фин. затрат - продуктивность посевов не зависит от фондооснащённости

即资金-设备和作物生产力是线性非依赖关系......。(这是就干预而言)...

可以通过统计数据的私人相关系数来证明这一点....这正是证明 多因素空间中的相关性并不一定是所观察现象的因果关系的情况......也就是说,从本质上讲,标准的《实验规划》就是为了解决这类问题而设计的--让关于结果的逻辑结论摆脱无足轻重的因素-结果相关性的困扰,这些因素-结果相关性被不合理地提升到因果现象的高度。

我没有读其他部分(关于混杂因素等),但不知何故,面向大众(不是最好意义上的)读者的文章和面向公关(宣传关于旧真理的新词)的文章在语义和逻辑上与合理的科学论证(以及合理的论证证明,即因果关系,即因果关系)的论点非常不一致。即通过正确规划和设置一系列实验所证明(!)的某些依存关系的因果关系)......

...对于零售业(由于市场信息不完整)--因果推论原则上是不可理解的,对于研究机构--是无法证明的(出于同样的原因,由于各种商业秘密因素),对于国家级的统计委员会,也许有一些有代表性的样本......但无论如何,有关金融的统计数据总是建立在商业机密的基础上......而对于营销人员来说,这只是一个 "不惜一切代价窥探他人钱包 "的玩具 -- 这就是为什么我认为您的链接作为一个 "营销人员的玩具 "更有趣的原因,但本质上,它是建立在经典的统计方法论基础上的 -- 只是对他们来说,这是一个经典的统计方法论。方法论, -- 只是他们并不总是对经典的科学研究、理论和矩阵统计方法感兴趣,而且由于 "实验的道德性",他们并不总是能像心理学家、社会学家等那样,获得所有信息来建立完整的矩阵模型

>> 因此,他们在文章和书籍中引用 "玩具例子",大量的大脑因此而枯竭--原因很简单,在现实生活中,既无法进行这样的实验,也无法获得这样的数据,找不到这样的研究经费,找不到这样的关于游泳池的空洞逻辑,而企业需要的是需求何时以及如何诞生的 解释....。因此,他们为那些梦想着长期利用通货膨胀牟利的悲痛营销者撰写 "shir.consumer "文章......大脑干涸的他们试图将这些玩具式的例子焊接到现实生活中....。

一个真正的、有科学依据的、逻辑上充分的、关于这些或那些依赖关系的科学实验,意味着对实验进行适当的规划,为这些/其他逻辑结论收集证据基础,并在统计上得到证实......不是统计本身的民粹主义,而是用英语来说......

从这个晦涩难懂的链接中,我似乎明白了这一点(()--所以,不用担心这篇文章不能马上用于市场分析......

--- 这是我的评论

Speed vs. Accuracy: When is Correlation Enough? When Do You Need Causation?
Speed vs. Accuracy: When is Correlation Enough? When Do You Need Causation?
  • adam kelleher
  • medium.com
Often, we need fast answers with limited resources. We have to make judgements in a world full of uncertainty. We can’t measure everything. We can’t run all the experiments we’d like. You may not have the resources to model a product or the impact of a decision. How do you find a balance between finding fast answers and finding correct answers...
 
这是一篇介绍性或宣传性文章,我想其中有一个指向图书馆本身的链接。
还有一些关于时间序列推断的内容,我还没时间去研究。也许这是一个被夸大的话题,但我不能排除这个可能性。

我认为搜索 "时间序列分类因果推断 "之类的东西是有意义的
 
Maxim Dmitrievsky #:
这是一篇介绍性或宣传性文章,我想其中有一个指向图书馆本身的链接。
还有一些关于时间序列推断的内容、

真的是宣传性的而且不符合广告艺术的最佳传统......

在链接的时间序列部分,提到了 SUTVA,这也是书中的内容。

考克斯(1958 年)将无干扰 假设称为 "单位间无相互作用"、

并包含在 Rubin(1980 年)描述的 "稳定单位处理值假设(SUTVA)"中。

VanderWeele (2009)将这一点正式表述为 "治疗变异无关性 "假设,即假设可能存在多个治疗版本,但它们都会导致相同的结果。

在存在干扰的情况下,个体 i 的反事实并不能很好地定义,因为个体的结果取决于其他个体的治疗值。

与无干扰假设一样,无多重治疗假设也包含在鲁宾(Rubin,1980 年)描述的 "稳定单位治疗值假设(SUTVA)"中。

如果对一个人的治疗会影响人群中其他人的结果,那么就会存在干扰。

再往下看,书中有几行提到" 跨人群因果推论的可迁移性(包括副词性)",但同时 "每种方法的估计值都基于不同的建模假设"。- 这在建模中很常见。然后,营销人员希望在人群中 "散布谣言",同时按照可暗示性(相信、不相信、抵制、抱怨、屈服)来区分人群中的个体--即对分类进行新的划分....。照这样下去,我们显然会从价格运动模型转向社会大众模型,而我们却会梦想市场也会受到同样情绪的影响,而且不需要建模--只需要把它聚成一堆,并朝着至少是月亮的方向(从众心理)引导就可以了--这就是市场营销人员正在玩弄的....。梦想着把自己等同于政治学家......

社会上有许多公关和信息传播技术--就像操纵舆论一样......每个人都在 "训练 "传播自己的猜测,梦想着影响别人的决策过程...但根据群众意见做出的决定很少是长期性的,而且总有 "止损线 "不允许群众越过(由谁?)我认为,如果目标是加入聪明人的行列并 "追随他们的尾巴",那么研究平面行为(谁反对谁,通过什么手段,至少是 SUTVA)是徒劳无益的。

顺便说一句,这本书的名字叫《如果》(What IF- harvard.edu)(还没读完--斜着读已经让我会心一笑了)。

附注

没有,但他们仍然不会发明任何东西,并称之为高科技计算,这样在经济中他们就不会在人们之间分配利益,而是将玩具交给营销人员,并发布广告(真实产品的代用品、虚构、希望、梦想、自欺欺人)--并为自己拥有如此 "好 "和 "有前途 "的工作而感到高兴 - 营销....。我还是比较接近正常的科学逻辑,即使是从众行为....但我不会根据从众行为做出交易决定,也不会给任何人提供建议...

因此,因果推理分析(谁在人群中推搡了谁,打架是如何爆发的)不被视为定价过程的建模,而是打架的建模......总是有一个仲裁者(而且不是市场营销--是经济学!,两者之间没有等号),而且不可能把所有事情都考虑进去(建模总是有这样或那样的假设,如果建模的对象无法研究到底的话)。

p.p.s..

我不接受关于经济和政治技术平等的论点..."社会经济领域 "与其说是语言上的抽象概念,不如说是地球上的法则......在地球上,有一种 "物品"(无论是铲子还是其他东西)、"不可或缺 "以及这种物品的 "边际效用",我们应该最大限度地利用这种物品,但这是有限制的--预算和其他资源--这就是商业....。但在生活中,有一个调节器...它迫使总需求和总供给因环境而扩大或缩小...结论:"跟着他们的尾巴走",但不要把最糟糕的传统营销与经济和现实生活(包括养老基金、对冲基金、为人们的资金提供服务的投资基金--流动性市场)混为一谈。

 
...就是这样--在反广告之后,我要走了......只是 harvard.edu 的网站地址有点令人困惑......就像时序部分的 SUTVA 链接一样
 
好吧,去他妈的,那我自己就不说了,还有其他有趣的话题可以讨论呢

我喜欢你的表达和分析,我相信你 😀

我以为图书馆里有一些现成的工具,让你不费吹灰之力就能推断出一些东西。