交易中的机器学习:理论、模型、实践和算法交易 - 页 221

 
安德烈-迪克
这可能是我最近看到的对R的最明智和客观的意见。传统的思维,这就是R的老粉丝们的痛苦,无论你拿谁来说,即使是在这个论坛上,他们的想法都是一样的,你甚至可以混淆他们之间的关系,如果不看昵称的话,他们的推理方式是一样的。

在讨论R时,不可能没有你,尽管根本不清楚你在这里做什么。

但既然你在这里,在你的例子上。

你已经开发了一个遗传算法,你知道怎么做,也许比世界上任何其他人都好。

我不知道如何编写遗传算法。这并不是因为我不能做,而是因为我不需要做。

让我解释一下。

在一个真实的交易系统中,我使用rfe函数(对来自caret的预测器进行回测)。得到的结果不是很好。我应该使用你的遗传算法吗?百分之百没有,因为同一个caret有gaf功能(通过遗传算法选择预测器)。但除此之外,caret还有另一个功能saf(通过模拟鲁棒性选择预测者--退火),这在我的问题上比基因算法更有效。我的交易系统中的问题是一个,而工具是三个,用一个代替另一个是费力不讨好的,是三个字母的替换。此外,也许最重要的是:所有这三个功能都与我需要的其他功能相联系。

我根本不存在遗传算法的编程问题。但在解决我自己的问题时,我可以轻松地使用各种算法,包括遗传算法。在现实中,问题是预测器的选择,这是一个计算量很大的问题,为了解决这个问题,除了列出的R,还有大量的非R编程的工具。

 
J.B:

这取决于什么样的研究,如果学生的研究是为了通过学期论文,那么是的,从书架上拿一个函数,运行它,然后得到一个有漂亮图表的标准报告,在这里没有问题。

如果研究一个量化的工程师,在一个金融办公室,从市场上拿钱,而不仅仅是通过佣金,或接近市场的技术,情况就不同了。 作为一项规则,在正确的办公室,在5年内你建立自己的交易基础设施,那里有95%的所有必要的工具,这些工具被方便地包装起来,你可以使用它们不比在R.......... 复杂多少

是的,这一切都很清楚,我同意你的观点,但你说的是生产,但这里没有昆仑,也没有人有已经做了5年的基础设施...而在这个基础设施完成之前,有 初步的研究, 这是大多数人的地方,他们正在寻找想法,你在谈论生产......

在我看来,这个计划是

1)寻找一个工作思路

2)寻找一个工作思路

3)寻找一个工作思路

4)进行销售和其他基础设施的设想(生产)。

现在你将第一点与第四点进行对比--这有点像一个骗局,你知道我的意思吗?

嗯,对于第一项,当你需要快速浏览一堆想法时,R是一个东西,对于第四项,自然是C++。

 

桑桑尼茨-弗门科

我不知道如何编写遗传算法。并不是因为我不能做,而是因为我不需要做。

我记得它是因为在那里的预审中,我被要求写一个排序的气泡 或更快,当然没有在网上找,我就写了,这似乎是一个幼稚的任务,但后来有人告诉我,70%的人都做不到。我认为这是正确的,有一套基本的算法,应该知道像2+2=4这个或那个领域的专家,因为它大大提高了,至少有效地使用它们的能力,更不用说修改和创造更有效的类似物。量子化应该能够写出MLP、baes、Knn、forest等,而不会偷看。这就是2+2=4的数量。

桑桑尼茨-弗门科

我使用rfe函数(从caret中回选预测因子)。得到的结果不是很好。有一个功能,即 "在一个地方"。

嗯,是的,这正是消费者对 "数以万计的功能 "的谈论,他们并不理解,但只是尝试。不幸的是,他们给你的一切都已经试过了,"那里没有鱼",特别是在algotrading方面,所有这些丰富的功能都是虚幻的,algotrading在其本质上不可能是罂粟,在这里你需要能够并喜欢重新发明车轮,否则你将被赶进一辆 "花哨的汽车",只到一个垃圾场或墓地,而不是你在驾驶它))。

 
mytarmailS:

是的,这一切都很清楚,我同意你的观点,但你说的是生产,但这里没有昆仑,也没有人的基础设施,已经做了5年了......而在这个基础设施完成之前,有 初步的研究, 这是大多数人的地方,他们正在寻找想法,你在谈论生产......

在我看来,这个计划是

1)寻找一个工作思路

2)寻找一个工作思路

3)寻找一个工作思路

4)进行销售和其他基础设施的设想(生产)。

现在你将第一点与第四点进行对比--这有点像一个骗局,你知道我的意思吗?

好吧,对于第一项,当你需要快速浏览一堆想法时,R是一个东西,在第四项上,自然是c++。

错误的方案,因为在algotrading中,许多过程都是交织在一起的,相互依赖。你不能脱离数据和对处理数据的算法的深刻理解去寻找一个想法。因此,例如在货币对的分钟烛台上 "寻找想法",它是....。没有什么"一个",在俄罗斯市场的订单簿上是另一个,在几十个世界领先的交易所和宏观经济数据提供者的订单簿上是另一个,等等。处理方法也是如此,想法和工具是密切相关的,渐进的方法是有意义的,但不是 "真空 "的方法,当一个想法被搜索为球形的马,并用C++实现。例如,您认为用支持向量机模拟高频限价订单动态 的想法在实施中会有什么便利?试试吧,然后告诉我。我只能说,在文章中也是2+2+4,但实际上要复杂得多。

 
J.B:

曾经在一个gamediver办公室工作过一年,我记住了这一点,因为那里在初步面试时要求写一个排序的气泡或更快,当然没有看互联网,我就写了,我以为这个TOR很幼稚,但后来我开窍了,70%的人做不到。我认为这是正确的,有一套基本的算法,应该知道像2+2=4这个或那个领域的专家,因为它大大提高了,至少有效地使用它们的能力,更不用说修改和创造更有效的类似物。量子化应该能够写出MLP、baes、Knn、forest等,而不会偷看。这就是2+2=4的数量。

我不想听起来像一个非侦探,但有点奇怪,像你这样的专业人员,甚至今年在量子基金会工作,都不知道什么是交叉相关https://www.mql5.com/ru/forum/71816。

Индикатор опережения\отставания временного ряда
Индикатор опережения\отставания временного ряда
  • www.mql5.com
Индикатор опережения\отставания временного ряда.
 
J.B:

不是正确的方案,因为在算法交易中,许多过程是交织在一起的,相互依赖。你不能脱离数据和对处理数据的算法的深刻理解而去寻找一个想法。因此,例如在货币对的分钟烛台上 "寻找想法",它是....。没有什么"一个",在俄罗斯市场的订单簿上是另一个,在几十个世界领先的交易所和宏观经济数据提供者的订单簿上是另一个,等等。处理方法也是如此,想法和工具是密切相关的,渐进的方法是有意义的,但不是 "真空 "的方法,当一个想法被搜索为球形的马,并用C++实现。例如,您认为用支持向量机模拟高频限价订单动态 的想法在实施中会有什么便利?试试吧,然后告诉我。我只能说,在文章中也是2+2+4,在现实中一切都要复杂得多。

我同意关于hft的说法,但我不明白你为什么总是引用它作为例子,你可能不知道这样的日期是一个人无法达到的,这里的人都没有钱从西方和快速渠道购买订单经纪人。

为什么还要谈论它,并将它作为一个例子?

 
mytarmailS:

我无意听起来像个侦探,但奇怪的是,像你这样在量子基金工作的专家,今年竟然不知道什么是交叉相关https://www.mql5.com/ru/forum/71816

哦,来吧...当时我正在解决一个相当复杂的问题,坐在家里,生病了,不方便问同事,我有一个月的时间来找工作,然后我自己想办法,过了一段时间,Rev。Combinator命名了完全相同的解决方案。另一个问题是,如果你面临这样的问题,你可能不会解决,因为这里你需要知道行与行之间的交叉相关在低水平上是如何实现的,并猜测如何使用它,R没有这样的函数 "滞后行",最重要的是,你根本不会设置这样的问题))))因此,你不是一个对冲基金的量子。

 

桑桑尼茨-弗门科


在推广R语言作为有效解决交易任务的手段时,你不断提到使用其工具的便利性和其能力的广泛性。 没有人反驳这一点。但你的发言清楚地表明你对这种语言的原则一无所知。

当然,你是一个很好的导航员,你知道哪些功能是解决你的任务所必需的,但你显然完全不知道隐藏在这些名字背后的机制。你不知道他们如何工作。更重要的是,你不想知道它,你劝阻别人不要这样做。

你是R的用户。你喜欢这个工具,因为它很容易使用,但不是因为它在解决具体任务方面的效率,你对这些任务一无所知,也不渴望了解。

要明白,开发人员与用户的不同之处恰恰在于他渴望了解机制并达到最大效率。

这个目标只有在对该主题有绝对了解的情况下才能实现。在 这里,创造东西的难易程度并不重要。

事实上,你正在邀请开发人员忘记他们的工作,而成为单纯的用户。享受你提供的工具的易用性,完全忘记调查他们的工作原理。

有了这样的方法,效率可以被遗忘,而开发者也不能忘记它。

如果你开始了解隐藏在R中的机制的运作,你可能会发现它们并不像一个热心的二流子所看到的那样完美。

通过这个帖子,我试图阐述一个反对你的观点,但我可能对其他的观点有误。然而,我是这样看待这个问题的。

 
mytarmailS:

我同意关于hft的说法,但我不明白你为什么总是引用它作为例子,你知道这样的日期不是任何人都能得到的,这里没有人有钱从西方和快速渠道购买订单的人。

为什么要谈论它并把它作为一个例子?

不要以偏概全。你可以从俄罗斯市场的OL开始。和HFT,因为它只起作用。HFT和内线。
 
J.B:

来吧...当时我正在解决一个相当复杂的问题,坐在家里,生病了,不方便问同事,我有一个月的时间来找工作,然后我自己想办法,过了一会儿,康博特先生说了完全一样的解决办法。Combinator命名了完全相同的解决方案。另一个问题是,如果你面临这样的问题,你可能不会解决它,因为在这里你需要知道行与行之间的交叉相关在低水平上是如何实现的,并猜测如何使用它,R没有这样的函数 "滞后行",最重要的是,你根本不会设置这样的问题))))因此,你不是一个对冲基金的量子。

我没有你想的那么笨,注意交叉相关这个词,我在你的分支里说过,但这是你做的,当我第一次了解交叉相关时,我得到了和你一样的想法,就是系列比较(所以你并不孤单,也不是唯一的),那是在你的分支之前很久的事情,但我一直没有去想...

J.B:
不要以偏概全。你可以从俄罗斯市场上的OL开始。和HFT,因为它只起作用。HFT和内线。

你可能是对的....但我认为,现有的OL的编写速度比Plaza快,结果是在一个人身上测试的结果和实际情况会有所不同,我可能是错的,但这是我得到的印象。