交易中的机器学习:理论、模型、实践和算法交易 - 页 1921

 
mytarmailS:

我不明白,你想让规则中的结果的亲属形式转移到mcule中吗?

当然,否则我之后如何应用这个模型呢?:)

 
Aleksey Vyazmikin:

当然,否则我以后如何应用这个模型呢?:)

)))))),以及用R重写所有的算法在μl中,然后在μl的规则中得到所有的转换))

 
mytarmailS:

)))))),以及用R重写所有的算法在μl中,然后在μl的规则中得到所有的转换))

意识到这种类型的聚类并不能创造出不重复聚类就能重现结果的规则。而且聚类的速度太慢。因此,我们需要通过树状结构创建规则,将聚类结果根据一些属性划分为适当的类别。

那么问题来了--如何在csv中保存属于每个班级的字符串?


虽然这很奇怪,为什么不直接用已经存在的数据继续聚类,而把新的字符串 定义到其中一个类中,或者说有可能吗?

 
我一直在挣扎--我意识到我可以保存聚类图,然后继续工作,但我想不出来怎么做。但我找到了一本关于R 的书。
Классификация, регрессия и другие алгоритмы Data Mining с использованием R
  • Шитиков В. К., Мастицкий С. Э.
  • ranalytics.github.io
Описана широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные...
 
以下是我在这里 发现的情况

1.现在还不清楚如何处理kmeans对象。最简单的是把它附在你的数据框架上。
 k = kmeans(data, centers = 7)
 data = k$cluster
现在你有了聚类号码作为data.frame中的一列。保存,无论你如何保存data.frame。

2.研究价值帮助(kmeans),中心会告诉你中间的中心在哪里。对于传入的数据,计算它与哪个中心最接近。例子。

data(mtcars)
mt.k <- kmeans(mtcars, centers = 4)
mt.k$centers

而且我不明白如何将结果滚入某一列?

k означает сохранение результатов кластеризации для последующего использования
k означает сохранение результатов кластеризации для последующего использования
  • 2015.03.13
  • Soumajit 13 мар '15 в 14:55 2015-03-13 14:55
  • stackru.com
Я изучаю r среду программирования для выполнения кластерного анализа моих тестовых данных. Для тестирования я использую набор данных из одного столбца со следующей диаграммой рассеяния и гистограммой, построенной по отношению к индексу значений. Из данных я чувствую, что значения могут быть разделены на 7 кластеров. И когда я использую Функция...
 

这张图显示了与之前相同的预测因素,但样本量不同,更重要的是,增加了新的预测因素。

而这是如何解释的--过度训练的倾向?

 

我将使用聚类来优雅地调整任何曲线。联系我们

为什么这样一个粗糙的算法几乎立即开始倾泻新的数据,我不明白

我责怪再培训树。我想使用boosta,但我无法迅速将其转移到mql。

 

呼......这就是答案

如果你为一个时间段训练一个模型,然后在另一个时间段(新聚类)的数据上看acuras,那么对于树来说,它将是。

TRAIN DATA:  1.0   0.8541666666666666
NEW DATA:  0.1 8323586744639375 Fuuuuuuu

trane是训练数据集+验证数据集

新数据集一般是指新集群上的新数据。虽然这棵树在验证上工作得很好,但在新的树上,它是一个惨败。


请参阅关于同一数据的catbust。

TRAIN DATA:  0.9304589707927677   0.8916666666666667
NEW DATA:  0.8528265107212476

有什么区别?

你不知道发生了什么,直到你一步一步地检查它。

我责备树的做法是正确的。以为它可以处理这样一个简单的任务,但是没有。

解析 "鲶鱼 效应"...

 
Maxim Dmitrievsky:

呼......这就是答案

如果你为一个时间段训练一个模型,然后在另一个时间段(新聚类)的数据上看acuras,那么对于树来说,它将是。

trane是训练数据集+验证数据集

新的数据集一般是指新群组上的新数据。虽然树在验证时工作正常,但在新的树上却失败了。


请参阅关于同一数据的catbust。

有什么区别呢? 解析catbust...

需要一些时间来了解发生了什么,直到你一步一步地检查所有的事情。

我责备树的做法是正确的。
现在给我一些山区的照片。顺便问一下,山上的情况如何?你在哪里?
 
Ilnur Khasanov:
现在给我山的照片。顺便问一下,山上的情况如何?你去哪里了?

阿尔泰...我在最后一刻没有去,我不想去)。

顺便问一下,你知道什么是优点吗?