交易中的机器学习:理论、模型、实践和算法交易 - 页 1923

 
mytarmailS:


是我的问题,还是你在没有老师的情况下降低了维度? 我说的是 "uwot"(umap)。

 
Vladimir Perervenko:

是我的问题,还是你在没有老师的情况下进行了降维? 我说的是 "uwot"(umap)。

是的,只有我使用 "umap "包。

 
mytarmailS:

是的,只有我使用 "umap "包。

这没有任何意义。将维度降低到与你的目标空间相匹配的空间是转换的目的。另外,只有这两个软件包提供了处理新数据(有效/测试)的能力,而不仅仅是像tSNE那样的训练。

转化后,用dbscan进行聚类。获得的聚类是作为要引入的变量的一个额外预测因素。可能会有一些变化。

祝好运

 
mytarmailS:

是的,只是我使用了 "umap "包。

该方法本身的名称是什么?它到底是什么? 我想看看它的python版本。

图片中的某种变形虫和细胞生命。

顺便说一下,魔术师展示了类似的转变。他有点状物拉伸和收缩成椭圆,我记得有这样的东西。

 
Maxim Dmitrievsky:

该方法本身的名称是什么?它到底是什么? 在Python中,我想看到的是

变形虫和细胞的一些生活图片

在Python中,umap包有同样的名字。

 
Vladimir Perervenko:

在Python中,同名的umap包。

谢谢,我会看看的。

 
Vladimir Perervenko:

将维度降低到与你的目标相匹配的空间--这就是转换的目的。

那么,你如何做到这一点,你从哪里得到这个目标匹配,你这样做是什么意思?

Vladimir Perervenko:

此外,它们是仅有的两个提供处理新数据(有效/测试)可能性的软件包,而不是像tSNE那样只提供训练。

我知道,这就是我选择他们的原因。

弗拉基米尔-佩雷文科

用dbscan进行转化聚类后。获得的群组作为要引入的变量的额外预测因素。这里可能有一些变体。

我知道))我在上一页写了关于dbscan 的内容 )

但有了它,也会很麻烦,首先,与集群都一样需要打转,其次,它识别新数据的速度太慢。

我在某处读到--不管是计划中的包还是在p-studio中的技巧都应该出现--集群将是手动选择的,直接用鼠标,没有听说过吗?

 
Maxim Dmitrievsky:

谢谢,我会看看的。

我只是在使用它,或者说它在R中的封装器

 
mytarmailS:

那么你是怎么做的,你从哪里得到这个目标匹配,你的意思是什么?

我知道,这就是我选择这个套餐的原因。

我知道))在上一页写了关于dbscan 的内容 )

但用它,也会很麻烦,首先,集群都是一样的,你必须要玩,其次,它识别新数据的速度太慢。

我在什么地方读到过--或者说软件包是计划要做的,或者在p-studio芯片中不得不出现--那就是集群将可以直接用鼠标手动选择,没有听说过吗?

按顺序排列。

你设置常数。

#---const-------------------------------
 evalq({
  n_n <- 15 L
  min_d <- 0.1
  n_c <- 3 L
  metr <- "euclidean" #"euclidean" (the default) "cosine" "manhattan"
  lr <- 0.75
  scale <- "none" 
  #               "none"
  #               "scale" or TRUE ,
  #               "maxabs" Center each column to mean 0, then divide each element by the maximum 
  #                         absolute value over the entire matrix.
  #               "range"
  init <- "spectral" # "spectral" # "normlaplacian". # "random".
  # "lvrandom". # "laplacian".  # "pca". # "spca".
}, env)

要用教师进行教学,我们只需要在公式中加入目标Y,并指定我们需要返回一个模型(ret_model = TRUE)

#-----superveised------------------
 evalq({
  y <- factor(denoiseX1pretrain$origin$y)
  origin.sumap <- umap(X = x, y = y, approx_pow = TRUE, n_neighbors = n_n, 
                       learning_rate = lr, min_dist = min_d, n_components = n_c, ret_model = TRUE,
                       metric = metr, init = init, n_threads = 4 L, scale = scale)
}, env)

有了这个模型,我们就可以把原点数据组的其余训练/测试/测试1子集也转换成三维的。以下是代码

#---train--------------------------------
evalq({
  set.seed(1337)
  umap_transform(X = X1$train$x, model = origin.sumap, n_threads = 4 L, 
                 verbose = TRUE) -> train.sumap
}, env)
#---test--------------------------------
evalq({
  set.seed(1337)
  umap_transform(X = X1$test$x, model = origin.sumap, n_threads = 4 L, 
                 verbose = TRUE) -> test.sumap
}, env)
#---test1-------------------------------
evalq({
  set.seed(1337)
  umap_transform(X = X1$test1$x, model = origin.sumap, n_threads = 4 L, 
                 verbose = TRUE) -> test1.sumap
}, env)

代入你的x/y,你会得到分为两组的三维数据。摘自一篇未完成的文章。我有一些照片,但现在找不到了。如果我需要它们,我明天会去找它们。但我认为你可以得到你的。

祝好运

 

发现

溯源