交易中的机器学习:理论、模型、实践和算法交易 - 页 2791

 
mytarmailS #:
我认为平均分配是一个坏主意,一个非常坏的主意...
尤其是不相关的行,这才是它应该起的作用,山。行
我们应该使用 100 条预测线中的哪一条?平均值是最明显的解决方案。
 
elibrarius #:
那么在 100 条预测线中,该对哪一条进行预测呢?平均是最明显的解决方案。
好吧,假设 50 条预测线向上 50 条向下,求平均值,得到一条水平预测线,然后呢?)
 
mytarmailS #:
好吧,比方说,50 次预测上 50 次预测下,取平均值,得到一个水平预测,然后呢?)
就这样...你有什么选择?
 
elibrarius #:
就是这样。你有什么选择?
嗯,就像我上面建议的那样
 
elibrarius #:
那么在 100 条预测线中,该对哪一条进行预测呢?
我没有看到建议)
 

信息 "标记的一种变体,即笔测试:

def labeling_entropy(dataset, min_Mi = 0.1, min=15, max=15):
    labels = []
    MIs = []
    for i in range(max, dataset.shape[0]-max*2):
        rand = random.randint(min, max)
        curr_pr = dataset['close'][i]
        future_pr = dataset['close'][i + rand]
        full_pr = dataset[i-rand:i+rand]

        mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[0:rand], full_pr[full_pr.columns[0]].iloc[rand:rand*2])
        MIs.append(mi.mean())

        if future_pr + MARKUP < curr_pr and mi.mean() > min_Mi:
            labels.append(1.0)
        elif future_pr - MARKUP > curr_pr and mi.mean() > min_Mi:
            labels.append(0.0)
        else:
            labels.append(2.0)
    
    dataset = dataset.iloc[max:]
    dataset = dataset.iloc[:len(labels)].copy()
    dataset['labels'] = labels
    return dataset.dropna(), MIs

与我的文章一样,我们将一组符号和标签标记起来,但要考虑到开仓前符号集的 n 个字符串与未来价格的 n 个字符串之间的互信息(回归类型)。

如果互信息低于阈值,我们就标记为不交易。

然后从 2019 年开始,对信号和交易/不交易两个模型进行训练

结果

这种方法收效甚微

 
elibrarius #:
没有看到建议)
好吧,重新看一下我的帖子,最后一张图片。
上面仍然写着
 

合乎逻辑的做法是尝试其他方案:

mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[0:rand], full_pr[full_pr.columns[0]].iloc[0:rand]) сравниваем фичи и цены в момент предсказания
mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[0:rand*2], full_pr[full_pr.columns[0]].iloc[0:rand*2]) сравниваем на глубину предсказания вперед + назад
mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[rand:rand*2], full_pr[full_pr.columns[0]].iloc[rand:rand*2]) только вперед
mi = mutual_info_regression(full_pr.iloc[0:rand], full_pr[full_pr.columns[0]].iloc[rand:rand*2])текущие цены и фичи в момент предсказания VS будущие цены

所有选项都不产生任何结果

 
mytarmailS #:
重新看一下我的帖子,最后一张照片。
还是写着

前 25 条只有 2 个变体。2 个错误就是一个小错误。
而且这只是成千上万个图表中的一个变体,碰巧吸引了你的眼球。其他图表的情况会有所不同。您需要制定一个策略(您还没有制定),并观察新数据的平衡线(马克西姆将他的想法进行到底,一切顿时变得清晰)。
 
一年多前,我也用聚类法做了同样的事情,然后确定了图片中的平均水平,并以此为基础下单。分为向上、向下、均值回归 3 个群组。
有趣的是,无论你使用什么特殊手段,都无法从随机中获得任何好的结果