Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2110

 
elibrarius:
Se for único, é tortuoso. Por exemplo, existem 100 cordas das quais 10 são únicas, das quais 2 são 45 cordas e 8 são 1. Dividido por 5 quanta, é possível que apenas 5 por 1 seja escolhido, e os 2 mais representativos (45 cada um) serão pulados.

Abordagens diferentes funcionam de forma diferente e eficaz em diferentes preditores, é por isso que quero ter algoritmos diferentes para entender como escolhê-los melhor. Compartilharei minha pesquisa se você puder traduzir o código para o MT5.

 
Aleksey Vyazmikin:

Com uma distribuição uniforme eu entendo - primeiro eu criaria um conjunto de valores únicos e os usaria para cortar.

Mas há outros métodos para dividir a grelha:

Uniforme - basta dividir o intervalo de valores, por exemplo, valores em uma coluna de 0 a 100, passo quantum = 100/255 = 0,39 apenas não em linhas, mas em valores. Isto é, 0,0.39,0.78 .... 99.61

Então você pode usar esses valores para encontrar aqueles realmente presentes na coluna e remover as duplicatas.


UniformAndQuantiles - basta procurar a metade 255/2 = 127 quanta pelo método 1 e 128 pelo método 2, e combinar em um array.

Os 3 métodos restantes são complicados - eu não dei uma olhada.

 
Aleksey Vyazmikin:

Estes são os métodos de quantificação por amostragem para CatBoost - estes são os limites pelos quais a enumeração/aprendizagem então procede.

Meus experimentos mostram que a grade deve ser escolhida para cada preditor separadamente, então o ganho de qualidade é observado, mas CatBoost não pode fazer isso e eu não posso construir uma grade e eu tenho que construir grades e fazer upload para csv e depois iterar através delas para avaliar o comportamento do alvo nelas. Eu acho que este é um chip muito promissor, mas preciso traduzir o código para MQL.

1) É assim que funciona. Pega numa coluna separada e divide-a em quanta.

2) É exatamente isso que faz.

 

Uniforme - basta dividir o intervalo de valores, por exemplo, valores em uma coluna de 0 a 100, passo quantum = 100/255 = 0,39 apenas não em linhas, mas em valores. Isto é, 0,0.39,0.78 .... 99.61

Depois pode utilizar estes valores para encontrar os valores reais presentes na coluna e remover duplicados.


UniformAndQuantiles - basta procurar a metade 255/2 = 127 quanta pelo método 1 e 128 pelo método 2, e combinar em um array.

Os outros 3 métodos são complicados - eu não os investiguei.

Estes são complexos, nos quais estamos interessados :)

E no UniformAndQuantiles conheço a teoria, mas como fazê-lo na vida real não entendo - como definir a área onde tão quantum e tão quantiles. Aqui eu não entendo - ou até o meio por um método, e depois por outro - mas é uma loucura.

 
Aleksey Vyazmikin:

A escolha da repartição certa tem um impacto significativo no resultado.

Aqui está um exemplo na Recall - até 50% de spread - para mim, que é significativo.

Aumentando os limites de 8 para 512 em incrementos de 512 - embora não em ordem no histograma - eu tenho os nomes um pouco de impedimento.


Ainda estou experimentando a seleção de malhas, mas já é óbvio que existem diferentes preditores para os quais você precisa de malhas diferentes para seguir a lógica, não apenas para caber.

Tome 65535 quanta e não se preocupe. Os cálculos serão tão precisos quanto possível.

 
Aleksey Vyazmikin:

Estes são os complexos em que estou interessado :)

E no UniformAndQuantiles eu conheço a teoria, mas não entendo como fazê-lo na vida real - como definir a área onde quantificamos e onde quantificamos. Aqui eu não entendo - ou até o meio por um método, e depois de outro - mas é uma loucura.

Sim

 
elibrarius:

1) É assim que funciona. Pega numa coluna separada, ordena-a e divide-a em quanta.

2) É exatamente isso que faz- o que te faz pensar assim?

Não sabe como avaliar a relação entre a meta e o conjunto de valores ao quantificar. Ela divide a grade em um determinado número de segmentos, se possível, para todos os preditores, e isso nem sempre é necessário. Mas CatBoost sabe como trabalhar com grelha de quantização alimentada (preparada separadamente), o que eu uso.

 
elibrarius:

Toma 65535 quanta e não te preocupes. Os cálculos serão tão precisos quanto possível.

Não, será um modelo adequado, não um modelo significativo!

 
elibrarius:

Sim

É bastante bizarro.

 
Aleksey Vyazmikin:

Não sabe como estimar a relação entre a meta e o conjunto de valores ao quantificar. A grade é dividida em um determinado número de seções, se possível, para todos os preditores, e isso nem sempre é necessário. Mas CatBoost sabe como trabalhar com a grelha de quantização submetida (preparada separadamente), o que eu uso.

E sabes como?