Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2110
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Se for único, é tortuoso. Por exemplo, existem 100 cordas das quais 10 são únicas, das quais 2 são 45 cordas e 8 são 1. Dividido por 5 quanta, é possível que apenas 5 por 1 seja escolhido, e os 2 mais representativos (45 cada um) serão pulados.
Abordagens diferentes funcionam de forma diferente e eficaz em diferentes preditores, é por isso que quero ter algoritmos diferentes para entender como escolhê-los melhor. Compartilharei minha pesquisa se você puder traduzir o código para o MT5.
Com uma distribuição uniforme eu entendo - primeiro eu criaria um conjunto de valores únicos e os usaria para cortar.
Mas há outros métodos para dividir a grelha:
Uniforme - basta dividir o intervalo de valores, por exemplo, valores em uma coluna de 0 a 100, passo quantum = 100/255 = 0,39 apenas não em linhas, mas em valores. Isto é, 0,0.39,0.78 .... 99.61
Então você pode usar esses valores para encontrar aqueles realmente presentes na coluna e remover as duplicatas.UniformAndQuantiles - basta procurar a metade 255/2 = 127 quanta pelo método 1 e 128 pelo método 2, e combinar em um array.
Os 3 métodos restantes são complicados - eu não dei uma olhada.
Estes são os métodos de quantificação por amostragem para CatBoost - estes são os limites pelos quais a enumeração/aprendizagem então procede.
Meus experimentos mostram que a grade deve ser escolhida para cada preditor separadamente, então o ganho de qualidade é observado, mas CatBoost não pode fazer isso e eu não posso construir uma grade e eu tenho que construir grades e fazer upload para csv e depois iterar através delas para avaliar o comportamento do alvo nelas. Eu acho que este é um chip muito promissor, mas preciso traduzir o código para MQL.
1) É assim que funciona. Pega numa coluna separada e divide-a em quanta.
2) É exatamente isso que faz.
Uniforme - basta dividir o intervalo de valores, por exemplo, valores em uma coluna de 0 a 100, passo quantum = 100/255 = 0,39 apenas não em linhas, mas em valores. Isto é, 0,0.39,0.78 .... 99.61
Depois pode utilizar estes valores para encontrar os valores reais presentes na coluna e remover duplicados.UniformAndQuantiles - basta procurar a metade 255/2 = 127 quanta pelo método 1 e 128 pelo método 2, e combinar em um array.
Os outros 3 métodos são complicados - eu não os investiguei.
Estes são complexos, nos quais estamos interessados :)
E no UniformAndQuantiles conheço a teoria, mas como fazê-lo na vida real não entendo - como definir a área onde tão quantum e tão quantiles. Aqui eu não entendo - ou até o meio por um método, e depois por outro - mas é uma loucura.
A escolha da repartição certa tem um impacto significativo no resultado.
Aqui está um exemplo na Recall - até 50% de spread - para mim, que é significativo.
Aumentando os limites de 8 para 512 em incrementos de 512 - embora não em ordem no histograma - eu tenho os nomes um pouco de impedimento.
Ainda estou experimentando a seleção de malhas, mas já é óbvio que existem diferentes preditores para os quais você precisa de malhas diferentes para seguir a lógica, não apenas para caber.
Tome 65535 quanta e não se preocupe. Os cálculos serão tão precisos quanto possível.
Estes são os complexos em que estou interessado :)
E no UniformAndQuantiles eu conheço a teoria, mas não entendo como fazê-lo na vida real - como definir a área onde quantificamos e onde quantificamos. Aqui eu não entendo - ou até o meio por um método, e depois de outro - mas é uma loucura.
Sim
1) É assim que funciona. Pega numa coluna separada, ordena-a e divide-a em quanta.
2) É exatamente isso que faz- o que te faz pensar assim?
Não sabe como avaliar a relação entre a meta e o conjunto de valores ao quantificar. Ela divide a grade em um determinado número de segmentos, se possível, para todos os preditores, e isso nem sempre é necessário. Mas CatBoost sabe como trabalhar com grelha de quantização alimentada (preparada separadamente), o que eu uso.
Toma 65535 quanta e não te preocupes. Os cálculos serão tão precisos quanto possível.
Não, será um modelo adequado, não um modelo significativo!
Sim
É bastante bizarro.
Não sabe como estimar a relação entre a meta e o conjunto de valores ao quantificar. A grade é dividida em um determinado número de seções, se possível, para todos os preditores, e isso nem sempre é necessário. Mas CatBoost sabe como trabalhar com a grelha de quantização submetida (preparada separadamente), o que eu uso.
E sabes como?