Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 79

 
Dr.Trader:

Eu usei o método "repeatedcv" no trainControl, com uma divisão padrão. Recentemente eu mesmo escrevi código para a validação cruzada, tentei a validação cruzada tanto com barras tiradas aleatoriamente como com pedaços tirados consecutivamente, sem lacunas. Não vi nenhuma diferença na frente, deu aproximadamente o mesmo resultado em ambos os casos. Eu dividi os dados para treinamento/crossvalidação 50%/50%, talvez nessa proporção não tenha mais importância.
Vou fazer experiências com isso em carpete...

Lembro-me que naquele artigo que você postou há algum tempo atrás, a comparação principal foi o aumento de árvores com o método de Platt (algo parecido com isso). Tudo o que encontrei no google sobre este método é que você tem que passar a saída do modelo para sigmoid e pegar o seu resultado. O gbm ou o xgboost podem fazer isso? Esta abordagem parece ser melhor do que floresta, neurônio e algumas "árvores ensacadas" que vêm em segundo lugar.

Gbm e xgboost são árvores impulsionadas. Para uma melhor convergência em grpdiente cada nova árvore é construída sobre observações ponderadas com base nos resultados da aprendizagem da árvore anterior. Tanto modelos lineares como não lineares podem ser impulsionados...

Em segundo lugar, há uma floresta aleatória. Isto é um saco, pelo que eu entendo. Os resultados médios de vários modelos construídos com base em dados diferentes.

Leia sobre o Gradient boosting. É difícil encontrar um melhor para a classificação. Eu, por exemplo, classifico com base nos resultados do preditor de regressão.
 
Sobre o CV. A configuração padrão é o particionamento aleatório... Para as séries temporais, a separabilidade temporal é importante... Em carpete, isto pode ser feito. O CV da série temporal Caret dobra à medida... Procura-o. No meu código que publiquei antes. É implementado no controlo de comboios lá.
 
Alexey Burnakov:
Sobre o CV. O padrão é o particionamento aleatório... Para as séries temporais, a separabilidade temporal é importante... podes fazer isso em carpete. O CV da série temporal Caret dobra à medida... Procura-o. No meu código que publiquei antes. É implementado no controlo de comboios.

Estou a olhar para ti e estou espantado... Queres tirar algo do nada. Ou seja, você quer obter 0,0000000000000000000000000000000000000000 resultado a partir de zero. Não posso ver mais nada disto, por isso, vou dar-te uma ajuda. Na verdade, a topologia da rede é secundária. Na aprendizagem mecânica, em forex e mais além, os dados vêm primeiro. Ou seja, o mais importante no desenho de redes neurais não é a topologia da rede ou o método de treinamento. São dados de entrada e dados de saída. Se os dados são relevantes para o mercado - mesmo um pequeno perseptron resolverá o seu problema de classificação e funcionará bem no futuro, por uma simples razão, porque os dados de entrada são relevantes para o mercado e estes dados são capazes de prever. E o que você está tentando fazer é arranhar a superfície de informações irrelevantes. Desculpe, mas o resultado também será irrelevante.... Quanto ao mercado, em forex, o principal é o volume, e depois a reação do mercado a ele. E não o volume que está em MT (tick), mas o volume real de futuros, o mesmo euro. Use o delta de cluster para o ajudar. Há muita informação útil. Assim, usando o volume de negócios, irá aumentar significativamente o desempenho de qualquer rede, mesmo a mais simples perseptron. Também tem um delta, que também é extremamente útil. Mas você está tentando construir um modelo com base em indicadores que são secundários, eu diria terciário depois do preço e você espera um milagre a partir dele. Não vai haver milagre, garanto-vos.....

P.S., pensa em quem estás a tentar concorrer contra... Empresas com equipas dos programadores mais fixes, com mais poder de processamento do que o seu quad-core. Com dinheiro investido no desenvolvimento de novos métodos, etc. E aqui Alexey do simples interior russo decidiu entrar no mercado em 5 anos e conseguir o graal. Desça dos céus e tire os óculos cor de rosa........

 
Mihail Marchukajtes:

Na aprendizagem mecânica, em forex e mais além, os dados vêm primeiro. Ou seja, o mais importante ao desenhar redes neurais não é a topologia da rede ou o método de treinamento. São dados de entrada e dados de saída. Se os dados são relevantes para o mercado, qualquer perseptron, mesmo um pequeno, resolverá seu problema de classificação e funcionará bem no futuro, por uma simples razão, porque os dados de entrada são relevantes para o mercado e esses dados são capazes de prever isso.

Nem sequer tenho nada com que discutir, está correcto. Sabemos disso também, e estamos discutindo não apenas modelos de classificação, mas também métodos de seleção de preditores (dados de entrada), leia primeiro este tópico.

Presumo que você esteja esperando selecionar manualmente uma dúzia de entradas, construir um modelo, trocar por uma semana, começar a perder, começar a escolher entradas novamente. Eu também já fiz isso, às vezes tenho estratégias engraçadas como "pegar um certo grão para inicializar o neurônio, treiná-lo exatamente 7777 iterações, tudo ficará bem, mas todas as terças-feiras você tem que trocar contra o seu sinal". Otimizar a rede com novos dados dia sim, dia não". Tais estratégias são reais, mas leva muito tempo para escolher algo assim e só dá lucro por algumas semanas. Tudo porque tal estratégia é baseada em algum padrão de curto prazo.

Em vez disso, seleciono um algoritmo para seleção automática de entradas. É simples, existem cerca de 100 entradas em cada barra e um algoritmo que selecciona uma tal combinação de entradas que todas juntas dão consistentemente um sinal de compra/venda válido durante todo o ano. Não é como a otimização dos Expert Advisors em mt5, onde um EA pode alcançar grandes resultados e falhar na frente, mas é mais complicado, com validações cruzadas e critérios diferentes de estimar o resultado. Eu costumava selecionar cerca de cem entradas, agora é menor, apenas algumas dúzias. Eu tenho 60%-70% de precisão na frente, mas ainda é instável, eu preciso me livrar dos graus de liberdade em todo o processo de seleção e treinamento para obter aproximadamente os mesmos resultados, mesmo começando do zero a cada vez.

Mihail Marchukajtes:

P.S., pensa só em quem estás a tentar enfrentar... Empresas com equipas dos programadores mais fixes, com mais poder de processamento do que o seu quad-core. Com dinheiro investido no desenvolvimento de novos métodos, etc. E aqui Alexey do simples interior russo decidiu entrar no mercado em 5 anos e conseguir o graal. Desça do céu e tire os óculos cor-de-rosa........

Empresas com instalações próprias e programadores utilizam o mesmo software de análise e modelação de dados que temos à nossa disposição. Digamos que eles treinam o modelo perfeito e obtêm 100% de lucro por mês. Tenho menos poder, com os mesmos dados poderei construir um modelo mais fraco com, digamos, apenas 50% do lucro. Isto vai ser suficiente para mim.

 
Mihail Marchukajtes:

Olho para ti e é incrível... Queres tirar algo do nada. Ou seja, de zero, você quer obter 0,0000000000000000000000000000000000000000000000000000 resultado. Não consigo olhar mais para isso, por isso vou dar-te uma ajuda. Na verdade, a topologia da rede é secundária. Na aprendizagem mecânica, em forex e mais além, os dados vêm primeiro. Ou seja, o mais importante no desenho de redes neurais não é a topologia da rede ou o método de treinamento. São dados de entrada e dados de saída. Se os dados são relevantes para o mercado - mesmo um pequeno perseptron resolverá o seu problema de classificação e funcionará bem no futuro, por uma simples razão, porque os dados de entrada são relevantes para o mercado e estes dados são capazes de prever. E o que você está tentando fazer é arranhar a superfície de informações irrelevantes. Desculpe, mas o resultado também será irrelevante.... Quanto ao mercado, em forex, o principal é o volume, e depois a reação do mercado a ele. E não o volume que está em MT (tick), mas o volume real de futuros, o mesmo euro. Use o delta de cluster para o ajudar. Há muita informação útil. Assim, usando o volume de negócios, irá aumentar significativamente o desempenho de qualquer rede, mesmo a mais simples perseptron. Também tem um delta, que também é extremamente útil. Mas você está tentando construir um modelo com base em indicadores que são secundários, eu diria terciário depois do preço e você espera um milagre a partir dele. Não vai haver milagre, garanto-vos.....

P.S., pensa em quem estás a tentar concorrer contra... Empresas com equipas dos programadores mais fixes, com mais poder de processamento do que o seu quad-core. Com dinheiro investido no desenvolvimento de novos métodos, etc. E aqui Alexey do simples interior russo decidiu entrar no mercado em 5 anos e obter o graal. Desça do céu e tire os óculos cor-de-rosa........

Demagogo, ouch. Já estava na hora de saíres daqui. Construir uma casa.

"O cão ladra, a caravana vai." С

 
Dr. Trader:

Eu nem sequer tenho nada com que discutir, é verdade. Sabemos disso também, e estamos discutindo não apenas modelos de classificação, mas também métodos de seleção de preditores (inputs), leia primeiro este tópico.

Presumo que você esteja esperando selecionar manualmente uma dúzia de entradas, construir um modelo, trocar por uma semana, começar a perder, começar a escolher entradas novamente. Eu também já fiz isso, às vezes tenho estratégias engraçadas como "pegar um certo grão para inicializar o neurônio, treiná-lo exatamente 7777 iterações, tudo ficará bem, mas todas as terças-feiras você tem que trocar contra o seu sinal". Otimizar a rede com novos dados dia sim, dia não". Tais estratégias são reais, mas leva muito tempo para escolher algo assim e só dá lucro por algumas semanas. Tudo porque tal estratégia é baseada em algum padrão de curto prazo.

Em vez disso, seleciono um algoritmo para seleção automática de entradas. Simplesmente, tenho cerca de 100 entradas em cada barra e um algoritmo que selecciona uma tal combinação de entradas que todas juntas dão consistentemente um sinal de compra/venda válido durante todo o ano. Não é como a otimização dos Expert Advisors em mt5, onde um EA pode alcançar grandes resultados e falhar na frente, mas é mais complicado, com validações cruzadas e diferentes critérios de estimar o resultado. Eu costumava selecionar cerca de cem entradas, agora é menor, apenas algumas dúzias. Eu tenho 60%-70% de precisão na frente, mas ainda é instável, preciso me livrar dos graus de liberdade em todo o processo de seleção e treinamento para obter aproximadamente os mesmos resultados, mesmo começando do zero a cada vez.

As empresas com suas instalações e programadores utilizam o mesmo software de análise e modelagem de dados disponível para nós. Eles vão treinar um modelo perfeito e obter 100% de lucro por mês. Tenho menos poder, com os mesmos dados posso construir um modelo mais fraco, com, digamos, apenas 50% do lucro. Eu vou ficar bem.

Deixa-me pôr as coisas desta maneira. Os fundos de topo mostram um retorno médio anual de 40-50%. Os inteligentes trabalham lá, assim como aqueles que são simplesmente fantásticos. Não vejo nada de anormal para eu chegar perto da marca dos 50% ao ano e ter esse aumento.
 
Alexey Burnakov:
Deixa-me pôr as coisas desta maneira. Os fundos de topo mostram um retorno médio anual de 40-50%. Eles podem trabalhar lá tanto pessoas inteligentes como excelentes. Não vejo nada de anormal que me aproxime a 50% ao ano e que tenha este crescimento.

Primeiro - os fundos mostram um rendimento tão miserável por uma única razão, a falta de liquidez no mercado, é difícil colocar uma grande quantidade de dinheiro na estratégia, você não tem tais problemas

Segundo - Porque não apontar para 100% por mês, digamos?

Concordo plenamente comMihail Marchukajtes, a fim de elevar a qualidade do reconhecimento que precisamos para elevar a qualidade dos sinais, e modelos.... sua influência +/- 5% sobre o resultado global

 
mytarmailS:

Primeiro - os fundos mostram um rendimento tão miserável por uma única razão, a falta de liquidez no mercado, é difícil colocar uma grande quantidade de dinheiro na estratégia, você não tem tais problemas

Segundo - Porque não apontar para 100% por mês, digamos?

Concordo plenamente comMihail Marchukajtes, a fim de elevar a qualidade do reconhecimento que precisamos para elevar a qualidade dos sinais, e modelos.... a sua influência +/- 5% no resultado final

Você também é um demagogo. Bem, mostre-nos as entradas com este grau de informatividade. Porque levamos os modelos de topo? Para espremer sinais a partir de dados ruidosos, se tivéssemos dados sem ruído, também poderíamos fazer uma fórmula em excel.

"100% por mês". Esforce-se, mostre resultados, compartilhe idéias. Vamos ouvi-lo, como aumentar a sua rentabilidade em 20 vezes e como não se retirar no próximo mês do sorteio.

 
Alexey Burnakov:

Você também é um demagogo. Bem, mostre-nos as entradas com este grau de informatividade. Porque levamos os modelos de topo? Para espremer sinais a partir de dados ruidosos, se tivéssemos dados sem ruído, poderíamos fazer a fórmula em Excel.

"100% por mês". Esforce-se, mostre resultados, compartilhe idéias. Vamos ouvi-lo, como aumentar a sua rentabilidade em 20 vezes e como não desistir no próximo mês de um sorteio.

"long-livers" de forex. Mais de 5 anos de negociação. Ordenado por FS. Sim, alguns têm retornos cósmicos, mas outras estatísticas são más. Isto é a realidade. E a Stabiliti está a trocar de mãos. Todos os outros mostram FS de 3 e menos.

 
Alexey Burnakov:

Você também é um demagogo. Bem, mostre-nos as entradas com este grau de informatividade. Porque levamos os modelos de topo? Para espremer sinais a partir de dados ruidosos, se tivéssemos dados sem ruído, poderíamos fazer a fórmula em Excel.

"100% por mês". Esforce-se, mostre resultados, compartilhe idéias. Vamos ouvir como aumentar o rendimento em 20 vezes e como não se perder no próximo mês a partir de um sorteio.

Somos todos demagogos aqui, só você é d'artagnan, já está claro, bom que pelo menos você não é um troll.... adeus..... :)


Não acho que seja uma verdadeira estratégia comercial, mas aprendi que ele é um profissional profundo e não tenho perguntas sobre o mercado que não tenham sido respondidas... Quero agradecer-lhe por isso.

Este homem é doutorado. D. em ciências técnicas, defendeu sua dissertação sobre "IA" há muito tempo (cerca de 20 anos atrás) Ele tem construído robôs há mais de 20 anos e tem muita experiência.

E ele diz que não se pode prever o mercado a partir de uma abordagem de caixa negra, mas é necessário identificar os atributos de trabalho, entender como e por que eles funcionam e filtrar os dados o máximo possível, a fim de deixar apenas o que funciona, ignorando o ruído.

Ele tem uma rede de cerca de 100 sinais (preditores), cada característica tem uma biblioteca inteira ou pacote como você quiser.

E agora compare a diferença de qualidade entre um sinal que requer uma biblioteca inteira e uma coisa tola, cujo nome é "SMA". MACD". ... "RSI", etc... Eles têm 0,00000001% de informação útil, tal comoMihail Marchukajtes escreveu, e é um facto, caso contrário os modelos mostrariam exactamente o desempenho que podem mostrar, o que significa 90% das respostas correctas

O homem recomenda a leitura de "MSUA" e análise espectral em particular de Fourier

========================================================

Além dos resultados que eu "demagogo" tenho alcançado, mas na verdade muito modestos, boas idéias como eu penso muito, minha pesquisa está indo em várias direções simultaneamente e há uma enorme falta de conhecimento em vários campos, porque muitas vezes pedir ajuda aos participantes do fórum, mas especialmente para ajudar e ninguém quer, eles dizem que você aprende sozinho, e então..... só se eu mesmo tiver dominado tudo então porque eu faço esta comunicação, pois sem lógica, eu me distraio.


Aqui está a melhor coisa sobre o dan. Mãe. que eu consegui espremer de RF nos novos dados é 50% por mês durante 2 meses seguidos, mas tudo ainda está muito instável, tentei preencher as fotos 10 vezes, mas não consegui (consegui)

ww

www

O resultado final é que você não deve se limitar com modelos como 30% ao ano é legal, não é legal, é uma estrutura para a mente e criatividade