Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1227

 
tóxico:

As fichas são uma dúzia em termos gerais, é difícil dizer alguma coisa útil, e as especificidades, bem, sabe...

Há uma série de "regras" que permitem evitar erros graves na construção de características com séries cronológicas, em particular uma das mais violadas é uma "mistura" banal de características com alvos, características devem ser estritamente do passado, e alvos de pontos estritamente do futuro, esta separação deve ser ao nível do algoritmo de conversão de séries em conjunto de dados, e não como todos fazem todo o tipo de indicadores, em seguida, cortar para rastrear e testar, deslocar algo em algum lugar e assim por diante. Devemos cortar a série inicial e depois utilizar janelas deslizantes (passadas e futuras) para percorrer a série e obter características e alvos separadamente para Lerne e testar, ou mesmo para validação. Naturalmente, você pode fazê-lo com indicadores, se você tiver certeza de que o indicador de características não está olhando para frente e para os objetivos não está olhando para trás. Há alguns erros mais subtis, mas não vou falar deles agora.

As transformações em si podem ser diferentes, desde as triviais (retornado, variação, mudança de volume, delta de pilha, distribuição de negócios, etc.) a todo o tipo de exóticas.) dezenas de estatísticas personalizadas específicas obtidas por "inspiração" ou agrupamento que se revelaram úteis, tais como "tendência/verão" (mencionado pela Inokenty acima), assim como "ordem/haos" e outras. Algumas estatísticas são válidas para diferentes períodos de tempo, algumas não são, algumas funcionalidades funcionam para alguns instrumentos, outras não, você precisa saber como filtrar e selecionar atributos para a segmentação. Há muitas coisas, modelos padrão da ARMA, GARCH ... Previsão macro de médio e longo prazo como características, etc. Eu não tenho por aí para fazer NLP\NLU para análise de fluxos de texto, de redes sociais, etc. É aí que os dip-earnings serão definitivamente necessários.

Quando repeti artigos de Vladimir Pererwenko, fiz uma experiência adicional - sem nenhum indicador adicional(filtros digitais para os últimos artigos), ou seja, puramente sobre preços. O resultado foi apenas um par de por cento pior. E mesmo assim eu acho que é apenas um treinamento menos bem sucedido de NS (mistura diferente e inicialização de pesos, e OHLC não eram do artigo, mas do meu servidor). NS fará facilmente qualquer indicador dentro de si se precisar dele para previsões. Eu acho que não há necessidade de adivinhar qual DF com quais parâmetros (LPF/FTF/bandpass ou algum MA) é útil para a previsão. Os NS farão tudo por si só com OHLC.

Mas quanto aos erros mais subtis, ainda é interessante saber...

É uma pena que a informação útil sobre MO para BP esteja espalhada por mais de 1200 páginas. Quem me dera que tudo estivesse no mesmo sítio. Se não forem ideias de trabalho - pelo menos becos sem saída como ZZ, PCA e Peeks forward/backward/backward

 
Volta para o inferno:

Portanto, o "graal" só pode estar no contexto de ultra-hft, ou melhor, estava lá quando não havia tal regulamentação obscura, ou um insider que está disponível para caras que sem ele podem apenas imprimir a massa em uma crise e comprar seus títulos com ele))

Lá vamos nós outra vez...

Não quero saber dos teus triliões e infiltrados, conheces o ditado "um cão ladra mas a caravana rasteja", não precisamos dos teus insultos à corretora onde deixaste as tuas últimas cem libras, o mundo não é justo, tens azar, tenho sorte, vou ganhar um milhão a partir de cem, e se não, vou tentar outra vez, até o fazer.


Não nos impeça de sonhar com iates e ilhas e fazer dos nossos sonhos uma realidade passo a passo. Eles nem sabem onde baixar o Voronov e como distinguir uma tendência de um apartamento.

 
Kesha Rutov:

Lá vamos nós outra vez...

Sabes o que dizem: "O rafeiro ladra e os rastos da caravana." Não precisamos dos teus insultos à corretora onde deixaste as tuas últimas cem libras, o mundo não é justo, tiveste azar e eu vou ter sorte, vou ganhar um milhão de uma centena e se não, vou tentar novamente até ter sucesso.


Não nos impeça de sonhar com iates e ilhas e fazer dos nossos sonhos uma realidade passo a passo. Todos eles são "gurus" que nem sabem onde baixar Voronov e como distinguir uma tendência de um apartamento.

Diga imediatamente - para que CD você trabalha? Propagandista de sonhos.
 

Eu sei que ninguém tentou, mas talvez:

ordenar os negócios por lucro/perda, respectivamente, ao dividir os negócios em classes, dar mais probabilidade aos mais rentáveis, aos mais não rentáveis em torno de 0,5. Ou seja, basta ordenar os negócios por eficiência e atribuir-lhes probabilidades, é claro que os negócios mais eficazes aparecerão menos, e os mais ruidosos mais.

vale a pena experimentar? O erro deve diminuir?

 
Maxim Dmitrievsky:

Eu sei que ninguém tentou, mas talvez:

ordenar os negócios por lucro/perda, respectivamente, ao dividir os negócios em classes dá mais probabilidade aos mais rentáveis, aos mais não rentáveis em torno de 0,5. Ou seja, simplesmente ordenar as negociações por eficiência e atribuir-lhes probabilidades, é claro que as negociações mais eficientes aparecerão menos, e as ruidosas aparecerão mais.

Vale a pena experimentar? O erro deve diminuir?

Isto é regressão, mas não através da altura das barras, mas por resultados de negócios (provavelmente você precisa disso para sistemas de auto-aprendizagem). Não vou dar nenhum conselho, porque não lido com RI há 5 meses e agora estou pensando qual idéia tentar. Eu quero diminuir automaticamente a influência dos preditores de ruído. Afinal de contas, no início do ramo, estava feito.
 

1 2 Em parte sim, um fenómeno da moda, mas esta é a minha opinião, a "aprendizagem profunda" em si não é, na verdade, uma regressão/classificação em si, mas uma forma de extrair características bastante simples e hierarquicamente organizadasde dados de um certo tipo, por exemplo, imagens de pixels desenhadas pela luz refletida vinda para uma câmera do "mundo real", por si só como brilhos de pixels, são características muito ruins se você as enche como está em um classificador e a CNN faz uma espécie de "decorrelação de pixels adjacentes" e compressão da dimensionalidade, em várias passagens, semelhante pode ser feito se agruparmos imagens em pequenos fragmentos, em geral "aprendizagem profunda" é uma espécie de agrupamento em várias passagens e depois alimentar "características de alto nível" em um classificador regular. O tema é certamente muito interessante, mas é hora de desenvolvê-lo teoricamente, não apenas "ananálise" com redes neurais de diferentes arquiteturas treinadas por um backprop terrivelmente lento. Mas, mais uma vez, ainda não consegui tornar-me mais exigente com o mercado, embora a questão esteja em aberto, porque é demasiado caro para experimentar nesta direcção, como muito bem observou.

3 Você não tem que colocar constantes nas folhas das árvores, você pode colocar modelos lineares, ou mais complexos, então haverá "extrapolação" para além da nuvem de pontos)

4 Você tem algo errado e a floresta e o impulso podem fazer a regressão, sem problemas.

3. Ou seja, você pode combinar e colocar outros modelos nas folhas dos modelos da árvore de solver, eu me pergunto como funciona, por favor, dê um exemplo real.

4. Não estou confuso e vejo o problema, porque até agora não encontrei implementação em andaimes de problema de regressão com muitos outputs (variáveis dependentes) como em redes neurais.
Veja, por exemplo, a função de construção de floresta aleatória a partir da biblioteca MQL alglib.mqh

//+------------------------------------------------------------------+
//| This subroutine builds random decision forest.                   |
//| INPUT PARAMETERS:                                                |
//|     XY          -   training set                                 |
//|     NPoints     -   training set size, NPoints>=1                |
//|     NVars       -   number of independent variables, NVars>=1    |
//|     NClasses    -   task type:                                   |
//|                     * NClasses=1 - regression task with one      |
//|                                    dependent variable            |
//|                     * NClasses>1 - classification task with      |
//|                                    NClasses classes.             |

Ou seja, quando o número de variáveis dependentes é superior a uma, esta função só pode resolver o problema de classificação. Traga a sua implementação com solução para este problema, e por favor em código, afinal estamos em um fórum de programadores :)

 
Maxim Dmitrievsky:

Eu sei que ninguém tentou, mas talvez:

ordenar os negócios por lucro/perda, respectivamente, ao dividir os negócios em classes dá mais probabilidade aos mais rentáveis, aos mais não rentáveis em torno de 0,5. Ou seja, simplesmente ordenar as negociações por eficiência e atribuir-lhes probabilidades, é claro que as negociações mais eficientes aparecerão menos, e as mais barulhentas aparecerão mais.

Vale a pena experimentar? O erro deve diminuir?

Se está no testador e para, indirectamente, através da rentabilidade dos negócios, alcançar os pontos de entrada correctos, então porque não encontrá-los de uma só vez e ideal, por séries de preços, embora já o tenha perguntado no fio Monte Carlo:)
 
Ivan Negreshniy:
Se está em teste e para atingir os pontos de entrada correctos indirectamente, através da rentabilidade dos negócios, porque não encontrá-los de uma só vez e ideal, por séries de preços, embora já o tenha pedido na sucursal de Monte Carlo:)

então haverá poucos exemplos e os novos dados nos tornarão um perdedor cego, precisamos que ela "veja" o máximo possível em sua vida

você não pode simplesmente ir para um ziguezague ideal porque você não será capaz de encontrar características, deve ser um processo de duplo gume de tentar tudo simultaneamente :)

Já estou a pensar se devo ter mais aulas em vez de 2

 
Maxim Dmitrievsky:

então haverá poucos exemplos e em novos dados ns se perderão, ela deve "ver" em sua vida o máximo possível

É lógico, mas por outro lado pode ser melhor para ela ver menos e trocar apenas a coisa certa do que estar constantemente sinalizando e aumentando o risco.
 
Ivan Negreshniy:
é lógico, mas por outro lado pode ser melhor ver menos e trocar apenas uma coisa certa do que sinalizar e aumentar continuamente o risco.

Bem, eu sempre procuro erros em uma amostra de teste. Esta "certeza" só aparece para um ser humano, enquanto nós "pensamos" de forma diferente.

Acho que a forma como uma rede neural pensa... não se importa se é uma coisa certa ou não, desde que possa generalizar

se você colocar alguma porcaria na faixa de 0,5, e os picos são negócios de qualidade, a capacidade de generalização melhoraria... você deve verificar, é claro, porque você não pode fazer isso de olho