Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3370

 
Bogard_11 #:

Opadrão, também conhecido como modelo, é apenas um. Assim que você simplificar qualquer movimento para ABC, poderá encontrar todas as proporções da matriz do padrão. Embora, mesmo sem o aprendizado de máquina, tudo isso possa ser facilmente calculado à mão. O Ranok não é mais complicado do que as aulas de álgebra e geometria na escola.

Um padrão, por exemplo, em modelos de madeira, dos quais existem muitos modelos, é uma árvore. Em cada modelo de madeira, por exemplo, o CatBoost encontra mais de cem árvores, leia-se padrões. Para o RandomForest, tenho estatísticas: até 50 árvores, o erro de classificação cai e, acima de 150 árvores, o erro de classificação é estável, ou seja, na série temporal que processei, o número de padrões não excede 150.

 
СанСаныч Фоменко #:

Um padrão, por exemplo, em modelos de madeira, dos quais existem muitos modelos, é uma árvore. Cada modelo de madeira, por exemplo, o CatBoost encontra mais de cem árvores, leia-se padrões. Para o RandomForest, tenho estatísticas: até 50 árvores, o erro de classificação cai e, acima de 150 árvores, o erro de classificação é estável, ou seja, na série temporal que processei, o número de padrões não excede 150.

Falta apenas um pouco para formalizar esses 150 padrões em um padrão comum. Se houver A e houver B, então C ocorrerá em um determinado momento em tal e tal pato; caso contrário, o momento e o ponto serão diferentes. Existem apenas três variantes diferentes do desenvolvimento de C. Tudo é decidido pelo TEMPO! E isso pode ser facilmente trabalhado primeiro à mão, e depois você pode colocá-lo em um robô, se quiser.

P.S. - Não apenas o tamanho de A já fornece certos níveis para o recuo de B (muitas vezes o recuo não excede 1-3 pontos). Da mesma forma, B sinaliza antecipadamente sobre os níveis de preço de C. Há muita matemática por toda parte.

Por exemplo, um Expert Advisor manual calcula automaticamente os níveis a partir do movimento no qual estamos interessados. Ou seja, puxamos a onda desejada e o futuro já está marcado.

Arquivos anexados:
 
СанСаныч Фоменко #:

Um padrão, por exemplo, em modelos de madeira, dos quais existem muitos modelos, é uma árvore. Cada modelo de madeira, por exemplo, o CatBoost encontra mais de cem árvores, leia-se padrões. Para o RandomForest, tenho estatísticas: até 50 árvores, o erro de classificação cai e, acima de 150 árvores, o erro de classificação é estável, ou seja, na série temporal que processei, o número de padrões não excede 150.

Em vez disso, o caminho para cada folha cuja resposta excede seu limite para abrir uma negociação é um padrão.
Por exemplo:
1ª divisão: 40 bar delta com corrente = 0,
2ª divisão: 30 bar = 100,
3ª divisão: 20 bar = 50,
4ª divisão: 10 bar 100,
5ª divisão: 1 bar = 0.
São dois topos com um vale. Um padrão? Sim. O caminho para 1 folha o descreve.

Se você tiver 20 folhas em sua árvore que excedam o limite que você está negociando, você tem 20 padrões em sua árvore que você usa. Folhas menos bem-sucedidas - também descrevem padrões, mas são aleatórias/perdidas.
Outras 100 árvores podem usar outras fichas/barras com diferentes valores de divisão.
A Forest calculará a média (somará e dividirá pelo número de árvores) das respostas de todas as árvores e obteremos uma opinião média sobre a situação.
Boost simplesmente adicionará um coeficiente de ponderação/esclarecimento.

 
Bogard_11 #:

Falta apenas umpouco para formalizar esses 150 padrões em um padrão comum. Se existe A e existe B, então C virá em um determinado momento em tal e tal pato, caso contrário, o tempo e o ponto serão diferentes. Existem apenas três variantes diferentes do desenvolvimento de C. Tudo é decidido pelo TEMPO! E isso pode ser facilmente resolvido à mão, e depois você pode colocá-lo em um robô, se quiser.

P.S. - Não apenas o tamanho de A já fornece certos níveis para o recuo de B (muitas vezes o recuo não excede 1-3 pontos). Da mesma forma, B sinaliza antecipadamente sobre os níveis de preço de C. Há muita matemática por toda parte.

Por exemplo, um Expert Advisor manual calcula automaticamente os níveis a partir do movimento no qual estamos interessados. Ou seja, puxamos a onda desejada e o futuro já está marcado.

Não há necessidade de formalizar nada - tudo é feito para você.

 
Forester #:

Em vez disso, o caminho para cada planilha cuja resposta excede seu limite para abrir uma negociação é um padrão.
Por exemplo:
1ª divisão: 40 bar delta com corrente = 0,
2ª divisão: 30 bar=100,
3ª divisão: 20 bar =50,
4ª divisão: 10 bar 100,
5ª divisão: 1 bar = 0.
São dois topos com um vale. Um padrão? Sim. O caminho para 1 folha o descreve.

Se você tiver 20 folhas em sua árvore que excedam o limite que você está negociando, você tem 20 padrões em sua árvore que você usa. Folhas menos bem-sucedidas - também descrevem padrões, mas são aleatórias/perdidas.
Outras 100 árvores podem usar outras fichas/barras com diferentes valores de divisão.
A Forest calculará a média (somará e dividirá pelo número de árvores) das respostas de todas as árvores e obteremos uma opinião média sobre a situação.
Boost simplesmente adicionará um coeficiente de ponderação/esclarecimento.

Uma árvore é uma árvore e você pode até imprimi-la, se bem me lembro.

As folhas, por outro lado, são um assunto obscuro. É no nível da folha que o algoritmo, juntamente com as canetas do designer, busca um equilíbrio entre o erro de classificação e o viés. É possível definir as árvores de forma tão profunda que elas descrevam exatamente o conjunto de entrada - treinamento excessivo ou ajuste excessivo. E o problema é obter uma classificação com erro mínimo em um futuro em que não conhecemos o conjunto de entrada. As folhas são finitas, é claro, mas precisam ser aproximadas, não exatamente "finitas". Portanto, um padrão é uma árvore.

 
СанСаныч Фоменко #:

Uma árvore é uma árvore e, se bem me lembro, elas podem até ser impressas.

Mas a questão das folhas é obscura. É no nível da folha que o algoritmo, juntamente com as canetas do designer, busca um equilíbrio entre o erro de classificação e a tendência. É possível definir as árvores de forma tão profunda que elas descrevam exatamente o conjunto de entrada - treinamento excessivo ou ajuste excessivo. E o problema é obter uma classificação com erro mínimo em um futuro em que não conhecemos o conjunto de entrada. As folhas são finitas, é claro, mas precisam ser aproximadas, não exatamente "finitas". Portanto, um padrão é uma árvore.

Eu discordo. Dei um exemplo de uma folha com uma profundidade de 5 (a folha é obtida por meio de 5 divisões e é um padrão). Se você obtiver uma folha por meio de 200 divisões, isso lhe dará um padrão excessivamente treinado que terá um desempenho ruim em novos dados. Mas ele não deixará de ser um padrão. Uma árvore é um conjunto de padrões.

 
Forester #:

Eu discordo. Dei um exemplo de uma planilha de 5 profundidades (a planilha é obtida por meio de 5 divisões e é um padrão). Se você obtiver uma planilha por meio de 200 divisões, ela lhe dará um padrão retreinado que terá um desempenho ruim nos novos dados. Mas ele não deixará de ser um padrão. Uma árvore é um conjunto de padrões.

Vamos começar pelo fogão.

Estou considerando duas variantes de árvores: ensacamento e tipos booleanos (rf, ada).

Qualquer um desses conjuntos bastante amplos de algoritmos considera os dados de entrada POSSIVELMENTE, sem referência às linhas vizinhas.

Em uma única linha, é feita uma seleção de valores de previsão que prevejam a classe especificada pela variável de destino (o professor) com a maior probabilidade.

A combinação de um certo número de preditores do conjunto de preditores de entrada e seus valores em uma única linha é chamada de padrão.

 
СанСаныч Фоменко #:

Em uma única linha, são selecionados os valores do preditor que preveem a classe especificada pela variável de destino (professor) com a maior probabilidade.

A combinação de um certo número de preditores do conjunto de preditores de entrada e seus valores em uma linha pode ser chamada de padrão.

Você não entendeu bem o stovepipe. Parece que você nunca olhou para o código de construção da árvore.... Não há nenhuma operação em uma única linha!!!, somente com conjuntos (completos ou em lotes).

Em resumo:
Um conjunto aleatório/completo de linhas passado para o treinamento é classificado um a um para cada preditor/coluna. Diferentes divisões são verificadas (média/percentual/aleatória), as estatísticas de cada uma são contadas e a melhor divisão é selecionada para todo o conjunto de linhas, e não para uma ou cada linha, como você sugeriu.
De acordo com a melhor divisão, o conjunto de cadeias de caracteres é dividido em dois conjuntos e, em seguida, cada conjunto é classificado novamente e a melhor divisão é selecionada para cada uma das partes etc. até que a regra de parada seja atingida (por profundidade, número de exemplos por linha etc.)

Você pode ver mais detalhes no editor, pois tem o arquivo:
\MQL5\Include\Math\Alglib\dataanalysis.mqh
Função ClassifierSplit() e a função a partir da qual ela é chamada.
Você entenderá isso em algumas horas e não precisará falar sobre a busca de preditores por uma linha.
 
СанСаныч Фоменко #:

Não há necessidade de formalizar nada - tudo já foi feito para você.

E qual é a precisão do seu robô no intervalo de mais ou menos duas ou três horas no futuro? Estou falando do ponto de pivô que sua IA calculará no futuro. Com um erro de mais ou menos 5-10 pips intraday na mesma libra-dólar e um erro de +-1-2 barras no m5.

E sua IA será capaz de perceber a tempo que o modelo (padrão) se moveu não pelo preço, mas pelo tempo? Isso significa que não o primeiro, mas o segundo ou terceiro ponto de cálculo será acionado. :)

Os programadores são como crianças, se alguém duvida das capacidades de um computador (como se uma máquina encontrasse tudo), eles imediatamente fazem beicinho e se ofendem. ;) E ninguém consegue perceber que você nunca verá por que não consegue encontrar um algoritmo que funcione 100%. E tudo porque há um pequeno detalhe imperceptível, que é o que dá um sinal de que as proporções do padrão no futuro mudarão em uma certa quantidade. Mas vocês são heniuses e deuses do código, não é uma atitude honrosa escolher algo (pesquisar tudo manualmente, contando com um papel ou calculadora). É mais fácil codificar algumas besteiras na entrada, obter besteiras na saída e depois tentar otimizar tudo isso.

Um sistema matemático lógico claro foi descrito há mais de 100 anos (ele ainda funciona como um relógio). Tanto em termos de álgebra quanto de geometria. Mas os inventores de seus próprios lisapedes ainda estão em abundância....

 
Bogard_11 #:

Um sistema matemático lógico claro foi descrito há mais de 100 anos (ainda funciona como um relógio). Tanto em termos de álgebra quanto de geometria. Mas ainda há muitos inventores de suas próprias lysapedes.....

Então, mostre-nos sua profissão...
Por que todas essas palavras-chave?

E vamos ver como seu TS funciona de acordo com uma teoria de cem anos que funciona como um relógio...
Vamos lá.