Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3354

 
Aleksey Vyazmikin #:

As probabilidades do modelo são dadas pelas estatísticas da amostra de treinamento.

Assim, sem uma amostra representativa, elas não são precisas, portanto, supere isso :)

Ou descubra em que consiste o modelo e reponha o peso das folhas de acordo com o algoritmo que você criou....

As probabilidades do modelo são dadas pelo sigmoide, não por isso. Para simplificar, você pega o trilho e o eixo, independentemente do que estiver do lado de fora. E, mesmo assim, você tem uma gagueira.
 
Maxim Dmitrievsky #:
As probabilidades do modelo são dadas pelo sigmoide, não por isso.

Sim, bem, que número você coloca na função, de onde ele vem?

 
Aleksey Vyazmikin #:

Sim, bem, que número você coloca na função, de onde ele vem?

Você vai responder a uma pergunta com uma pergunta? Eu sei a resposta definitiva, se for o caso.
 
O que você obtém no resultado dos modelos não são probabilidades de classe. Uma analogia é a regressão, que fornece um único valor. Um classificador funciona com o mesmo princípio, ele fornece um valor bruto passado por um sigmoide, não uma probabilidade.

Como obter a probabilidade?
 
Maxim Dmitrievsky #:
Como você percebeu que o classificador fornece as probabilidades corretas? Não apenas valores em um intervalo. Você lê o que está sendo escrito para você?

Se você definir um limite de 0,8, 80% das negociações serão lucrativas? E se for 0,51?

É quase certo que não. Dê uma olhada.

Eu já verifiquei várias vezes. Essa é a base para o TC.

Novamente, se não estiver, será retreinado.

 
Maxim Dmitrievsky #:
O que você obtém no resultado dos modelos não são probabilidades de classe. Uma analogia é a regressão, que fornece um único valor. O classificador funciona com o mesmo princípio, ele fornece um valor bruto passado por um sigmoide, não uma probabilidade.

Como obter a probabilidade?

Ao passar pela sigmoide, obtemos a classe, não a probabilidade da classe.

 
СанСаныч Фоменко #:

Ao passar pela sigmoide, obtemos uma classe, não a probabilidade da classe.

Obtemos um valor que é chamado de probabilidade, mas na verdade não é.
 
СанСаныч Фоменко #:

Verifiquei isso várias vezes. Essa é a base para o TC.

Novamente, se não estiver, ele é retreinado.

Não acredito em sua palavra, existem testes para isso.
 
Maxim Dmitrievsky #:
Você vai responder a uma pergunta com uma pergunta? Eu sei qual é a resposta inequívoca, se é que existe alguma.
Maxim Dmitrievsky #:
O que você obtém na saída dos modelos não são probabilidades de classes. Uma analogia é a regressão, que fornece um valor. Um classificador funciona com o mesmo princípio, ele fornece um valor bruto passado por um sigmoide, não uma probabilidade.

Como obter a probabilidade?

Você sabe como o valor é obtido nas folhas do modelo CB, você pode reproduzi-lo?

A questão é que as probabilidades são estimadas pelo histórico, mas somente uma teoria com uma amostra representativa pode garantir que elas continuarão a ser assim. Nós não temos essa amostra. Portanto, quaisquer ajustes nessa direção não proporcionarão precisão em novos dados. A correção pode ser relevante pelo fato de haver detritos nas folhas, e é isso que precisa ser corrigido pela superestimação ou subestimação do ponto de classificação sigmoidal.

Ou, novamente, não está claro do que se trata.

Se você encontrou algo inteligente, compartilhe :)

 
Aleksey Vyazmikin #:

Você sabe como o valor nas folhas do modelo CB é derivado? Você pode reproduzi-lo?

A questão é que as probabilidades históricas são estimadas, mas somente uma teoria com uma amostra representativa pode garantir que elas continuarão a ser assim. Não temos essa amostra. Portanto, quaisquer ajustes nessa direção não proporcionarão precisão em novos dados. A correção pode ser relevante pelo fato de os detritos terem entrado nas folhas, e é isso que deve ser corrigido, seja por dependência ou subestimação do ponto de classificação sigmoidal.

Ou, novamente, não está claro do que estamos falando.

Se você encontrou algo inteligente, compartilhe :)

Eu esperava que alguém pelo menos pesquisasse a dica no Google.

Mesmo que você tenha curvas de probabilidade em seu treinamento, sobre quais novos dados podemos falar. E bousting e forrest pecam muito com isso. Bousting é excesso de confiança, Forrest é falta de confiança. Desde que, é claro, você planeje usar o limite.

Eu mesmo observei que, quando você aumenta o limite, a qualidade das negociações não melhora nem mesmo na linha de base. Então, qual é a probabilidade de retorno do modelo? Nada :)

Na imagem de Sanych, o busting autoconfiante, você pode ver os outliers na coluna da borda. O vale deveria ser mais suave. Esse é um modelo de ajuste excessivo.