Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2729

 
Aleksey Nikolayev #:

O significado não está nos critérios, mas na maneira como eles são usados. Sua maneira de usá-los não está nada clara (o que você compara com o quê e com que finalidade).

Ok, como você está sendo esperto, não está disposto a pensar nessa direção. Não vou me incomodar.

 
Aleksey Vyazmikin #:

Certo, se estiver sendo esperto, então não vai querer pensar nessa direção. Não vou me incomodar.

Alexei, aprenda a formular seus pensamentos, se realmente quiser ser compreendido...

 
mytarmailS #:

Alexei, aprenda a formular seus pensamentos se quiser ser compreendido.

E onde você perdeu minha linha de raciocínio?

Meus pensamentos são formulados - eu entendo do que estou falando, se alguém não entende - pergunte. Talvez você precise aprender a entender melhor a essência, sem se apegar a termos....

 
Aleksey Vyazmikin #:

Certo, se estiver sendo esperto, então não vai querer pensar nessa direção. Não vou me incomodar.

Ou você não consegue formular uma ideia ou não quer compartilhá-la. Em ambos os casos, não vale a pena continuar a desenvolver o tópico e vamos deixar de lado a questão pessoal.

 
Aleksey Vyazmikin #:

Você acha que o Critério não faz sentido? Pegue dez amostras de tamanhos diferentes e compare-as - escolha aquela com as melhores pontuações em vários indicadores que são responsáveis pela semelhança/similaridade/homogeneidade das amostras.

Pegamos e misturamos as amostras, obtemos pontuações diferentes... ficamos tristes

* Misturamos as amostras entre si. Como ninguém proíbe isso, já que não é um modelo sequencial que está sendo treinado, a sequência de amostras não importa. Só importa o erro de classificação, que sempre pode ser reduzido por meio da mistura.

Para pesquisar algo, você precisa entender com muita precisão o que está procurando, caso contrário, ficará brincando com amostras até ficar estupefato. Bem, ninguém sabe o que está sendo pesquisado. Se alguém souber, me avise.
 
Há outro truque. Quanto mais não informativos forem os recursos, menor deverá ser a amostra de treinamento.

Quanto mais informativos forem os atributos e houver menos deles, maior poderá/deverá ser a amostra. E quase todo mundo pensa o contrário.
 
Aleksey Nikolayev #:

Ou você não consegue formular uma ideia ou não quer compartilhá-la. Em ambos os casos, não vale a pena continuar a desenvolver o tópico e vamos deixar de lado a questão pessoal.

Eu não escrevi que a ideia é comparar amostras (treinamento e aplicação), que se sua teoria estiver correta, a amostra deixará de ser semelhante à medida que aumenta, e para entender isso você precisa de critérios para avaliar sua mudança, que são derivados dos métodos de avaliação de similaridade?

Além disso, falei sobre a marcação de toda a amostra em seções de acordo com alguma característica de tendência comparável e a classificação dentro desses grupos. E essa classificação pode ser feita novamente por critérios de "similaridade" de amostras.

Não estou levando para o lado pessoal - vejo o estilo da resposta e estou apenas intrigado - o que as pessoas estão fazendo aqui - elas querem mostrar sua singularidade? Estou interessado em encontrar maneiras de resolver o problema, estou interessado em usar o conhecimento de outras pessoas e compartilhar o meu próprio.

 
Maxim Dmitrievsky #:
Pegue e misture amostras, obtenha estimativas diferentes... triste

* misturá-las entre si. Como ninguém proíbe isso, já que não se trata de um modelo sequencial sendo treinado, a sequência de amostras não importa. Importa apenas o erro de classificação, que sempre pode ser reduzido pela mistura.

Para pesquisar algo, você precisa entender com muita precisão o que está procurando, caso contrário, ficará brincando com amostras até ficar estupefato. Bem, ninguém sabe o que está sendo pesquisado, portanto, se alguém descobrir, me avise.

Você pode misturar apenas dentro de um sample; se misturar dois samples, isso significa negar que o mercado está mudando.

 
Maxim Dmitrievsky #:
Pegue e misture amostras, obtenha estimativas diferentes... triste

* misturá-las entre si. Como ninguém proíbe isso, já que não se trata de um modelo sequencial sendo treinado, a sequência de amostras não importa. Importa apenas o erro de classificação, que sempre pode ser reduzido pela mistura.

Para pesquisar algo, você precisa entender com muita precisão o que está procurando, caso contrário, ficará brincando com amostras até ficar estupefato. Bem, ninguém sabe o que está sendo pesquisado. Se alguém souber, me avise.

Não gosto muito do que você e Alexey têm em comum em seu raciocínio - você os tem no contexto de um modelo específico e estuda seu comportamento quando a amostra de treinamento muda. Idealmente, eu gostaria de ser independente de um modelo específico ao selecionar a amostra de treinamento - é por isso que decidi usar vértices em ziguezague por enquanto. Mas vocês provavelmente estão certos e a independência total do tipo de TC dificilmente será possível.

 
Aleksey Vyazmikin #:

Não escrevi que a ideia de comparar amostras (treinamento e aplicação) é que, se sua teoria estiver correta, a amostra deixará de ser semelhante à medida que aumentar e, para perceber isso, você precisa de critérios para avaliar sua mudança, que são derivados de métodos de avaliação de similaridade?

Aqui, aparentemente, você está falando de amostras multivariadas (cada elemento é uma linha de uma tabela, um vetor), enquanto os critérios de homogeneidade em seus três links são sobre amostras numéricas. Os critérios de homogeneidade multivariada no matstat são uma música à parte e não estão muito claros para mim.

Aleksey Vyazmikin #:

Além disso, eu estava falando sobre dividir toda a amostra em seções de acordo com alguma característica de tendência comparável e classificar dentro desses grupos. E essa classificação pode ser feita novamente de acordo com os critérios de "similaridade" das amostras.

É semelhante à tarefa de buscar a detecção de muitos pontos de alteração. Novamente, acontece que temos de trabalhar com um caso multidimensional (vetor), o que complica bastante a questão.

Bem, e em geral, não gosto da dependência de quais atributos são escolhidos para investigação. Se usarmos conjuntos diferentes deles, os resultados podem ser diferentes.