Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3325

 
mytarmailS #:

Isso é trollagem?

O que é trollagem?

Aqui está o vídeo.


 
Aleksey Vyazmikin #:

Qual é o motivo da trollagem?

Aqui está o vídeo

Éassim.

 
mytarmailS #:

assim

No meu caso, tratava-se de um lugar na Internet, ou seja, um link.

 
Aleksey Vyazmikin #:

No meu caso, tratava-se de um local na Internet, ou seja, um link.

Não me lembro do artigo exato,

mas não há um milhão deles, dê uma olhada.

 
mytarmailS #:

Não me lembro de qual artigo,

mas não há um milhão deles, dê uma olhada.

Então, fiz uma pesquisa e ainda não encontrei nada.

 
Aleksey Vyazmikin #:

Foi isso que percebi. Só estou perguntando se a causa disso já foi determinada. Não o que está quebrado, mas por que os sinais estão faltando.

O motivo é simples, como pretendido: os sinais estão ausentes porque, em novos dados, os sinais estão fora de um intervalo estreito aceitável.

Bem, isso pode ser comparado à classificação: há padrões conhecidos claros e há padrões desconhecidos obscuros. Com o passar do tempo, há cada vez mais desconhecidos e não há mais nada na classe "conhecida".

 
Aleksey Vyazmikin #:

Afirma-se que, com esse algoritmo, foi possível conquistar os primeiros lugares no cagle, mas não acho que tenha havido tarefas simples...

Vamos tentar descobrir isso? Não entendo de fórmulas - para meu grande pesar.

Também não gosto de fórmulas, mas de ideias.
E se você analisar a ideia, ela é muito ruim para os dados de mercado.

Ela sugere a exclusão de pares de exemplos de classes diferentes que são muito próximos uns dos outros. Se observarmos o terceiro exemplo, idealmente todos os exemplos de 0,2 a 0,8 serão removidos e somente as áreas abaixo de 0,2 e acima de 0,8 com pureza absoluta de classes permanecerão. Qualquer modelo os classificaria com mais facilidade.
Anteriormente, já mostrei que um exemplo tão simples e a árvore se dividirão facilmente se você usar folhas com alta pureza de classes (e não dividir folhas com até 1 exemplo em uma folha).
Mas esse é um exemplo artificial.

Nos dados de mercado, não haverá blocos puros com predominância de uma classe. Ou seja, você terá que limpar quase tudo. Por exemplo, havia 1.000 pontos, 900 foram limpos, o restante deles de alguma forma atingiu a limpeza das folhas, por exemplo, 70% - isso não parece ruim e você pode ganhar dinheiro. Mas, quando você começar a negociar de verdade, haverá exemplos dos quais nos livramos durante a limpeza (9 detritos para 1 restante) e os indicadores de 70% cairão para 53%, por exemplo, e você perderá com spread, slippages etc.

Prefiro uma árvore e uma folha com 53% de pureza honesta de uma das classes. E não a usarei.
 
Aleksey Vyazmikin #:

Então, fiz uma pesquisa e ainda não encontrei nada.

isso acontece

 
Aleksey Vyazmikin #:

Não vejo a conexão aqui. Do que isso decorre?

Ao ler o texto em seu link, havia até um teorema sobre a conexão entre eles. Não tenha preguiça de ler pelo menos seus links.
 
Forester #:
Também não estou usando fórmulas, mas ideias.
E se você analisar a ideia, ela não é tão boa para dados de mercado.

Ela sugere a remoção de pares de exemplos de classes diferentes que estejam muito próximos uns dos outros. Se observarmos o terceiro exemplo, idealmente todos os exemplos de 0,2 a 0,8 serão removidos e somente as áreas abaixo de 0,2 e acima de 0,8 com pureza absoluta de classes permanecerão. Qualquer modelo os classificaria com mais facilidade.
Anteriormente, já mostrei que esse exemplo simples e a árvore se dividirão facilmente se você usar folhas com alta pureza de classes (e não dividir folhas com até 1 exemplo em uma folha).
Mas esse é um exemplo artificial.

Nos dados de mercado, não haverá blocos puros com predominância de uma classe. Ou seja, você terá que limpar quase tudo. Por exemplo, havia 1.000 pontos, 900 foram limpos, o restante deles de alguma forma atingiu a limpeza das folhas, por exemplo, 70% - não parece ruim, e você pode ganhar dinheiro. Mas, quando você começar a negociar de verdade, haverá exemplos dos quais nos livramos durante a limpeza (9 detritos para 1 restante) e os indicadores de 70% cairão para 53%, por exemplo, e você perderá com spread, derrapagens etc.

Prefiro uma árvore e uma folha com 53% de pureza honesta de uma das classes. E não a usarei.

Nesse ponto, nossos pensamentos estão de acordo em relação ao resultado. Sim, eu espero uma amostra altamente desbastada, mas, pelo que entendi, o processo é iterativo, o que significa que você pode saber a medida e parar muito antes e usar os mesmos dados para criar os mesmos modelos de madeira, que terão menos rachaduras e valores mais confiáveis nas folhas.

Entendi corretamente que os centros iniciais estão localizados aleatoriamente?