O que alimentar a entrada da rede neural? Suas ideias... - página 62

 
Aleksey Nikolayev #

No contexto da negociação, eu também gostaria de lembrá-lo da abordagem do fxsaber, na qual se busca um platô, em vez de um topo. Também se verifica que o problema não está claramente formalizado como um problema de otimização.

Esta é a seção de otimização sobre a minimização de uma função com ruído. Otimização da função de ruído ou algo do gênero, escrevo de memória.
Na verdade, tudo já foi inventado; se um operador tem algum conhecimento, é mais por analfabetismo.

E o Saber simplesmente fez uma parada antecipada de forma banal e primitiva, e não havia quase nenhum platô ali, mas apenas paz de espírito para a alma.
 

De volta à implementação técnica...

A otimização está presente ao selecionar uma divisão na árvore.
Há diferentes fórmulas para isso. No caso de treinamento em árvore de 100%, essa otimização determina apenas o caminho para o aprendizado de dados absolutos. Ela não afeta a qualidade do aprendizado, que é de 100%. O aprendizado verdadeiro é entendido apenas como 100% de aprendizado.

Portanto, o aprendizado (memorização exata do que é ensinado) != otimização. Mas se treinarmos pouco, ou seja, pararmos de dividir antes da memorização completa, podemos parar em diferentes variantes desse caminho - então, o modelo e a qualidade do aprendizado (grau de subtreinamento) serão diferentes com diferentes algoritmos de seleção de divisão, diferentes profundidades de aprendizado, diferentes números de exemplos na planilha.
O subtreinamento é uma má ideia no caso do ensino de dados inequívocos/exatos (tabuada, lei de Ohm etc.). Quanto mais exemplos você der para memorizar/aprender, mais precisa será a resposta com novos dados.


Mas, na situação dos dados de mercado, para não memorizar o ruído, é preciso parar antes, avaliar e selecionar um desses modelos não aprendidos. Como resultado, verifica-se que a otimização e a avaliação são necessárias para modelos não aprendidos/não aprimorados. Um banco de dados perfeitamente preciso não precisa de avaliação, ele tem tudo o que queria para treinar.

 

O aprendizado é um processo, não um resultado.

Não pode haver 100% ou 50% de aprendizado. Essas categorias não existem.

A qualidade do aprendizado é verificada somente pela validação e pelo teste de como o aluno aprendeu as lições. Ela não é testada pelo fato de os alunos simplesmente repetirem o que o professor disse ou lerem suas anotações.

A capacidade de aprender e memorizar é diferente para todos os modelos; não reduza tudo a árvores e florestas.

E é aí que a mágica acontece, quando o aluno mais burro (modelo) costuma ser um preditor melhor do que o mais inteligente. É exatamente como na vida. E há uma justificativa para isso.

Tudo isso está escrito na teoria do aprendizado de máquina, da qual ninguém aqui sequer ouviu falar, embora seja a base dos conceitos básicos.

Há mágica acontecendo no mundo do MO, mas não toda essa sua bobagem.
 
mytarmailS #:
Esta é uma seção de otimização sobre a minimização de uma função com ruído. Otimização de função de ruído ou algo do gênero, escrevo de memória.
Na verdade, tudo já foi inventado; se um operador tem algum conhecimento, é mais por analfabetismo.

E o Saber simplesmente fez uma parada antecipada de forma banal e primitiva, e não havia quase nenhum platô ali, mas apenas paz de espírito para a alma.
Um exemplo de otimização com ruído

Pelo que entendi, a filosofia geral da abordagem é a seguinte:
1. Há um modelo que aprende o ruído da função otimizada (é diferente em seções diferentes) e o prevê.
2. Uma determinada média do valor + ruído previsto é calculada.

3. Obtemos o chamado platô, não um valor absoluto
 
Forester #:

De volta à implementação técnica...

A otimização está presente ao selecionar uma divisão na árvore.
Há diferentes fórmulas para isso. No caso de treinamento em árvore de 100%, essa otimização determina apenas o caminho para o aprendizado de dados absolutos. Ela não afeta a qualidade do aprendizado, que é de 100%. O aprendizado verdadeiro é entendido apenas como 100% de aprendizado.

Portanto, o aprendizado (memorização exata do que é ensinado) != otimização. Mas se treinarmos pouco, ou seja, pararmos de dividir antes da memorização completa, podemos parar em diferentes variantes desse caminho - então, o modelo e a qualidade do aprendizado (grau de subtreinamento) serão diferentes com diferentes algoritmos de seleção de divisão, diferentes profundidades de aprendizado, diferentes números de exemplos na planilha.
O subtreinamento é uma má ideia no caso do ensino de dados de valor único/exatos (tabuada, lei de Ohm etc.). Quanto mais exemplos você der para memorização/aprendizagem, mais precisa será a resposta com novos dados.


Mas, na situação dos dados de mercado, para não memorizar o ruído, é preciso parar antes, avaliar e selecionar um desses modelos não aprendidos. Como resultado, verifica-se que a otimização e a avaliação são necessárias para modelos não aprendidos/não aprimorados. Um banco de dados perfeitamente preciso não precisa de avaliação, ele tem tudo o que queria para treinar.

Expanda o pensamento a seguir:

Exercício 1:
Existe a aritmética e uma de suas operações é a multiplicação. E há números de 0 a 9. Aprenda a regra da multiplicação, faça uma tabela de multiplicação multiplicando dois números um pelo outro e aprenda a tabela de multiplicação.

Tarefa 2:
Há uma tabela de multiplicação. Aqui está ela
...
...
...
Aprenda-a.


Na segunda opção, o aluno não conhece a regra de multiplicação, mas sabe as respostas corretas.


Essas duas atividades são de aprendizado?

Se não, como você categorizaria (descreveria) essas atividades?
 
Maxim Dmitrievsky #:

Bem, não é. A precisão das respostas em novos dados (e por novos dados queremos dizer dados diferentes dos dados de treinamento) dependerá das propriedades de cada modelo específico, não do número de exemplos de treinamento.

Se considerarmos o caso de dados regularizados. Tabela de multiplicação, por exemplo. Quanto mais exemplos você fornecer, mais precisas serão as respostas nos novos dados.
Os novos dados não devem ser completamente diferentes, mas devem estar entre os exemplos de treinamento. Ou seja, a interpolação funcionará mais ou menos bem. 1 árvore fornecerá o exemplo de treinamento mais próximo. Se por outros dados você quiser dizer dados fora dos limites dos dados de treinamento, isso já é extrapolação. A árvore fornecerá um exemplo extremo, porque é o mais próximo.


Se considerarmos os dados de mercado, então, com um grande valor de ruído, qualquer pico do padrão verdadeiro será misturado com picos de ruído e precisaremos, de alguma forma, escolher o pico verdadeiro e não o pico de ruído. Suas afirmações estão corretas aqui.

 
Forester #:

Se considerarmos o caso de dados padronizados. Tabelas de multiplicação, por exemplo. Quanto mais exemplos você der, mais precisas serão as respostas nos novos dados.
Os novos dados não devem ser completamente diferentes, mas devem estar entre os exemplos de treinamento. Ou seja, a interpolação funcionará mais ou menos bem. 1 árvore fornecerá o exemplo de treinamento mais próximo. Se por outros dados você quiser dizer dados fora dos limites dos dados de treinamento, isso já é extrapolação. A árvore fornecerá o exemplo mais externo, porque é o mais próximo.


Se considerarmos os dados de mercado, então, com um grande valor de ruído, qualquer pico do padrão verdadeiro será misturado com picos de ruído e precisaremos, de alguma forma, escolher o pico verdadeiro e não o pico de ruído. Suas afirmações estão corretas aqui.

Não sabemos nada sobre a ausência ou a presença de padrões. Estamos apenas fazendo o treinamento e falando sobre o mesmo.

Falamos sobre a abordagem comum e o que ela significa(mágica). A mágica do aprendizado é contra-intuitiva para as pessoas comuns porque elas não entendem o que está acontecendo :)

Por que é importante não treinar demais e por que é importante não treinar de menos. Por que é importante reduzir o número de características e parâmetros. etc. etc. etc.
 
Ivan Butko #:
Amplie o pensamento a seguir:

Tarefa 1:
Existe a aritmética e uma de suas operações é a multiplicação. E há números de 0 a 9. Aprenda a regra da multiplicação, faça uma tabela de multiplicação multiplicando dois números um pelo outro e aprenda a tabela de multiplicação.

Tarefa 2:
Há uma tabela de multiplicação. Aqui está ela
...
...
...
Aprenda.


Na segunda opção, o aluno não conhece a regra de multiplicação, mas sabe as respostas corretas.


Ambos estão aprendendo?

Se não, como você categorizaria (descreveria) essas atividades?

Ambas são treinamento. No primeiro caso, uma regra/lei é ensinada. No segundo caso, as respostas do primeiro são aprendidas.
Naturalmente, ensinar regras, fórmulas e leis é mais eficaz, pois com uma pequena fórmula você pode obter milhões de respostas sem precisar memorizá-las.
Aqui no fórum, houve tópicos sobre as leis do mercado e os grails. Talvez exista uma lei, mas o ruído a sobrepõe(

 
Forester #:

Ambos são treinamento. No primeiro caso, uma regra/lei é ensinada. No segundo caso, as respostas do primeiro caso são aprendidas.
Naturalmente, o ensino de regras, fórmulas e leis é mais eficaz, porque, com uma pequena fórmula, você pode obter milhões de respostas sem precisar memorizá-las.
Aqui no fórum, houve tópicos sobre as leis do mercado e os grails. Talvez exista uma lei, mas o ruído a sobrepõe(







E se cada tick for um componente de regras e leis e o problema for a incapacidade das arquiteturas de decifrar o "código" de um gráfico?

Parece um postulado aqui (a ideia de ruído em um gráfico de preços)

 

O treinamento requer o material de treinamento correto. Os MOEs modernos são bons demais para reclamar.

O MOE com um professor não envolve a busca de padrões esparsos nos dados. É necessário que eles estejam presentes em quantidades significativas na amostra de treinamento.