Aprendizado de máquina no trading: teoria, prática, negociação e não só

Vladimir Perervenko 2018.05.19 18:44 #9301

Dr. Trader:

A Genética tenta encontrar os parâmetros corretos para um número limitado de chamadas de função. Reduzindo o número de variantes deste parâmetro (30 em vez de 200) o geneticista pode investigar a região de 1 a 30 com mais detalhes. E com razão, se você conhece os limites específicos para encontrar algum parâmetro de modelo, é melhor dar essa informação ao geneticista imediatamente.

Em alternativa:

Adicione esta linha (a verde) ao código, então o geneticista terá 500 indivíduos na população em vez dos 50 padrão. E ela será capaz de testar 10 vezes mais modelos (mas o tempo de execução do script também aumentará 10 vezes), sendo capaz de experimentar o maior número possível de combinações de parâmetros de modelos. Mesmo com um máximo de 200 neurónios acho que a genética pode encontrar melhores resultados com 0,85 também, ou pelo menos chegar perto dele.

Não consigo entender de que genética estás a falar. Não há genética na MLT. Basta ver a teoria do ELM ou a descrição do pacote elmNN:

"O algoritmo ELM é um método de treinamento alternativo para SLFN ( Single Hidden Layer Feedforward Networks ) que não precisa de nenhum ajuste iterativo ou parâmetros de configuração como taxa de aprendizagem, momentum, etc., que são questões atuais dos tradicionais algoritmos de aprendizagem baseados em gradientes ( como backpropagation ).

A formação de um SLFN com ELM é um modelo de aprendizagem em três etapas:

Dado um conjunto de treinamento P = {(xi , ti )|xi E R , ti E R , i = 1,..., N}, função de saída de nó oculto G(a, b, x), e o número de nós ocultos L

1) Atribuir aleatoriamente parâmetros de nós ocultos (ai , bi ), i = 1,..., L. Isso significa que os pesos do arco entre a camada de entrada e a camada oculta e a camada oculta são gerados aleatoriamente.

2) Calcular a matriz de saída de camada oculta H usando uma das funções de ativação disponíveis.

3) Calcular os pesos de saída B: B = ginv(H) %*% T ( multiplicação matricial ), onde T é a meta de saída do conjunto de treinamento.

ginv(H) é o inverso generalizado da matriz de saída de camadas ocultas H. Isto é calculado pela função do pacote MASS ginv.

Uma vez que o SLFN tenha sido treinado, o resultado de um conjunto de teste genérico é simplesmente Y = H %*% B ( multiplicação de matriz ). Características salientes:

- A velocidade de aprendizagem do ELM é extremamente rápida.

- Ao contrário dos tradicionais algoritmos de aprendizagem baseados em gradientes que só funcionam para funções de activação diferenciáveis, o ELM funciona para todas as funções de activação contínua não contida em segmentos não contíguos.

- Ao contrário dos tradicionais algoritmos de aprendizagem baseados em gradientes que enfrentam vários problemas como mínimos locais, taxa de aprendizagem inadequada e sobreajustamento, etc., o ELM tende a alcançar as soluções de forma simples sem tais questões triviais.

- O algoritmo de aprendizagem ELM parece muito mais simples do que outros algoritmos de aprendizagem populares: redes neurais e máquinas vetoriais de suporte".

Mesmo com um pequeno número de neurónios, é impossível obter duas redes neurais idênticas. O limiar para a transferência de saída contínua para uma classe está sendo definido incorretamente. Limiar = 0,5 é o pior caso. Aceitável = mediana/ Mas há outras mais avançadas.

Boa sorte.

Estratégias de otimização - Artigos sobre o desenvolvimento Tipos de otimização -

СанСаныч Фоменко 2018.05.19 18:53 #9302

Maxim Dmitrievsky:

Oh, vai ser algo para ler, já me tinha esquecido do que é. Ou melhor, esqueceu a diferença entre GBM e XGboost... ou não sabia

gbm pode impulsionar qualquer modelo, xgb parece estar nas árvores

Sei que o impulso é ligeiramente melhor do que o ensacamento, através do qual a floresta é construída. Não sei nada sobre requalificação.

A reinicialização NÃO tem nada a ver com o tipo de modelo.

Um modelo é requalificado em dois casos:

a presença de preditores de ruído é um grande problema e é resolvido SOMENTE através da instalação de preditores
sobreposição do modelo - "otimização" de seus parâmetros, geralmente em uma pequena amostra. Este tipo de sobreajuste é resolvido pela experiência do desenvolvedor.

Evento - Objetos gráficos Criando um Script - Assistente MQL5, desenvolvimento de

Maxim Dmitrievsky 2018.05.19 18:58 #9303

SanSanych Fomenko:

SanSanych, pare de ficar histérico

Mihail Marchukajtes 2018.05.19 19:01 #9304

Vladimir Perervenko:

Não consigo entender de que genética estás a falar. Não há genética no ELM. Basta olhar para a teoria ELM ou para a descrição do pacote elmNN:

"O algoritmo ELM é um método de treinamento alternativo para SLFN ( Single Hidden Layer Feedforward Networks ) que não precisa de nenhum ajuste iterativo ou parâmetros de configuração como taxa de aprendizagem, momentum, etc., que são questões atuais dos tradicionais algoritmos de aprendizagem baseados em gradientes ( como backpropagation ).

O treinamento de um SLFN com ELM é um modelo de aprendizagem em três etapas: