Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 942

 
Olga Shelemey:
Obrigado. Ele certamente irá lê-lo mais tarde. Neste momento ele está a dormir, a ler um Shelepin. Ele disse para não o incomodar.

ESTÁ BEM.

Deixa-o encontrar o teorema de Tuckens.

 
Aleksey Vyazmikin:

Pus tudo numa só mesa, de acordo com este princípio.

Eu também fiz um agrupamento por arr_TimeH predictor - talvez seja útil nesta forma.

Estou a anexar os ficheiros.

O programa que uso tem a seguinte imagem: há apenas 30,81% de acessos


No entanto, se adicionarmos por exemplo erros -2 e -1 juntos e adicionarmos soluções correctamente encontradas e depois as compararmos com as incorrectamente encontradas e ignorarmos o alvo número 3 porque é um filtro e não afectará os resultados financeiros, obteremos a seguinte imagem

neste caso, o erro será 49,19% para entrar na posição, o que não é tão ruim assim!

 
Maxim Dmitrievsky:

Já experimentou a algibeira kfold? melhora os resultados? Vi num dos seus antigos postes que não parece misturar a amostra. Tem mesmo de ser?

Alguma conclusão sobre o que é menos overtrains - floresta ou mlp? com os mesmos dados. Tenho suspeitas de que para tarefas de regressão a floresta funciona tortuosamente e devolve erros tortuosos (muito pequenos), para normas de classificação.

2. Já vi pessoas interessadas no OpCl, houve alguma ideia de reescrever NS para ele? Por exemplo, eu desisti completamente da AG como um disparate de pesadelo, agora tudo é treinado em 1 linha em 1 núcleo. Você poderia acelerá-lo no Cl (embora tão rápido quanto isso). Ou, se você treinar na Spark, é paralelo de qualquer maneira e não faz sentido.

3. mais ou menos entendeu o que você colocou sobre o idiota e como você o aplica. Grande trabalho interessante, respeito! :)

Quando eu comecei a pesquisar redes, o resultado foi https://github.com/Roffild/RoffildLibrary/blob/master/Experts/Roffild/Alglib_MultilayerPerceptron.mq5. Eu passei por diferentes conjuntos de preditores em diferentes sequências (com e sem embaralhar) - o parâmetro File_Num é responsável por isso. E, claro, eu tentei colocar o mesmo número de registos para duas aulas.

O problema com esta rede é que não há um critério claro para selecionar uma amostra válida. Por exemplo, ao reconhecer fotos de frutas, você pode identificar claramente onde estão uma maçã e uma laranja. Com gráficos de preços não há um critério de seleção de 100% e, portanto, também não há um critério de requalificação de 100%.

https://github.com/Roffild/RoffildLibrary/blob/master/Experts/Roffild/Alglib_RandomForest.mq5

Uma floresta aleatória é menos dependente do ruído e com maior probabilidade de retornar o mesmo resultado sob diferentes condições de amostragem. Por exemplo, no gráfico.

Os dados azuis e amarelos são quase idênticos. Embora eu esperasse mais diferença porque parte da amostra foi retirada para a segunda floresta.

E na minha opinião algumas pessoas tentam obter o preço de abertura de um pedido usando a rede ou a floresta, mas esquecem que o lucro ocorre quando o pedido é fechado. Para resolver este problema apareceu https://github.com/Roffild/RoffildLibrary/blob/master/Include/Roffild/OrderData.mqh, mas esta classe é usada exatamente como "pai".

O OpenCL só é necessário para o treinamento da rede. Para os cálculos finais onde a rede ou a floresta já foi treinada, o OpenCL não tem utilidade, pois o tempo necessário para transferir dados para a placa de vídeo é muito longo. E os algoritmos de recuperação de dados da rede ou da floresta são realmente muito simples e a CPU lida muito bem com eles.

Centelha em geral cálculos paralelos não só entre os núcleos de um único computador, mas também pode usar toda uma rede de computadores. É um padrão para computação inter-servidor. Por exemplo, eu normalmente compro 32 núcleos na amazônia por 0,25 dólares/hora para ter uma floresta acabada ao acaso rapidamente.

 
Roffild:

O problema com esta rede é que não há um critério claro para selecionar uma amostra válida. Por exemplo, ao reconhecer fotos de frutas, você pode identificar claramente onde há uma maçã e onde há uma laranja. Com gráficos de preços não há um critério de seleção de 100% e, portanto, também não há um critério de requalificação de 100%.

https://github.com/Roffild/RoffildLibrary/blob/master/Experts/Roffild/Alglib_RandomForest.mq5

Uma floresta aleatória é menos dependente do ruído e mais frequentemente retorna o mesmo resultado sob diferentes condições de amostragem. Por exemplo, no gráfico

isso é porque em NS você precisa pegar a arquitetura, enquanto as florestas sempre funcionam da mesma maneira, sim :)

E para pegar uma arquitetura, você deve mapear o espaço de recursos multidimensionais e descobrir qual camada é responsável pelo quê, ou apenas usar a sensação instintiva. Mas, em teoria, a NS corretamente capturada deveria dar melhores resultados e em termos de superfit, também.

Nem todas as bibliotecas ainda, obrigado, vou analisar mais a fundo.

 
Pesadelo
 
Quanto mais longe estiver na floresta, maior a lenha...
 

Outro livro útil em russo.

Джулли А.,Пал С. - Библиотека Keras - инструмент глубокого обучения [2018, PDF, RUS] :: RuTracker.org
  • rutracker.org
Автор : 2018 : Джулли А.,Пал С.: ДМК Пресс : 978-5-97060-573-8 : Русский: PDF : Отсканированные страницы : 298: Книга представляет собой краткое, но обстоятельное введение в современные нейронные сети, искусственный интеллект и технологии глубокого обучения. В ней представлено более 20 работоспособных нейронных сетей, написанных на языке...
 
Vladimir Perervenko:

Outro livro útil em russo.

Como você encontra Keras? É melhor que o Darch ou é o mesmo? Pode aprender mais rápido com os mesmos dados, número de épocas, etc.?
 
elibrarius:
Como te pareceu o Keras? É melhor que o Darch ou as capacidades são as mesmas? É mais rápido aprender com os mesmos dados, número de épocas, etc.?

Sem comparação. Kegas - possibilidades ilimitadas em termos de estrutura, formação e personalização, muitos exemplos e documentação detalhada. Separadamente, sobre o TensorFlow - está se desenvolvendo muito rápido (já 1,8). É claro que isto tem os seus prós e os seus contras. Não é tão rápido para aprender, você precisa de fazer ginástica extra. É difícil optimizar os hiperparâmetros. Caso contrário, este é o foco principal para o futuro.

Boa sorte.

 
Aleksey Vyazmikin:

Ainda não fiz amizade com o R, por isso estaria interessado em ver o que você inventa!

Fez uma decomposição de TF semanal, 1400 barras (quase todo o histórico disponível no terminal)

Não mostra as datas aqui, por isso não é muito conveniente. Terei que reescrevê-lo em Plot ou em um indicador para marcá-lo em um gráfico.

Há tscc mais pronunciadas nos mods menores. E a maior delas é de +- 14 anos (2 semestres de 28 anos), que é dividida em 4 ciclos de 7 anos (como eu disse). Além disso, o último ciclo de 7 anos terminou no início deste ano (aproximadamente), sugerindo que não faz muito sentido ensinar a grelha em datas anteriores.

Os ciclos no meio não são tão pronunciados

E, para não nos abalarmos, só precisamos de colocar todos os mods no NS, além de não estarem correlacionados.

Então reconhecerá os diferentes ciclos, e talvez não, uma questão filosófica, como você o faz, será :)