Pesquisa em pacotes matriciais - página 7

 
http://quantquant.com/viewtopic.php?f=7&t=1236
 
zaskok3:
http://quantquant.com/viewtopic.php?f=7&t=1236

Para que serve este link? Um breve comentário seria útil.

Por exemplo: um conjunto de links para tutoriais R e Python.

Quanto ao conteúdo dos links: você já coletou tudo da ampla rede? Ou há alguma preferência? De Python, o pyBrain é o mais interessante e digno de estudo e aplicação. Ele implementa redes que não estão presentes nos pacotes R. Não é para discussão, não é uma crítica, apenas um comentário de passagem.

Boa sorte.

 
Vladimir Perervenko:

1. Sim.

2. Por que ? Precisa de uma única MT4R.dll que é o portal para enviar dados para R e receber os resultados de volta.

3. A todos os bancos de dados existentes. Não apenas isso, tanto a Microsoft quanto a Oracle integraram o R em seus bancos de dados.

4. R implementa várias opções de interação com Matlab desde a simples troca de arquivos Matlab até a execução das funções Matlab a partir de R. Se você tem experiência e conhecimento nesta área, você pode implementar uma excelente ligação Matlab-MTterminal com R.

5. Em R os pacotes para todas as direções de uma ciência e técnica e levando em conta as últimas realizações são realizados. Você pode começar a partir daqui.

6. Há mais de um. O mais comum é ff.

Em geral, fico surpreso. Você está no meio do nada. Veja os artigos 1 e 2 deste site e você não vai entender muito, mas terá uma idéia de como o idioma funciona.

Estou terminando o segundo artigo sobre aprendizado profundo que espero enviar a vocês amanhã para revisão e os exemplos serão anexados aos especialistas... Se houver interesse, acho que vou escrever vários artigos no nível inicial (filtragem, decomposição, previsão, etc.). E, é claro, continuem a estudar a fundo, especialmente quando o Google abriu sua biblioteca TensorFlow para todos. E há outros não menos interessantes e promissores (mxnet, pyBrain).

Se um grupo de entusiastas se reúne, podemos organizar um ramo de usuários do idioma R.

Boa sorte.

Bons artigos! Obrigado. Terei que investigar isso. Mas pretendo experimentar SVM, GBM, xGBoost em vez de NS.
 
Alexey Burnakov:
Bons artigos! Obrigado. Preciso dar uma olhada nisso. Mas pretendo experimentar SVM, GBM, xGBoost em vez de NS.
SVM, ada, floresta aleatória. Tudo isso depois de exercitar-se com estes pacotes em guizo. E depois disso, prever pacotes de seleção de preditores
 
Alexey Burnakov:
Bons artigos! Obrigado. Terei que investigar isso. Mas pretendo experimentar SVM, GBM, xGBoost em vez de NS.

Experimente todos eles.

Meu favorito é o randomForest em várias modificações (a principal vantagem é que ele não requer pré-processamento de entrada. E também ada - pontuação muito alta de qualidade. Ambos têm dois inconvenientes - curva de aprendizagem muito longa e altamente propensos ao sobretreinamento.

Isso não significa que você não deva usá-los, apenas que você precisa estar atento aos transtornos.

Boa sorte.

 
СанСаныч Фоменко:
SVM, ada, floresta aleatória. Tudo isso após o exercício com estes pacotes em guizo. E depois dos pacotes para a seleção dos preditores
Sam Sanych, eu também já pratiquei bastante com estes pacotes no trabalho. ))) Somente o xGBoost ainda não tocou nele.
 
Vladimir Perervenko:

Experimente todos eles.

Meu favorito é o randomForest em várias modificações (a principal vantagem é que ele não requer o pré-processamento dos dados de entrada. Também ada - pontuação muito alta de qualidade. Ambos têm dois inconvenientes - levam muito tempo para aprender e são altamente propensos a super-aprendizagem.

Isso não significa que você não precisa usá-los, apenas que você precisa estar atento a esses inconvenientes.

Boa sorte.

Tenho uma pergunta para você sobre o artigo 1. Vejo pelo gráfico de emulação comercial que o algoritmo faz negócios em todos os bares, certo?

E mais uma pergunta. Durante o treinamento, você também alimentou os dados da máquina de cada barra?

O ponto central que diferencia os problemas de série temporal da maioria dos outros problemas estatísticos é que em uma série temporal, as observações não são mutuamente independentes. Em vez disso, um único evento casual pode afetar todos os pontos de dados posteriores. Isto torna a análise da série temporal bastante diferente da maioria das outras áreas de estatísticas.

Devido a esta não-independência, os verdadeiros padrões subjacentes aos dados da série temporal podem ser extremamente difíceis de serem vistos pela inspeção visual. Qualquer pessoa que tenha olhado para um típico gráfico de médias do mercado de ações vê tendências que parecem continuar por semanas ou meses. Mas os estatísticos que estudaram o assunto concordam que tais tendências ocorrem essencialmente com a mesma freqüência que se esperaria por acaso, e não há praticamente nenhuma correlação entre o movimento do mercado de ações de um dia e o movimento do dia seguinte. Se houvesse tal correlação, qualquer um poderia ganhar dinheiro no mercado de ações simplesmente apostando que a tendência de hoje continuaria amanhã, e simplesmente não é tão fácil. De fato, a acumulação de quase todas as séries de números aleatórios resultará em um padrão que parece não ser de domínio.

De:http://node101.psych.cornell.edu/Darlington/series/series1.htm

O ponto, como presumo que você entenda, é que uma abordagem direta na qual todos os pontos da série temporal estão envolvidos em treinamento (e testes) cria observações mutuamente dependentes, o que, de uma só vez, anula a validade das conclusões sobre os "padrões" encontrados. Simplificando, os resultados não podem ser confiáveis, mesmo que tudo o mais seja feito corretamente. Criar uma amostra de observações a partir de uma série temporal que não viole as suposições estatísticas é, portanto, arquivístico. Muitas vezes este passo é simplesmente ignorado em fontes populares, e as conseqüências são mais deploráveis. A máquina não aprenderá os padrões.

 
Alexey Burnakov:

Tenho uma pergunta para você sobre o artigo 1. Vejo pelo gráfico de emulação comercial que o algoritmo faz negócios em todos os bares, certo?

E mais uma pergunta. Durante o treinamento, você alimentou a máquina com dados de cada barra também?

De:http://node101.psych.cornell.edu/Darlington/series/series1.htm

O ponto, como presumo que você entenda, é que uma abordagem direta na qual todos os pontos da série temporal estão envolvidos em treinamento (e testes) cria observações mutuamente dependentes, que de uma só vez cruzam a validade das conclusões sobre os "padrões" encontrados. Simplificando, os resultados não podem ser confiáveis, mesmo que tudo o mais seja feito corretamente. Criar uma amostra de observações a partir de uma série temporal que não viole as suposições estatísticas é, portanto, arquivístico. Muitas vezes este passo é simplesmente ignorado em fontes populares, e as conseqüências são mais deploráveis. A máquina não aprenderá os padrões.

Boa tarde.

que o algoritmo faz acordos em todos os bares?

Não. O algoritmo realiza acordos sobre os sinais recebidos na última barra formada. Talvez eu não entenda a pergunta?

Uma pergunta a mais. Você alimentou o Expert Advisor com os dados de cada bar durante o treinamento?

Eu não entendo. Você gostaria de explicar? Vou tentar responder.

Boa sorte.

 
Alexey Burnakov:

Tenho uma pergunta para você sobre o artigo 1. Vejo pelo gráfico de emulação comercial que o algoritmo faz negócios em todos os bares, certo?

E mais uma pergunta. Durante o treinamento, você alimentou a máquina com dados de cada barra também?

De:http://node101.psych.cornell.edu/Darlington/series/series1.htm

O ponto, como presumo que você entenda, é que uma abordagem direta na qual todos os pontos da série temporal estão envolvidos em treinamento (e testes) cria observações mutuamente dependentes, que de uma só vez cruzam a validade das conclusões sobre os "padrões" encontrados. Simplificando, os resultados não podem ser confiáveis, mesmo que tudo o mais seja feito corretamente. Criar uma amostra de observações a partir de uma série temporal que não viole as suposições estatísticas é, portanto, arquivístico. Muitas vezes este passo é simplesmente ignorado em fontes populares, e as conseqüências são mais deploráveis. A máquina não aprenderá os padrões.

O artigo a que você se refere é sobre regressão. Estamos tratando de classificação. Isso são duas grandes diferenças...

Eu ainda não entendi sua pergunta.

Boa sorte.

 
Vladimir Perervenko:

O artigo a que você se refere é sobre regressão. Estamos tratando de classificação. Essas são duas grandes diferenças...

Eu ainda não entendi sua pergunta.

Boa sorte.

Uma pergunta passageira para todos os participantes da discussão. Você trabalha com dados de carrapatos? Afastei-me da análise de bares há muito tempo, trabalho apenas com métodos DSP