Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2384

 
Maxim Dmitrievsky

Conseguiu fazer a marcação manual? Esta técnica deve ser mais interessante.

 
Evgeni Gavrilovi:

Conseguiu fazer a marcação manual? esta técnica deve ser mais interessante.

Eu não o fiz, esta abordagem não me interessa.

 
mytarmailS:

Encontrei uma maneira de gerar regras que funcionam tanto na bandeja como no teste, finalmente MLEEP....

omeu corretor, o meu treinador e o teste



seu corretor seus dados e o teste em 9 anos passa!!!

Graal encontrado!!!!!!!

O engraçado é que amanhã, cerca de um mês, estarei fora do fórum, sem sorte (quero partilhar, mas sem tempo, quando puder escrever o que fazer e como o fazer...


Para uma negociação confortável, você precisa fazer 200-400 destas regras(ou patrenov se você quiser)

Para entender a escala, meu fraco laptop pode minar 5-8 regras por dia.

não vejo nada de errado com as regras da mineração, queria fazer um mineiro visual (muito rápido) com controles deslizantes para procurar padrões

mas, como de costume, ainda não está feito.

 
Maxim Dmitrievsky:

Eu não vejo nada de errado com as regras da mineração, eu queria fazer um mineiro visual (muito rápido) com sliders, para procurar por padrões

mas, como sempre, ainda não o fiz.

O que você quer produzir e como?

 
Valeriy Yastremskiy:

O que você queria retirar e como?

como boxplots

 
Maxim Dmitrievsky:

como boxplots

Resultados do treinamento ou regras do boxplot?

 
Maxim Dmitrievsky:

Eu não vejo nada de errado com a mineração das regras.

Claro que não), e mesmo que o fizesses, isso não me afectaria de forma alguma)

Maxim Dmitrievsky:

Eu queria fazer um mineiro visual (muito rápido) com controles deslizantes para procurar por padrões

mas, como sempre, ainda não o fiz.

Tente, só que o resultado será, na melhor das hipóteses, como a renderização da floresta, ou seja, nenhum...


Forrest output é uma soma de regras acionadas, as regras não são filtradas e rejeitadas de forma alguma, e as regras rejeitadas são cerca de 100%)

As regras não são verificadas quanto à repetibilidade (pode haver apenas uma resposta) ou adequação (funciona); as regras são apenas esticadas para os dados (o modelo encaixa nos dados)

O modelo aproxima uma amostra de treinamento aleatoriamente, esperando que a validação cruzada ajude, mas não o fará por razões objetivas (há muito poucos eventos importantes no mercado)


Tentei uma abordagem diferente, não me ajustei aos dados do modelo, mas formei hipóteses e verifiquei-as.

1) Eu formo hipóteses plausíveis(já filtradas) sob a forma de regras.

2) Hipóteses são testadas com dados pequenos

3) Hipóteses que foram testadas com dados pequenos são testadas com dados grandes.

Na verdade, apenas uma em um milhão de regras plausíveis permanece

É difícil para um leitor sem formação compreender a diferença entre as duas abordagens, mas a diferença entre elas é abissal.

 
mytarmailS:

Claro que não), e mesmo que o fizesses, isso não me afectaria de forma alguma).

Tente, mas o resultado será na melhor das hipóteses o mesmo que para a Floresta Aleatória, ou seja, nenhum...


Forrest output é uma soma de regras acionadas, as regras não são filtradas e rejeitadas de forma alguma, e as regras rejeitadas são cerca de 100%)

As regras não são verificadas quanto à repetibilidade (pode haver apenas uma resposta) ou adequação (funciona); as regras são apenas esticadas para os dados (o modelo é adequado para os dados)

O modelo aproxima uma amostra de treinamento aleatoriamente, esperando que a validação cruzada ajude, mas não o fará por razões objetivas (há muito poucos eventos importantes no mercado)


Tentei uma abordagem diferente, não me ajustei aos dados do modelo, mas formei hipóteses e verifiquei-as.

1) Eu formo hipóteses plausíveis(já filtradas) sob a forma de regras.

2) Hipóteses são testadas com dados pequenos

3) Hipóteses testadas em dados pequenos são testadas em dados grandes.

Na verdade, apenas uma em um milhão de regras plausíveis permanece

É difícil para o leitor destreinado compreender a diferença entre as duas abordagens, mas a diferença entre elas é um abismo.

Então mostre-me os resultados do TC como um exemplo

 
Maxim Dmitrievsky:

Então mostre-me os resultados do TC

Ainda não posso, preciso de obter pelo menos 500 regras sujas das quais passarei os últimos 10%...

Só para te dar uma ideia, eu já tinha 2 regras sujas ontem à noite.


Estou trabalhando para acelerar a síntese de regras, hoje descobri como aumentar a velocidade em 5 vezes e reescrevi mais algum código...

 
mytarmailS:

Ainda não posso, preciso de pelo menos 500 regras sujas para passar os últimos 10%...

Só para que entenda, eu fiz duas regras sujas ontem à noite.

Eu acho que Alexei ofereceu algum poder computacional, ele gosta de fazer cálculos longos, talvez você possa fazer uma cooperativa :)

Em R sem vetorização ainda vai ser lento. Você poderia usar algum tipo de banco de dados rápido