Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 387

 
Dr. Trader:

E este dinheiro pode ser levantado?
 
Dr. Trader:

do que uma forma de ganhar dinheiro.

Se você quer ganhar dinheiro, os numerae lançaram uma espécie de moeda criptográfica própria. Os seus detentores têm a oportunidade de participar indirectamente no investimento.

Não posso dizer mais detalhes, eu quero descobrir, mas não posso fazer isso.

 
Dr. Trader:

Curiosamente, o logloss 0,690 - 0,691 nos dados de validação quase todos mostraram um bom resultado nos novos dados, não tenho idéia do que se trata.

Muito provavelmente não foi ganancioso, não complicou demais o modelo e, portanto, não se ajustou demais, embora houvesse como um cara com ~0,65 em alguma turnê, que ao vivo ~0,68 +.

Eu estou mais confuso em seus dados misturando amostras, "era" com id desconhecido não pode reproduzir seus cálculos nas excursões passadas. Então eu não sei o que diabos está no conjunto de treinamento, seria bom se a partir das últimas rodadas as amostras AO VIVO fossem dispostas e seria possível treinar um modelo para este conjunto de dados de teste, pelo menos para entender por que ele vai tão diferente. IMHO é como se acumulassem pontos de muito tempo atrás e depois dessem um subconjunto aleatório deles como um trem, e os id's não refletissem a cronologia da acumulação de conjuntos de dados, e então os pontos vivos, que eram necessários à vanguarda, não são dados separadamente para corrigir os modelos e obter um "dedo no céu" cutucando a chance.

Espero que eles o consertem :)

 
Alguém pode confirmar que é melhor usar florestas aleatórias para classificação binária? No caso geral, ou é possível pegar uma rede neural no caso especial que dará um pouco menos de erro?


 
pantural:
E este dinheiro pode ser levantado?

Sim, retirada instantânea em bitcoins ao ritmo actual.


Combinador:

Se você quer ganhar dinheiro, numerae tem uma espécie de liberação de sua própria moeda criptográfica. Os seus detentores têm a oportunidade de participar indirectamente no investimento.

Não vou dizer mais detalhes, quero descobri-lo, mas não consigo encontrá-lo.

Sim, agora eles dão o seu criptograma aos vencedores juntamente com dólares. Por exemplo, eu tenho 300 NMR (Numeraire), mas eles não podem retirá-los ou fazer algo com eles agora mesmo. Em geral, eles realmente não começaram uma rotatividade, eles só a dão até agora.

A própria RNM é um símbolo de criptograma de etéreo(https://github.com/ethereum/EIPs/issues/20), e investir o que eles oferecem também se baseia em possibilidades de etéreo. Mais precisamente, não é sequer um investimento, mas uma oportunidade de colocar dinheiro nas suas previsões. Você carrega as suas previsões, faz uma aposta em NMR, e então o algoritmo em etéreo no tempo define os vencedores e dá prémios(https://numer.ai/whitepaper.pdf). Casino, em resumo.


Maxim Dmitrievsky:
Alguém pode confirmar que é melhor usar florestas aleatórias para classificação binária? Em caso geral ou posso pegar no neurónio em caso especial que dê um pouco menos de erro?
Em artigos postados aqui eu li que o mundo da classificação é regido por gradiente de plantio (tipo especial de floresta), no pacote R gbm, por exemplo.
 
Dr. Trader:

Sim, retirada instantânea em bitcoins ao ritmo actual.

Hmmm... esquisito.

A questão que se coloca é porque é que o fundo de cobertura americano, com o patrocínio do tio da Renascença, onde como os quants mais fixes da Terra, com salários em 200-300k dólares e bónus de seis dígitos, estes prediches dos fãs do ML mundo (Rússia, Índia, China...), pelo preço dos salários de um programador médio de Moscovo para toda a multidão (>300 pessoas) ?????

Como se eles não tivessem as suas próprias hipóteses para isso? Ou os quants de Harvard não querem fazer isso, eles só comunicam com os investidores e terceirizam os modelos....

Hmmm... como podem eles não pagar por tanta falta de previsão...

 
Dr. Trader:


Eu li em artigos postados aqui que o mundo da classificação é governado pelo aumento do gradiente (um tipo especial de floresta), no pacote R gbm, por exemplo.

Dizem que eles também se excedem... mas vou ler mais... De qualquer forma, melhor do que o MLP. A propósito, as árvores de decisão impulsionadas dão erros ligeiramente piores do que as simples árvores de decisão em estúdio.
 
Maxim Dmitrievsky:

Dizem que também alimentam demais... Mas eu vou dar uma olhada... Pelo menos melhor do que o MLP. A propósito, as árvores de decisão impulsionadas produzem um erro um pouco pior do que simples árvores de decisão no


ada é um pouco melhor do que a floresta aleatória. Mas a carpete tem algum alarido com a ada (não se lembra qual), por isso não vale a pena o esforço.

o mais promissor é a seleção de preditores. Eles são todos nossos.

Esta linha tem usado um grande número de preditores, mas todos derivados de um único par de moedas.

Porquê um par e não muitos?

E porquê um par de moedas e não os palpiteiros?

E para onde foram os dados macroeconómicos?


Até agora o meu erro no novo ficheiro é de pouco menos de 30%. 20% não é alcançável por nenhum truque, a substituição de modelos não leva a lugar nenhum.

Mas eu não tenho forças para tentar responder às perguntas acima.

 
SanSanych Fomenko:


ada é ligeiramente melhor do que a floresta aleatória. Mas no carpete há algumas coisas engraçadas com a ada (não me lembro quais), por isso não vale a pena o trabalho.

o mais promissor é a seleção de preditores. Eles são todos nossos.

Esta linha tem usado um grande número de preditores, mas todos derivados de um único par de moedas.

Porquê um par e não muitos?

E porquê um par de moedas e não os palpiteiros?

E para onde foram os dados macroeconómicos?


Até agora, o meu erro no novo ficheiro é pouco menos de 30%. 20% não é alcançável por nenhum truque, a substituição de modelos não leva a lugar nenhum.

Mas eu não tenho forças para tentar responder às perguntas acima.


Eu já tenho preditores, estranhamente. Eu tenho um bot pronto, que está em cima do real, escrevi-o em menos de um mês. O mais importante - os preditores, está fora de questão. Por exemplo, com a minha imaginação inflamada os preditores podem ser apanhados num instante, tenho trabalhado como analista há 5 anos :) Eu acho que a seleção de preditores não é uma tarefa tão difícil como estudar arquiteturas NS, o principal é sentar e escolher, levar 2-3 semanas :)

Particularmente, a última coisa que é popular agora é o LSTM, eles são muito exigentes em potência computacional, mas dão resultados incríveis. Estou pensando em conseguir um PC de jogo poderoso agora, pelo menos para cálculos de placa de vídeo, no máximo para NVidia tesla.

A partir da experiência com ns pequenos - eles precisam ser requalificados em automático ou para serem requalificados, este é um processo obrigatório. Usar GA para selecionar parâmetros dos mesmos preditores para NS também é uma obrigação. Tudo isto requer poder, mas vale mesmo a pena. Já temos alguma aparência de IA tendo em conta estes 3 componentes. Sobretreinamento+genetismo+poderes

 

SanSanych Fomenko:

A partir de hoje eu tenho um erro no novo arquivo de pouco menos de 30%. 20% não é alcançável por nenhum truque, a substituição de modelos não leva a nada.

Resultado muito alto mesmo para o HFT, você poderia verificar o conjunto de dados em csv, que deu tais resultados, eu quero ter certeza de que não é superfitting.

De alto e de longe por vezes ecoou que mesmo o minuto renascentista prevê precisão não superior a 65-70%, dado que são treinados por milhares de características impensáveis, incluindo características do processamento de imagens de satélite e dados da actividade de infra-estruturas urbanas de megacidades em todo o mundo, tudo o que faz a natureza e as multidões de pessoas no planeta - os dados.