Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1957

 
elibrarius:

É isso mesmo. Seria uma boa ideia descrever de imediato a sequência de acções...
Pensando novamente na sua descrição, presumo a seguinte sequência:

1. Calcular a correlação de todos os preditores no comboio
2. Construa a árvore
3. Na última separação, lembre-se, por exemplo, das últimas 100 melhores separações. Reserve até 100, para que haja muito por onde escolher.
4. Destes 100 escolha 5 não relacionados com o preditor da melhor divisão e não relacionados entre si.

Além disso, não está claro qual destas 5 partições diferentes escolher?
Se for aleatório, então é análogo à floresta aleatória, que dá a cada árvore preditores aleatórios e constrói uma árvore sobre eles.
Se média, então novamente analógica de floresta aleatória, a floresta então de árvores aleatórias encontra média aritmética.

Agora você acertou!

É por isso queas florestas aleatórias são aleatórias, estão cheias de lixo e as condições descritas acima não são necessariamente verdadeiras, embora possa haver situações semelhantes, e é possível que um modelo de sucesso possa surgir de um tipo semelhante de decomposição. Aqui, no entanto, haverá um processo mais controlado.

Os pesos de cada divisão na folha serão pesados, é claro, e talvez demos os mesmos coeficientes, podemos pegar coeficientes na mesma história. É o que faço agora em geral quando monto um modelo a partir de folhas.

 
Valeriy Yastremskiy:

Não, as ações analógicas são soma, subtração, multiplicação, divisão e possivelmente dependências logarítmicas mais complexas, relações de poder. E estes não são cálculos, mas medidores analógicos em cada célula. E DACs e ADCs são uma saída de entrada, eles não participam dos cálculos, mas fornecem o digital.

Na arquitetura Neumann, tanto procedimentos como dados são armazenados na memória e não há acesso paralelo a procedimentos e dados; acesso a dados, depois a procedimentos, e de volta aos dados, daí as limitações de processamento de dados. E aqui os procedimentos são armazenados em cada célula por um pequeno dispositivo e há um acesso ao procedimento de uma só vez, com acesso aos dados.

Aqui estão os dados que não entendo, é condicionalmente falando, cada instrução tem acesso direto à memória e aos resultados do cálculo sem a esteira transportadora?

 
Aleksey Vyazmikin:

Agora você acertou!

As florestas aleatórias são aleatórias porque estão cheias de lixo e as condições descritas não são necessariamente cumpridas, embora possa haver situações semelhantes, e é possível que um modelo de sucesso seja obtido por avarias semelhantes. Aqui, no entanto, haverá um processo mais controlado.

Os pesos de cada divisão da folha serão pesados, é claro, e talvez demos os mesmos coeficientes, podemos pegar coeficientes sobre a mesma história. É assim que o faço agora, em geral, quando monto um modelo a partir de folhas.

Não entendo o passo final, - qual das 5 partições escolher?
 
elibrarius:
Não entendi a etapa final - qual das 5 divisões a escolher?

As leituras de todas as 5 divisões têm de ser tidas em conta, o que aumenta a estabilidade.

Suponha que a melhor divisão recebe um peso de 0,6, e as outras quatro recebem 0,1 cada, e se a soma dá 0,8 ou outra pontuação, determinada por amostragem, então a resposta é verdadeiro "1" ou a outra classe esperada na folha.

Precisamos também de verificar para a Recall , ou seja, quantos se lembram das divisões que existem nesta subamostra.
 
Aleksey Vyazmikin:

O que eu não entendo sobre os dados é que eles são nocionais, cada instrução tem acesso direto à memória e aos resultados dos cálculos sem um transportador?

Não há 'dados', apenas elétrons cuja corrente é controlada por transistores e assim por diante. A arquitetura NS em si é impressa no quadro, não em formato digital. Há muito tempo que fazem tais redes neurais analógicas sob a forma de coprocessadores, por exemplo, em iPhones.

Não há nada de novo no artigo.
 
Maxim Dmitrievsky:

não há 'dados', apenas elétrons cuja corrente é controlada por transistores e assim por diante. A arquitetura NS em si é impressa no quadro, não em formato digital. Há muito tempo que fazem tais redes neurais analógicas sob a forma de coprocessadores, por exemplo, em iPhones.

Não há nada de novo no artigo.

E eu entendi que estamos falando de cálculos dinâmicos e não estáticos, pré-determinados.

 
Aleksey Vyazmikin:

E eu entendi isso como significando cálculos dinâmicos, não estáticos, pré-determinados.

Por exemplo, o sinal de uma matriz de câmera do iPhone é alimentado diretamente para o NS analógico, contornando a digitalização. Os NS pré-processam a imagem para melhorar a qualidade (filtrar o ruído, etc.)

e depois isto é convertido em fotos digitais

 
Aleksey Vyazmikin:

Meu entendimento é que estamos falando de cálculos dinâmicos, não de cálculos estáticos, pré-determinados.

Uma analogia aproximada são as válvulas de gaveta electrónica e os compressores. Claro que os dispositivos nas células são estáticos, mas há muitos deles e há acesso paralelo a eles) E os cálculos podem ser dinâmicos, se mudarmos o sinal de entrada, obtemos uma saída dinâmica.

 
Aleksey Vyazmikin:

As leituras de todas as 5 divisões devem ser levadas em conta, o que aumenta a estabilidade.

Suponha que damos 0,6 peso à melhor divisão, e 0,1 às outras quatro, e se a soma dá 0,8 ou algum outro valor, determinado por amostragem, então assumimos que a resposta é verdadeiro "1" ou alguma outra classe esperada na folha de trabalho.

Você também precisa checar por Recall, ou seja, quantas se lembram das divisões que existem nessa subamostra.
A divisão mais limpa será misturada com as menos limpas. Ou seja, pioramos o resultado na bandeja, em princípio não importa. Mas não é certo que melhore o resultado do teste, ou seja, a generalizabilidade. Alguém devia tentar... Pessoalmente, acho que a generalização não será melhor do que o caso dos andaimes.

É muito mais fácil limitar a profundidade da árvore e não fazer a última fenda, parando na anterior. Vamos acabar com a mesma folha menos clara do que se fizéssemos uma divisão extra. A sua opção daria algo no meio, quer fizéssemos uma divisão ou não. Isto é, por exemplo, você irá calcular a média da folha no sétimo nível de profundidade com o seu método. Será ligeiramente mais limpo do que a folha de nível 6 de profundidade. Acho que a generalização não vai mudar muito, e é muito trabalho para testar a ideia. Você também pode obter uma média de várias árvores com níveis de profundidade 6 e 7 - você obterá aproximadamente o mesmo resultado da sua metodologia.
 
Aleksey Vyazmikin:

Algum tipo de acção sobre as ondas em essência? Os dados recebidos são convertidos em um polinômio e então o polinômio é convertido em uma onda e as ondas são de alguma forma "colididas/fundidas"?

Bem, sim.

Já houve tentativas de construir computadores analógicos antes, mas eles eram muito lentos ou intensivos em energia.