Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3030

 
Forester #:

Essa é uma descrição complicada. Classifique a coluna e divida-a em 32 partes, por exemplo, se houver duplicatas, todas elas serão jogadas no quantum. Se a coluna tiver apenas 0 e 1, haverá 2 quanta, não 32 (porque há duplicatas).

Você se refere ao método, e eu me refiro à meta. Os métodos podem ser diferentes. Deixe-me colocar desta forma: os métodos empíricos geralmente são melhores do que os matemáticos. Talvez porque não tenhamos dados completos sobre a amostra geral.

 
Aleksey Nikolayev #:

Essencialmente, verifica-se que uma árvore é construída em cada preditor separadamente.

Sim, é assim que as árvores C4.5 são criadas para valores discretos. Uma divisão.

 
Aleksey Vyazmikin #:

Você está falando sobre o método, eu estou falando sobre a meta. Pode haver métodos diferentes. Deixe-me colocar desta forma: os métodos empíricos geralmente são melhores do que os métodos matemáticos. Provavelmente porque não temos dados completos sobre a amostra geral.

Para dados não estacionários, não há nenhum conceito de "amostra principal", nada além de caudas. Esse é o problema, e é por isso que qualquer estimativa de treinamento é extremamente difícil de ser obtida no futuro.

 
СанСаныч Фоменко #:

Para dados não estacionários, não há nenhum conceito de "amostra principal", nada além de caudas. Esse é todo o problema, e é por isso que qualquer estimativa obtida no treinamento é extremamente difícil de ser obtida no futuro.

Nós não sabemos isso. Mais precisamente, não conhecemos a verdadeira densidade da distribuição e só observamos os trechos - é por isso que essas flutuações...

Eu não vivo de conceitos :)

Então, diga-me como se chama esse fenômeno, que não podemos observar, porque estamos no processo dele, e ele foi concluído há muito tempo nos confins do espaço....

 
СанСаныч Фоменко #:

Para dados não estacionários, não há nenhum conceito de "amostra principal", nada além de caudas. Esse é todo o problema, e é por isso que qualquer estimativa obtida no treinamento é extremamente difícil de ser obtida no futuro.

É isso mesmo, SanSanych.

Os dados não estacionários estão sempre sujeitos aos efeitos cumulativos de outros dadosnão estacionários. Do qual as caudas dependerão.

 
Aleksey Vyazmikin #:

O intervalo de valores do preditor que descreve os dados.

Aqui eu descrevi praticamente o algoritmo - há também uma imagem com o RSI.

Entendi: separe tudo e tudo e estude-o separadamente.

Não entendo por que eles são quânticos.
 
Maxim Dmitrievsky #:
Não entendo por que eles são quânticos.

Porque o garoto não vive de acordo com as regras, ele escreveu)

 
Maxim Dmitrievsky #:

Entendi: separe tudo e todos e estude-os separadamente.

Não entendo por que eles são quânticos.

Bem, provavelmente são as traduções. terminologia.

Há a quantificação e seus diferentes métodos, a tabela que contém os pontos de divisão - tabela quântica - já vem da instrução CatBoost.

Segmentos quânticos - da tabela quântica, mas os extremos têm limites. Essa já é uma invenção minha.

 
Aleksey Vyazmikin #:

Bem, provavelmente a culpa é dos tradutores. a terminologia.

Há quantização e seus diferentes métodos, a tabela que contém pontos de divisão - tabela quântica - já vem da instrução CatBoost.

Segmentos quânticos - da tabela quântica, mas os extremos têm limites. Essa já é uma invenção minha.

não quântico, provavelmente quântico, como aqui.

5.4 Quantificação de redes neurais convolucionais

Classicamente, devido a dificuldades óbvias de otimização, ao quantificar redes neurais, não se usam apenas números inteiros, mas sim uma aproximação de números de ponto flutuante por meio de números inteiros. Uma abordagemamplamente usada na literatura [52, 54, 60] para aproximar números de ponto flutuante por meio de inteiros de profundidade arbitrária é o algoritmo proposto na biblioteca GEMMLOWP do Google [59]. Tendo uma matriz de entrada 𝑋, valores de limite [𝑣􏰲􏰭􏰠,𝑣􏰲􏰈􏰂], número de bits 𝑀, o resultado é definido da seguinte forma:

𝑠𝑐𝑎𝑙𝑒=(𝑣􏰲􏰈􏰂 - 𝑣􏰲􏰭􏰠)/2􏰳,(14) 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡 = 𝑟𝑜𝑢𝑛𝑑(min(max(-𝑣􏰲􏰭􏰠/𝑠𝑐𝑎𝑙𝑒, 0),2􏰳)),(15)𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡 = 𝑟𝑜𝑢𝑛𝑑(𝑋/𝑠𝑐𝑎𝑙𝑒 + 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡).(16)

Assim, para cada matriz de números de ponto flutuante, obtemos uma matriz inteira 𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡, inteira 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡, representando com precisão o zero, um número𝑠𝑐𝑎𝑙𝑒 de dupla precisão que define a escala de quantização.


https://dspace.susu.ru/xmlui/bitstream/handle/0001.74/29281/2019_401_fedorovan.pdf?sequence=1&isAllowed=y

 
Maxim Dmitrievsky #:

não quântico, quantificado, como aqui.

5.4 Quantificação de redes neurais convolucionais

Classicamente, devido a dificuldades óbvias de otimização, a quantização de redes neurais não usa apenas números inteiros, mas sim uma aproximação de números de ponto flutuante por meio de números inteiros. Uma abordagemamplamente usada na literatura [52, 54, 60] para aproximar números de ponto flutuante por meio de inteiros de profundidade arbitrária é o algoritmo proposto na biblioteca GEMMLOWP do Google [59]. Tendo uma matriz de entrada 𝑋, valores de limite [𝑣􏰲􏰭􏰠,𝑣􏰲􏰈􏰂], número de bits 𝑀, o resultado é definido da seguinte forma:

𝑠𝑐𝑎𝑙𝑒=(𝑣􏰲􏰈􏰂 - 𝑣􏰲􏰭􏰠)/2􏰳,(14) 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡 = 𝑟𝑜𝑢𝑛𝑑(min(max(-𝑣􏰲􏰭􏰠/𝑠𝑐𝑎𝑙𝑒, 0),2􏰳)),(15)𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡 = 𝑟𝑜𝑢𝑛𝑑(𝑋/𝑠𝑐𝑎𝑙𝑒 + 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡).(16)

Assim, para cada matriz de números de ponto flutuante, obtemos uma matriz inteira 𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡, inteira 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡, um número inteiro que representa com precisão o zero, um número𝑠𝑐𝑎𝑙𝑒 de dupla precisão que define a escala de quantificação.


https://dspace.susu.ru/xmlui/bitstream/handle/0001.74/29281/2019_401_fedorovan.pdf?sequence=1&isAllowed=y

Estou lhe dizendo, é uma questão de tradução - são todos sinônimos. Aqui estão as configurações do CatBoost.