Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3375

 
Maxim Kuznetsov #:

Dados discretos apresentados na forma de uma tabela.

Não é TO ?

Então estou completamente perdido... o que são dados tabulares/não tabulares..... tabular é uma métrica linear e a dependência de Y somente de X? então sim, não funciona de forma alguma, não existem tais animais na natureza.

O tabular é heterogêneo, como uma lista de funcionários. Onde são listados gênero, idade, salário etc. Mais linhas em dados tabulares geralmente não estão relacionadas umas às outras, por exemplo, se você somar vários funcionários, o Optimus Prime não funcionará. Mas se você somar vários pixels, obterá o Optimus Prime.
 
Em nosso caso, os dados originais são séries temporais, não tabelas. Se não usarmos análise de notícias, usaremos tabelas.

Portanto, no primeiro caso, tanto o NS quanto o bousting são adequados, talvez o NS seja melhor, depende da representação dos dados. No segundo caso, o bousting é melhor.

Portanto, aprendemos a distinguir entre a representação inicial dos dados e sua representação após o processamento.
 
Aleksey Nikolayev #:
Se eles puderem ser escritos em uma tabela, mas não puderem ser escritos em uma matriz)
Bem, os NSs funcionam melhor em dados homogêneos. Os dados tabulares podem ser gravados em uma matriz se forem do mesmo tipo.
 
Para dados tabulares, há uma arquitetura TabNet neurônica

Ela está posicionada como concorrente dos boosts.
Eu a experimentei, ela funciona bem, não é escorregadia...
 
Essas redes existem, sim. Mas nosso tópico requer redes para trabalhar com sequências em vez de tabelas. Porque elas são sequências desde o início.
 
Maxim Dmitrievsky #:
Essas redes existem, sim. Mas nosso tópico requer redes para trabalhar com sequências em vez de tabelas. Porque elas são sequências desde o início.

Estou com vontade.

Você pode provar que elas são sequências? Além do fato de serem sequências.

 
Dados tabulares, conforme entendo, a partir desta dica

É o que se chama de dados organizados, ou seja, "dados organizados".

É uma tabela em que cada linha é uma observação e a coluna é um recurso.

 
Maxim Dmitrievsky #:
Os tópicos precisam de mais redes para trabalhar com sequências em vez de tabelas.
Não entendo, as sequências não podem estar em formato de tabela?
 
Maxim Dmitrievsky #:
Essas redes existem, sim. Mas nosso tópico requer redes para trabalhar com sequências em vez de tabelas. Porque elas são sequências desde o início.

A primeira opção, tabelas - planilhas do Excel, cada linha tem um marcador de tempo. A forma mais conhecida de dados financeiros.

Segunda opção, cartas manuscritas. Aprender com um professor, com uma carta impressa como professor e uma coluna abaixo dela de variantes manuscritas dessa carta.

Comparação entre bousting e NS. Qual é o mais adequado e para qual caso? Ou são equivalentes?

PS.

Do Rattle, que tem rpart (árvore simples), rf, ada, SVM, glm, nnet (provavelmente o NS mais simples). O pior resultado é com o rpart, o segundo do final é o nnet, os outros quatro são praticamente os mesmos, dependendo dos dados de entrada.

 
Maxim Kuznetsov #:

Estou com muita vontade.

Você pode provar que são sequências? Além do fato de que são sequências.

Série temporal é mais preciso. Parece-me que você precisa oferecer uma alternativa primeiro. Caso contrário, ou é algo ou é nada.