L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 3375

 
Maxim Kuznetsov #:

Données discrètes présentées sous forme de tableau.

Pas TO ?

Alors je suis directement perdu...qu'est-ce que les données tabulaires/non-tabulaires..... tabulaire est une métrique linéaire et la dépendance de Y uniquement à X ? alors oui, cela ne fonctionne pas du tout, il n'y a pas de telles bêtes dans la nature.

Les données tabulaires sont hétérogènes, comme une liste d'employés. Le sexe, l'âge, le salaire, etc. y sont répertoriés. Les rangées de données tabulaires ne sont généralement pas liées les unes aux autres. Par exemple, si vous additionnez plusieurs travailleurs, Optimus Prime ne fonctionnera pas. Mais si vous additionnez plusieurs pixels, vous obtiendrez Optimus Prime.
 
Dans notre cas, les données originales sont des séries chronologiques et non des tableaux. Si nous n'utilisons pas d'analyse de nouvelles, nous utilisons des tableaux.

Ainsi, dans le premier cas, le NS et le bousting conviennent tous les deux, le NS est peut-être meilleur, cela dépend de la représentation des données. Dans le second cas, le bousting est meilleur.

Nous avons donc appris à faire la distinction entre la représentation initiale des données et leur représentation après traitement.
 
Aleksey Nikolayev #:
S'ils peuvent être écrits dans un tableau mais pas dans une matrice)
Les NS fonctionnent mieux sur des données homogènes. Les données tabulaires peuvent être écrites dans une matrice si elles sont du même type.
 
Pour les données tabulaires, il existe une architecture neuronale TabNet

Elle se positionne comme un concurrent des boosts.
Je l'ai essayée, elle fonctionne bien, elle ne skam...
 
De tels réseaux existent, en effet. Mais notre sujet nécessite des réseaux pour travailler avec des séquences plutôt qu'avec des tableaux. Parce qu'il s'agit de séquences dès le départ.
 
Maxim Dmitrievsky #:
De tels réseaux existent, en effet. Mais notre sujet nécessite des réseaux pour travailler avec des séquences plutôt qu'avec des tableaux. Parce qu'il s'agit de séquences dès le départ.

Je suis d'humeur.

Pouvez-vous prouver que ce sont des séquences ? En dehors du fait que ce sont des séquences.

 
Données tabulaires telles que je les comprends à partir de ce point de départ

C'est ce qu'on appelle des données ordonnées, c'est-à-dire des "données ordonnées".

Il s'agit d'un tableau où chaque ligne correspond à une observation et la colonne à une caractéristique.

 
Maxim Dmitrievsky #:
Les thèmes ont besoin de plus de réseaux pour travailler avec des séquences plutôt qu'avec des tableaux.
Je ne comprends pas, les séquences ne peuvent pas être sous forme de tableau ?
 
Maxim Dmitrievsky #:
De tels réseaux existent, en effet. Mais notre sujet nécessite des réseaux pour travailler avec des séquences plutôt qu'avec des tableaux. Parce qu'il s'agit de séquences dès le départ.

La première option, les tableaux - feuilles de calcul Excel, chaque ligne comporte un marqueur temporel. C'est la forme la plus familière de données financières.

Deuxième option, les lettres manuscrites. Apprendre avec un professeur, avec une lettre imprimée comme professeur, et une colonne en dessous avec des variantes manuscrites de cette lettre.

Comparaison entre le bousinage et les NS. Lequel est le plus approprié et pour quel cas ? Ou est-ce équivalent ?

PS.

De Rattle, qui a rpart (arbre simple), rf, ada, SVM, glm, nnet (probablement le NS le plus simple). Le plus mauvais résultat est obtenu avec rpart, le deuxième en partant de la fin est nnet, les quatre autres sont à peu près identiques, cela dépend des données d'entrée.

 
Maxim Kuznetsov #:

Je suis de bonne humeur.

Pouvez-vous prouver qu'il s'agit de séquences ? En dehors du fait qu'il s'agit de séquences.

Les séries temporelles sont plus précises. Il me semble que vous devez d'abord proposer une alternative. Sinon, c'est quelque chose ou rien.