L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2040

 
Aleksey Vyazmikin:

Il y a quelque chose là - je ne sais pas ce que c'est.

Jour de la semaine, jour du mois, heure, minute, ...même chose pour la sortie..., durée de la transaction en minutes, SL, TP, résultat +-1

2 6 0 4 2 6 57 57 100 100 -1
4 2 6 0 4 2 6 57 57 100 200 -1
4 2 6 0 4 2 6 57 57 100 300 -1
4 2 6 0 4 2 6 57 57 100 400 -1
4 2 6 0 4 2 6 57 57 100 500 -1
4 2 6 0 4 2 6 57 57 100 600 -1
4 2 6 0 4 2 6 57 57 100 700 -1
4 2 6 0 4 2 6 57 57 100 800 -1
4 2 6 0 4 2 6 57 57 100 900 -1
4 2 6 0 4 2 6 57 57 100 1000 -1
4 2 6 0 4 2 6 57 57 100 1100 -1
4 2 6 0 4 2 6 57 57 100 1200 -1
4 2 6 0 4 2 6 57 57 100 1300 -1
4 2 6 0 4 2 6 57 57 100 1400 -1
4 2 6 0 4 2 6 57 57 100 1500 -1
4 2 6 0 4 2 6 57 57 100 1600 -1
4 2 6 0 4 2 6 57 57 100 1700 -1
4 2 6 0 4 2 6 57 57 100 1800 -1
4 2 6 0 4 2 6 57 57 100 1900 -1
4 2 6 0 4 2 6 57 57 100 2000 -1
4 2 6 0 4 2 6 57 57 100 2100 -1
4 2 6 0 4 2 6 57 57 100 2200 -1
4 2 6 0 4 2 6 57 57 100 2300 -1
4 2 6 0 4 2 6 57 57 100 2400 -1
4 2 6 0 4 2 6 57 57 100 2500 -1

J'ai 8 Go de mémoire.

D'après ce que j'ai compris de vos résultats, les informations d'entrée ne sont pas du tout prises en compte. C'est étrange, car toute une classe de systèmes est basée sur le temps d'entrée.

Ainsi, 50 % sont pris à partir du jour de clôture de la transaction ?
 
Rorschach:

Jour de la semaine, jour du mois, heure, minute, ...même chose pour la sortie..., durée du trade en minutes, SL, TP, résultat +-1

J'ai 8 Go de mémoire.

D'après ce que j'ai compris de vos résultats, les informations d'entrée ne sont pas du tout prises en compte. C'est étrange, car toute une classe de systèmes est basée sur le temps d'entrée.

Vous ne pouvez pas préparer des fiches comme ça. Les plages de valeurs des colonnes doivent être proportionnelles. Pour la catégorie est fait par van chaud
 
Rorschach:

Jour de la semaine, jour du mois, heure, minute, ...même chose pour la sortie..., durée du trade en minutes, SL, TP, résultat +-1

J'ai 8 Go de mémoire.

D'après ce que j'ai compris de vos résultats, les informations d'entrée ne sont pas du tout prises en compte. C'est étrange, car toute une classe de systèmes est basée sur le temps d'entrée.

Donc 50 % sont pris sur le jour de clôture de la transaction ?

En fait, le résultat n'est pas étrange - nous voyons qu'il y a des jours où la tendance change plus souvent ou qu'il y a un flat, donc le mouvement sans balancement n'est pas infini et en moyenne il se termine après une certaine valeur de points, donc le temps de rester et le TP avec SL a frappé. Et le moment de l'entrée n'était pas important car il ne garantit pas un mouvement sans béance - il s'agit d'une prédiction de l'avenir - si nous l'avions cherché - le moment de l'entrée pour les transactions rentables, nous aurions trouvé la probabilité la plus élevée. En général, s'il y avait plus de prédicteurs, alors peut-être que l'entrée au moment avec quelqu'un serait rentable.

Le pourcentage n'indique probablement qu'à quel niveau de l'arbre se situe le clivage avec le prédicteur. Je n'ai pas eu affaire à ça. Voici la description par le traducteur :

"

Valeurs d'importance individuelles pour chacun des objets d'entrée (méthode par défaut de calcul de l'importance des objets pour les métriques sans classement).

Pour chaque objet, le changement des valeurs de prédiction montre de combien la prédiction change en moyenne lorsque la valeur de l'objet change. Plus la valeur d'importance est grande, plus le changement de la valeur de prédiction sera important en moyenne si cette caractéristique est modifiée.

"

 
Maxim Dmitrievsky:
Ce n'est pas une façon de préparer des fiches. Les plages de valeurs des colonnes doivent être comparables. Pour les catégoriques, c'est fait par van hot.

Pourquoi considérez-vous le temps comme une catégorie ? Ou quelles sont les caractéristiques dont nous parlons ?

 
Aleksey Vyazmikin:

Pourquoi pensez-vous que le temps est catégorique ? Ou de quels signes parle-t-on ?

Où est le temps là-bas ? Le jour de la semaine, le jour du mois, l'heure du jour, la minute de l'heure. Le temps est une valeur continue et il existe des catégories ordinales.
 
Aleksey Vyazmikin:

À propos, avez-vous déjà vu un générateur qui produit de façon aléatoire un nombre à partir d'un tableau sans répétitions ? J'ai besoin d'un tel générateur.

Voici ce que je fais :

1) Je crée un tableau d'index de chaînes de caractères d'une longueur égale au nombre de chaînes de caractères, je le remplis avec des valeurs de 0 à N chaînes de caractères.

2) Je mélange ce tableau

RandomizeIdx(int &idx[], int rows) {//ссылка на массив и его длина
        int j = 0, c = 0;
        for (int r = 0; r<rows; r++) {//перебор train участка
                j = RandomInteger(rows);//номер строки с которой поменять 
                c = idx[r]; idx[r] = idx[j]; idx[j] = c;
        }
}

où RandomInteger() - toute variante de

3) ensuite je prends toutes les valeurs de ces index dans une boucle et les utilise à partir du tableau principal pour obtenir la bonne chaîne, il s'avère que c'est une chaîne pseudo-aléatoire après avoir mélangé les indices
 

Quelqu'un a-t-il essayé de classer un grand nombre de classes, disons 10k ?

Est-ce que ça marche ?

 
mytarmailS:

Quelqu'un a-t-il essayé de classer un grand nombre de classes, disons 10k ?

Est-ce que ça fonctionne ?

Les arbres/les forêts/la combustion peuvent. Mais je n'ai pas essayé plus de 3, je n'ai pas eu cette tâche.
 
elibrarius:
Arbres/forêts/boîtes de conserve. Mais je n'ai pas essayé plus de 3, je n'ai pas eu cette tâche.

Les forêts s'accrochent, pas assez de RAM

 
mytarmailS:

l'échafaudage s'accroche, pas assez de RAM

moins d'arbres, moins de profondeur, peut-être assez, au moins juste pour tester