L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1189

 
Aleksey Nikolayev:

Je n'ai rien vu dans la branche sur les critères d'information(Bayesian ou Akaike). Peut-être sont-ils utilisés par défaut (dans les paquets MO appliqués) ?

l'entropie croisée est utilisée ou la perte logarithmique.

pour la classification multiclasse et binaire respectivement

pour la moyenne quadratique des tâches de régression. (rms) et similaires

Je crois que c'est Akaike

 
J'ai vérifié PCA et LDA pour le prétraitement des prédicteurs (se débarrasser de la colinéarité). Comme prévu, cela ne fonctionne pas sur les nouvelles données car les composants eux-mêmes commencent à rebondir, bien que le modèle puisse être légèrement mieux entraîné sur eux dans le train. Mais comme les composants eux-mêmes se comportent de manière imprévisible sur les nouvelles données, c'est la même chose et même pire. En général, bon nombre des techniques classiques de MO ne s'appliquent tout simplement pas au marché, ou plutôt, cela ne marche pas de front.
 
Maxim Dmitrievsky:

l'entropie croisée est utilisée ou Log Loss

pour la classification multiclasse et binaire respectivement

pour la moyenne quadratique des tâches de régression. (rms) et similaires

Je suppose que c'est ce qu'est Akaike.

On dirait que oui.

 
Maxim Dmitrievsky:
Vérifié PCA et LDA pour le prétraitement des prédicteurs (se débarrasser de la colinéarité). Comme prévu, cela ne fonctionne pas avec les nouvelles données car les composants eux-mêmes commencent à sauter, bien que le modèle puisse être entraîné sur eux un peu mieux dans une remorque. Mais comme les composants eux-mêmes se comportent de manière imprévisible sur les nouvelles données, c'est la même chose et même pire. En général, bon nombre des techniques classiques de MO ne sont tout simplement pas applicables au marché.

En raison de la non-stationnarité, il est parfois nécessaire d'écarter l'historique obsolète :

1) Nous avons besoin d'un algorithme approprié pour écarter la partie obsolète de l'échantillon (recherche de discontinuité).

2) La partie restante de l'échantillon sera toujours de longueur variable et souvent courte. Nous avons besoin de bons modèles ici aussi.

 

Maxim Dmitrievsky:

Cela a déjà été mis en œuvre dans le nouvel article, mais pas exactement comme nous le souhaiterions.

De quel article parle-t-on ?

 
Igor Makanu:

De quel article parle-t-on ?

qui a été soumis à la modération, pas encore publié

 
Maxim Dmitrievsky:

il existe une autre approche, que je considère comme la plus prometteuse pour le moment : le forçage brutal des modèles par l'énumération des variables de sortie.

En gros, le trader virtuel effectue des transactions un nombre pseudo-aléatoire de fois (comme Monte Carlo ou la génétique), à chaque fois il surveille ses transactions et corrige les mauvaises positions, les positions non rentables en gros, pour qu'elles deviennent rentables.

après chaque passage, il se réentraîne sur des transactions corrigées. Ceci est déjà mis en œuvre dans le nouvel article, mais pas tout à fait comme nous le souhaiterions. Nous avons besoin de combinaisons intéressantes de sorties qui dépendent des conditions actuelles du marché, par exemple de la dispersion et de la pente sur n barres. Pour chacune de ces caractéristiques, une distribution est sélectionnée à partir de laquelle des transactions aléatoires sont échantillonnées, puis, de la même manière, des transactions à perte sont corrigées et entraînées sur elles. Après un grand nombre de passages, la stratégie optimale est recherchée (sur la base de l'erreur minimale sur l'échantillon de test).

Chers connaisseurs, soyez attentifs, Question: Comment organiser de manière intéressante les dépendances des caractéristiques probabilistes actuelles du marché et des distributions à partir desquelles les sorties aléatoires sont échantillonnées. Dans ce cas, le nombre de transactions et certaines dépendances à l'intérieur du modèle changent, c'est-à-dire que nous obtenons un grand nombre de modèles (solutions) rentables différents, parmi lesquels le modèle optimal est sélectionné selon un critère d'optimisation personnalisé (erreur de modèle, stabilité sur les nouvelles données).

Les sorties semblent avoir un sens lorsque le prélèvement sur le capital est supérieur à celui spécifié et que sa croissance est trop lente par rapport à la volatilité (faible rapport entre l'asymétrie et la variance).

Il n'est pas très clair comment cette approche aidera à combattre la non-stationnarité).

 
Maxim Dmitrievsky:

qui a été soumis à la modération, pas encore publié

merci, je vais attendre, maintenant je ne vais pas le manquer !

 
Индикатор хаоса и режимы фондового рынка
Индикатор хаоса и режимы фондового рынка
  • www.long-short.pro
Выше изображены известные Треугольник Серпинского и Кривая Коха. Эти объекты являются «самоподобными», и это означает, что их исследование на более детальном уровне покажет ту же форму. Оба элемента являются примерами «фрактальной геометрии» и характерны для многих явлений в природе, таких как горы, кристаллы и газы. Самоподобные объекты...
 
mytarmailS:

article intéressanthttp://www.long-short.pro/post/indikator-haosa-i-rezhimy-fondovogo-rynka-886

et le blog en général.

Avez-vous essayé d'exprimer son indicateur en code ?

1) находим максимум минус минимум для каждого из 10 дней, предшествующих настоящему моменту; 
2) берем сумму этих значений (сумма частей); 
3) находим 10-дневный диапазон: 10-дневный максимум минус 10-дневный минимум; 
4) делим сумму частей на целый диапазон – это основная мера фрактальной размерности/сложности; 
5) берем 60-дневную среднюю 10-дневной серии значений сложности – это метрика квартального хаоса/стабильности; 
6) используем 252-дневное нормальное распределение z-оценки или ранг процентиля метрики хаоса/стабильности; 
7) значения, которые выше 0,5, показывают, что рынок находится в режиме «хаоса» и гораздо менее предсказуем и нестационарен, значения ниже 0,5 показывают, что рынок стабилен и намного более предсказуем.