Algorithme pour combiner les plages d'un segment - aide à la création - page 6

 
Aleksey Vyazmikin:

Quelle différence cela fait-il que les chemins soient longs ou courts, ou est-ce une question d'estimation (la longueur de la flèche dans l'analogie de la figure) ?

Nous souhaitons emprunter les deux meilleurs chemins dans l'exemple, s'il y en a moins, il n'y a qu'un seul chemin.

Veuillez expliquer pourquoi cela pourrait être un problème.

S'il y a des chemins longs et courts dans l'ensemble, le chemin est plus long si vous entrez dans la zone avec seulement des chemins longs que si vous entrez dans la zone avec des chemins courts. Par exemple, au début, comme sur votre photo, il y a deux zones parallèles l'une à l'autre, et dans la première zone, les segments sont 3 fois plus courts que dans la deuxième zone et occupent 75 % du chemin.

 
Valeriy Yastremskiy:

S'il y a des zones avec des segments courts et longs dans le jeu, alors si vous atteignez la zone avec seulement des segments longs, le chemin sera plus long que si vous atteignez la zone avec des segments courts. Par exemple, au début, comme dans votre dessin, il y a deux zones parallèles l'une à l'autre, et dans la première zone, les segments sont 3 fois plus courts que dans la deuxième zone et occupent 75 % du chemin.

Le mouvement commencera à partir de chaque segment, vous devez donc passer par ces zones également.

 
Aleksey Vyazmikin:

Le mouvement commencera à partir de chaque segment, et devra donc passer par ces zones également.

Le mouvement peut commencer à partir de n'importe quel segment, mais il est clair que les longs points de segment ne sont pas nécessaires. Dans votre algorithme, vous n'avez des relations qu'avec les segments les plus proches, et non avec n'importe quel segment. Si vous rencontrez un point avec des segments longs, et des points proches avec seulement des segments longs, ce n'est pas un bon résultat.

 
Valeriy Yastremskiy:

Le mouvement peut commencer à partir de n'importe quel segment, mais il est clair que les longs points de segment ne sont pas nécessaires. Dans votre algorithme, vous n'avez des relations qu'avec les segments les plus proches, pas avec n'importe quel segment, et si vous arrivez à un point avec de longs segments, et à côté de points avec seulement de longs segments, ce n'est pas le meilleur résultat.

La "longueur" est relative ici, jusqu'à ce que vous arriviez à un point où vous ne pouvez pas la mesurer.

Une autre chose est l'estimation en analogues composites, quand un segment est représenté par deux, alors oui, nous pouvons laisser tomber un segment.

 
Aleksey Vyazmikin:

La "longueur" est ici relative, jusqu'à ce que nous arrivions à un point où nous ne pouvons pas la mesurer.

Une autre chose est l'estimation sur les analogues composites, quand un segment est représenté par deux, alors oui, nous pouvons laisser tomber un segment.

Je ne comprends pas. Si le rapport longueur/prix ne peut être examiné qu'en atteignant un point, la tâche est beaucoup plus difficile. Et sans une estimation suffisamment complète du prix et de la durée, le résultat ne peut être estimé de manière fiable.

Ce n'est pas clair pour les analogues composites.

 
Valeriy Yastremskiy:

Je ne comprends pas. Si le rapport longueur/prix ne peut être consulté qu'en touchant un point, la tâche est beaucoup plus difficile. Et sans une estimation suffisamment complète du prix et de la durée, le résultat ne peut être évalué de manière fiable.

Oui, c'est vrai.

Valeriy Yastremskiy:

Ce n'est pas clair pour les analogues composites.

Dans la figure ci-dessous, nous avons deux grands segments et 5 petits segments en dessous d'eux, mais vous pouvez voir qu'ils sont sur la même plage et décrivent donc essentiellement une zone similaire.

La seule question qui se pose est de savoir ce qui est le mieux : les barres plus petites qui donnent la possibilité à chacun de trouver un prédicteur corrélé et d'avoir un seuil plus précis, ou la plus grande capacité de généralisation dans la barre la plus grande. Je pense que les coupures peu profondes sont meilleures, leur minimum est limité dans la sélection.

 

Une autre idée m'est venue à l'esprit : pourquoi ne pas prendre les meilleurs x% des segments et les utiliser pour remplir l'espace dans la première étape, et dans la deuxième étape, identifier les écarts entre les segments et chercher des segments à intégrer dans ces écarts.

La figure montre conventionnellement deux étapes.


 
Aleksey Vyazmikin:

Une autre idée m'est venue à l'esprit : pourquoi ne pas prendre les meilleurs x% des segments et les utiliser pour remplir l'espace dans la première étape, et dans la deuxième étape, identifier les écarts entre les segments et chercher des segments à intégrer dans ces écarts.

Dans la figure, j'ai représenté les deux étapes de manière conditionnelle.


Eh bien, c'est ce que j'essaie de dire, estimez d'abord les longueurs/valeurs à partir de points, identifiez plusieurs segments précieux et toxiques, puis construisez un chemin en fonction des valeurs des segments et de la capacité à remplir au mieux le chemin sans lacunes.

Au minimum, la solution ne sera pas la meilleure, mais elle sera meilleure que la moyenne.

 

La question est hors sujet et plutôt philosophique. Se rend-on compte que l'approche de la classification par la division des attributs en segments implique une dépendance discontinue des sorties par rapport aux entrées ? En d'autres termes, il peut arriver qu'une transaction s'ouvre sur un ensemble d'attributs et ne s'ouvre pas sur un autre très, très proche du premier (ils sont proches de la limite, mais de part et d'autre de celle-ci). Je ne dis pas que c'est une mauvaise approche. Je veux juste demander - y a-t-il une sorte d'intuition du trader derrière cela ou est-ce un choix arbitraire ?

Comme alternative possible, on peut proposer une classification par régression logistique ou par la méthode du plus proche voisin. La sortie peut contenir l'estimation de la probabilité d'appartenance à une classe, qui peut être utilisée, par exemple, pour déterminer le volume des échanges. Je n'insiste pas sur un algorithme particulier, je m'intéresse simplement à l'aspect commerçant du choix d'un algorithme MO particulier.

 
Valeriy Yastremskiy:

C'est ce que j'essaie de dire, estimez d'abord les longueurs/valeurs à partir des points, identifiez les nombreux segments précieux et toxiques, puis construisez un chemin en fonction des valeurs des segments et de la capacité à remplir au mieux le chemin sans lacunes.

Au minimum, la solution ne sera pas la meilleure, mais elle sera meilleure que la moyenne.

La question ici est de savoir comment identifier "de nombreux segments précieux et toxiques" - c'est-à-dire que vous devez identifier leur interchangeabilité, ou le faire en deux temps, comme je l'ai suggéré précédemment. Ou avez-vous une autre option ?