Question pour les développeurs - utilisation de tous les cœurs de calcul pendant l'optimisation - page 3

 
Renat Fatkhullin:
La reconstruction du testeur est une priorité pour nous maintenant. Beaucoup de choses seront réécrites.

Le problème d'un gestionnaire de tâches rationnel est résolu.

Nous aimerions comprendre la date limite pour corriger l'erreur, s'il vous plaît dès que possible ... Pouvez-vous nous donner une estimation du temps d'attente ?

 
Maksim Emeliashin:

J'ai écrit de nombreuses fois sur ce problème, mais j'ai été envoyé pour lire comment l'algorithme génétique fonctionne. Je sais comment cela fonctionne, et lors de ma quatrième année d'université, je l'ai même mis en œuvre moi-même en tant que laboratoire.

Ma situation était encore pire, voici une capture d'écran :


Avec la version 2286, la situation s'est améliorée, il n'y a plus de bug aussi évident, mais périodiquement, la moitié des agents échouent toujours. Je sais comment le réparer, mais c'est une douleur dans le cul.

Décrivez le problème !

Plus la génération est ancienne, moins le nombre de cœurs nécessaires au calcul est élevé.

Comment utiliser 18 agents pour 3-4-5 ensembles de paramètres uniques dans la prochaine génération ?

Vous dites que vous savez comment fonctionne la génétique - donnez-nous vos suggestions.

 
Boris Egorov:

Nous aimerions comprendre la date limite pour corriger l'erreur, s'il vous plaît dès que possible ... Pouvez-vous nous donner une estimation du temps d'attente ?

À quelle erreur faites-vous référence ?

Avez-vous lu comment fonctionne l'algorithme d'optimisation génétique ?

 
Slava:

Décrivez le problème !


Je vais décrire une solution qui ne nécessite pas la connaissance de l'algorithme.

Déconnectez un cœur de processeur au moment où le problème se produit (la moitié des agents locaux ou réseau ont échoué). Il est important de désactiver le noyau qui est en cours d'exécution.

2. Remettre le noyau en marche.

Et, soudain, tous les autres agents locaux et du réseau sont allumés et fonctionnent bien jusqu'à la fin.

 
Maksim Emeliashin:

Je vais décrire une solution qui ne nécessite pas la connaissance de l'algorithme.

Déconnectez l'un des cœurs du processeur au moment où la situation se produit (la moitié des agents locaux ou du réseau ont échoué). Il est important de désactiver le noyau qui est en cours d'exécution.

2. Remettre le noyau en marche.

Soudain, tous les autres agents locaux et du réseau se mettent en ligne et fonctionnent bien jusqu'à la fin.

Oui, je soupçonne même la raison pour laquelle l'"erreur" se produit et pourquoi cet informateur la "répare". Mais sans voir le code source de l'implémentation spécifique de MQ sous vos yeux, il est inutile de spéculer à ce sujet.

Mais même en voyant la boîte noire devant nous, nous pouvons supposer que le problème réside dans la distribution des paquets de tâches entre les agents.

 
Slava:

À quelle erreur faites-vous référence ?

Avez-vous lu comment fonctionne l'algorithme d'optimisation génétique ?

Je n'ai pas besoin de connaître l'algorithme, même si je le fais.

Et vous n'avez pas besoin de faire le malin, parce que ça n'en a pas l'air.

Si vous n'avez pas lu les messages précédents et ne voyez pas les photos, n'intervenez pas et ne montrez pas votre ignorance.

le bug est .... Elle n'était pas présente dans les versions précédentes et elle est indéniable.

Ça m'étonne parfois que des types débarquent de nulle part, ne lisent rien, écrivent des conneries comme s'ils étaient intelligents.

Slava - lisez mes messages précédents avec les images, tout y est décrit en détail, je suis moi-même programmeur mais je ne fais pas de telles bêtises, vous dites n'importe quoi sur les générations ... Il est inutile d'expliquer si vous n'avez pas lu mes précédents posts avec des images, d'ailleurs je pense que vous ne connaissez pas l'algorithme vous-même ....

>Plus la génération est ancienne, moins le nombre de cœurs nécessaires au calcul est élevé.

>Comment utiliser 18 agents pour 3-4-5 ensembles uniques de paramètres dans la prochaine génération ?

ça marche comme ça depuis le début dans la deuxième génération, dans mon cas comptez encore 70-80k variantes... Ilaccepte BEAUCOUP de tâches UNIQUEMENT pour les agents locaux et n'accepte pasdu toutlesagents de réseau, en fait, ils ont désactivé tous les agents de réseau complètement, l'optimisation ne fonctionne pas du tout, l'erreur est CRITIQUE et doit être résolue immédiatement.

 
Boris Egorov:

Je n'ai pas besoin de connaître l'algorithme, même si je le fais.

Et vous n'avez pas besoin de faire le malin, parce que ça n'en a pas l'air.

Si vous n'avez pas lu les messages précédents et ne voyez pas les photos, n'intervenez pas et ne montrez pas votre ignorance.

le bug est .... Elle n'était pas présente dans les versions précédentes et elle est indéniable.

Ça m'étonne parfois que certaines personnes sortent de nulle part, ne lisent rien, écrivent des conneries comme si elles étaient intelligentes.

Slava - lisez mes messages précédents avec les images, tout y est décrit en détail, je suis moi-même programmeur mais je ne fais pas de telles bêtises, sur les générations que vous écrivez des bêtises ... Il estinutile d'expliquer si vous n'avez pas lu les messages précédents avec des photos, d'ailleurs je pense que vous ne connaissez pas l'algorithme vous-même...

Vous avez montré une capture d'écran. Sans aucune description, autre que "tous les cœurs ne sont pas chargés".

Vous pouvez comprendre à partir de cette capture d'écran que la génétique fonctionne, le calcul de la deuxième génération. On ne sait pas quel est le temps d'exécution minimum et maximum par tâche. On ignore également quel est le temps d'exécution moyen - le bon endroit dans la capture d'écran est simplement fermé.

Encore une supposition - le temps d'exécution moyen est très court. Par conséquent, le mécanisme de redistribution des emplois n'a pas encore été activé.

Le mécanisme de redistribution n'a pas changé depuis les versions précédentes. Pendant au moins une demi-année. Il semble que la plupart des paramètres sélectionnés au hasard ne conviennent pas à cette stratégie, de sorte que la plupart des passes se sont terminées très rapidement.

Ce n'est qu'un diagnostic à partir d'une capture d'écran incomplète. Sans aucun journal fourni.

 
Slava:

Vous avez montré une capture d'écran. Sans autre description que "tous les cœurs ne sont pas chargés".

Vous pouvez voir sur cette capture d'écran que la génétique fonctionne, le calcul de la deuxième génération. On ne sait pas quel est le temps d'exécution minimum et maximum par travail. On ne sait pas non plus quel est le temps d'exécution moyen - la partie droite de la capture d'écran est juste fermée.

Encore une supposition - le temps d'exécution moyen est très court. Par conséquent, le mécanisme de redistribution des emplois n'a pas encore été activé.

Le mécanisme de redistribution n'a pas changé depuis les versions précédentes. Pendant au moins une demi-année. Il semble que la plupart des paramètres choisis au hasard ne conviennent pas à cette stratégie, ce qui explique pourquoi la plupart des passes se sont terminées très rapidement.

Ce n'est qu'un diagnostic à partir d'une capture d'écran incomplète. Sans aucun journal fourni.

J'utilise le dépassement complet et j'ai clairement écrit - qu'avant l'optimisation prenait 3 heures maintenant 11 et demi ... - c'est votre réponse.

>On ne sait pas quel est le temps d'exécution minimum et maximum par tâche. On ignore également quel est le temps d'exécution moyen - le bon endroit dans la capture d'écran est simplement fermé.

Vous n'avez pas besoin de savoir ça du tout.

>Le mécanisme de re-partage n'a pas été modifié depuis les versions précédentes. Pendant au moins une demi-année. Il semble que la plupart des paramètres choisis au hasard ne conviennent pas à cette stratégie, de sorte que la plupart des passes se sont terminées très rapidement.

tout a commencé après les dernières mises à jour, je n'ai pas changé le programme, je ne fais que des calculs avec des paramètres différents, je vous dis que le même programme (sans recompilation) avec les mêmes paramètres prenait 3 heures à optimiser, maintenant c'est 11 heures et demie, et je vous dis - tous les agents réseau sont désactivés en fait .... Ne dites donc pas que le mécanisme de distribution n'a pas changé - il a bel et bien changé.

 
Boris Egorov:

J'utilise un dépassement complet et j'ai clairement écrit - qu'auparavant l'optimisation prenait 3 heures maintenant 11 et demi ... - c'est votre réponse.

>Quel est le temps d'exécution minimum et maximum par travail - inconnu. On ignore également quel est le temps d'exécution moyen - le bon endroit dans la capture d'écran est simplement fermé.

Vous n'avez pas besoin de savoir ça du tout.

>Le mécanisme de re-partage n'a pas été modifié depuis les versions précédentes. Pendant au moins une demi-année. Il semble que la plupart des paramètres choisis au hasard ne conviennent pas à cette stratégie, si bien que la plupart des passes se sont terminées très rapidement.

tout a commencé après les dernières mises à jour, je n'ai pas changé le programme, je ne fais que des calculs avec des paramètres différents, je vous dis que le même programme (sans recompilation) avec les mêmes paramètres prenait 3 heures pour être optimisé, maintenant c'est 11 heures et demie, et je vous dis - tous les agents réseau sont désactivés en fait .... Ne dites donc pas que le mécanisme de distribution n'a pas changé - il a bel et bien changé.

Vous n'avez fourni aucun journal.

Pourquoi vos agents à distance ne comptent-ils pas ? Pourquoi ont-ils le build 2214 ? Le terminal client est-il également une version 2214 ?

 
Slava:

Vous n'avez fourni aucun journal.

Pourquoi vos agents à distance ne comptent-ils pas ? Pourquoi leur build est 2214 ? Le terminal client est-il également construit en 2214 ?

2286

si vous avez besoin de journaux, c'est difficile, il est plus facile de faire fonctionner n'importe quel conseiller expert avec un grand ensemble pour l'optimisation.

mais si vous me dites où placer les logs, je vais essayer de le faire.

je ne comprends pas que les logs dépassent parfois toutes les dimensions imaginables et je ne veux pas les éteindre ou les limiter de quelque manière que ce soit, donc je dois les nettoyer

je ne peux le faire qu'en 12 heures environ lorsque je lance un nouveau calcul

Le conseil ci-dessus de désactiver l'un des cœurs de travail fonctionne d'ailleurs :-) ce qui confirme un bug dans l'algorithme de distribution.