AI EngineeringDecember 10, 202511 min read
    SC
    Sarah Chen

    Tutoriel AAAI 2022 - Théorie et pratique de la planification en IA — Concepts clés, méthodes et points à retenir

    Tutoriel AAAI 2022 - Théorie et pratique de la planification en IA — Concepts clés, méthodes et points à retenir

    AAAI 2022 Tutorial: AI Planning Theory and Practice — Key Concepts, Methods, and Takeaways

    Commencez par une recommandation concrète : cartographiez votre tâche de planification avec un processus compact et exécutez une expérience reproductible. Choisissez un cas d’utilisation majeur comme la gestion du trafic ou la planification logistique, et encadrez-le comme une séquence linéaire d’actions qui passe d’un état initial à un objectif. Conservez le domaine connu et indépendant des détails de la plateforme, afin qu’ils soient testés avec plusieurs planificateurs. Construisez un petit banc d’essai avec 2 à 3 agents pour observer les interactions, mesurer le temps d’exécution et suivre quelques transactions comme références.

    De la théorie à la pratique, identifiez trois piliers : la recherche dans l’espace d’états, les graphes de planification et les méthodes basées sur les contraintes. En pratique, mélangez l’analyse avec des conseils heuristiques pour naviguer dans de grands espaces de recherche et pour vous aider à prendre des décisions robustes plus rapidement. Appliquez la vérification de modèles et une vérification légère pour révéler les impasses, les conflits de ressources ou les contraintes violées avant le déploiement ; elles sont utiles pour une itération rapide.

    Trois axes pratiques vous aident à comparer les approches : la représentation (semblable à STRIPS ou les variantes PDDL), la gestion de la concurrence (actions indépendantes vs ressources partagées) et l’évaluation (références, mesures et exécutions reproductibles). Choisissez une représentation qui maintient la clarté des préconditions et des effets, afin que les planificateurs puissent raisonner sur les dépendances des processus. Utilisez des conseils heuristiques pour élaguer les branches, et testez sur un ensemble de tâches fixes avec la même limite de temps pour permettre des comparaisons équitables.

    Les principaux points à retenir comprennent des encodages modulaires qui voyagent à travers les domaines, une suite de référence partagée avec des bases claires et une documentation des hypothèses. Utilisez la simulation pour tester la résistance des planificateurs, exécutez des analyses pour comparer les résultats et capturez le temps, la mémoire et la longueur du plan. Jumelez la vérification à la vérification de modèles pour confirmer la vivacité et la satisfaction des contraintes dans les contextes simultanés.

    Applications pour l’administration publique et conseils pratiques

    Public Administration Applications and Practical Guidance

    Mettez en œuvre un projet pilote ciblé qui résout une tâche réelle, comme l’acheminement des demandes de service ou l’affectation du personnel de terrain. Construisez un modèle structuré composé de variables représentant le budget, les effectifs, la priorité des cas, les objectifs de niveau de service et les fenêtres temporelles. Définissez des règles conditionnelles qui reflètent les contraintes politiques et les exigences légales. Utilisez la planification automatisée pour générer des séquences d’actions viables, et appliquez la vérification de modèles avant le déploiement pour vérifier la sécurité, l’équité et la faisabilité. Exécutez un essai avec les données existantes, comparez les résultats planifiés avec les résultats réels et mesurez les gains d’efficacité réels. L’effort devrait inclure un espace clair pour les commentaires et l’itération afin de resserrer les hypothèses avant un déploiement plus large.

    Connectez le planificateur aux systèmes municipaux existants et créez un espace partagé pour que les utilisateurs explorent les plans, ajustent les paramètres et approuvent ou rejettent les actions. Utilisez un tableau de bord en temps réel pour afficher l’impact prévu sur les temps d’attente et les coûts, aidant ainsi le personnel de première ligne et les gestionnaires à prendre des décisions éclairées. Permet aux administrateurs et aux utilisateurs de première ligne de collaborer sur les contraintes, tout en assurant la confidentialité et la conformité. Cette intégration permet un flux de données transparent et une piste d’audit transparente pour les décisions, améliorant ainsi la confiance et l’adoption.

    Appliquez un raisonnement structuré et la vérification de modèles pour vérifier les propriétés critiques telles que la sécurité, la conformité aux politiques et l’équité. Construisez une couche de raisonnement qui exploite les prévisions prédictives pour détecter les goulots d’étranglement et les dépassements avant qu’ils ne se produisent. Décomposez les problèmes en modules pour le nettoyage des données, la gestion des contraintes et les vérifications des risques, assurant ainsi la maintenabilité à mesure que les systèmes évoluent. Les progrès de la planification automatisée vous permettent de comparer rapidement les plans alternatifs, augmentant ainsi l’efficacité sans sacrifier la gouvernance. Publiez des justifications claires des décisions afin que l’espace de révision reste ouvert et responsable.

    Établissez des critères d’évaluation pratiques et des références : suivez le temps de traitement moyen, le coût par cas, le taux d’erreur et la satisfaction des utilisateurs. Utilisez des données réelles provenant d’opérations pilotes pour tester la résistance des plans en cas de demandes variées, et utilisez les résultats de la vérification de modèles pour ajuster les enveloppes de risque et les procédures de repli. Assurez une formation continue pour les utilisateurs sur la façon de lire les plans et sur la façon d’intervenir lorsque les politiques doivent être mises à jour. Maintenez une feuille de route qui s’aligne sur les exigences de gouvernance tout en adoptant des cycles expérimentaux qui respectent la confidentialité des données et les préoccupations des parties prenantes, assurant ainsi des progrès constants et un impact mesurable.

    Mettez à l’échelle en commençant par un petit ensemble de services, puis en reproduisant l’approche dans tous les services avec des composants modulaires et des bibliothèques partagées. Conservez un catalogue vivant des variables pour refléter les nouvelles politiques et les contraintes fiscales, et ajustez de façon itérative le modèle à mesure que les données arrivent (ajustement). Concevez le flux de travail pour qu’il soit tourné vers l’avenir, en laissant la planification en amont éclairer l’allocation des ressources pendant les périodes de pointe. Documentez un plan de transition pratique qui met en évidence les premiers succès, les efforts requis et les échéanciers, afin que les organismes puissent adopter des pratiques de planification sans perturbation et avec des avantages clairs et concrets.

    Cartographie des problèmes politiques aux domaines de planification de l’IA dans le secteur public

    Recommandation : cadrage axé sur le contexte, assemblage du contexte d’un problème politique et traduction en un problème de planification. Représenter les objectifs et les contraintes, et assembler des combinaisons d’actions qui mènent à un résultat défini. Utilisez la planification prospective pour générer un produit qui guide le travail de programmation dans les programmes réels, et évaluez les progrès avec des scénarios de style rt-1gt, ce qui aide à comparer les résultats.

    Pour appliquer cela dans le secteur public, cartographiez les instruments politiques aux actions du domaine de la planification en utilisant un petit ensemble modulaire de leviers. Concevez ces actions pour qu’elles soient testables dans de petits projets pilotes, et évaluez les résultats tôt. Maintenez moins de biais en introduisant des contraintes supplémentaires et en permettant la généralisation dans toutes les administrations ; utilisez les données tirées de plusieurs contextes pour affiner les modèles et décider quelles interventions seront mises à l’échelle.

    Les étapes de mise en œuvre comprennent : formaliser le langage du domaine en termes de programmation, énumérer les actions avec des préconditions et des effets clairs, etEncoder les contraintes pour maintenir le risque plus bas. Exécutez un planificateur informé par la machine pour générer des plans candidats, inspectez leur travail par rapport aux objectifs énoncés et effectuez des itérations pour améliorer au fur et à mesure que de nouvelles données arrivent. Assurez-vous que les travaux proposés produisent le résultat ciblé.

    Les perspectives de geffner sur la planification en situation d’incertitude éclairent sur la façon d’équilibrer la connaissance du domaine avec la recherche automatisée, en guidant la façon de choisir des combinaisons qui se généralisent d’un contexte à l’autre, tirées de différents contextes. Le fait de relier ces connaissances aux références rt-1gt aide à garantir que les plans politiques se traduisent en programmes réalisables.

    Remarque finale : structurez les problèmes de politique de manière à ce que le domaine de la planification prenne en charge la réutilisation dans tous les programmes, ce qui permet de réduire la barrière pour les nouveaux déploiements et de réduire les frais généraux de modélisation répétée. Le résultat mappe le contexte et les objectifs aux étapes de programmation réalisables qui s’adapteront aux contraintes futures et aux exigences supplémentaires.

    Sélection et adaptation des algorithmes de planification pour les données de gouvernance

    Commencez par une approche de planification d’ordre partiel qui utilise des schémas d’action explicites et un adaptateur de données tenant compte de la gouvernance, assurant ainsi que l’application peut évoluer et préserver la provenance dans tous les ensembles de données.

    La logique de base maintient les états successeurs explicites, modélisant les préconditions, les effets et les contraintes de données afin que le planificateur puisse raisonner explicitement sur les dépendances et les réorganiser lorsque les données changent.

    Dans les contextes de gouvernance, les formats de données varient et les étiquettes peuvent être bruyantes ; représentez les connaissances de manière modulaire et permettez au planificateur de s’adapter sans remanier l’ensemble du plan, malgré les fluctuations de la qualité des données avant tout.

    Les contraintes de temps sont importantes : paramétrez les planificateurs avec des dates limites et des étapes budgétisées afin que la recherche trouve des séquences réalisables dans les fenêtres politiques, même lorsque la quantité de données de gouvernance entrantes augmente avec le temps.

    Pour s’adapter aux besoins de la gouvernance, exécutez un petit produit explicite : un service de planification avec une API claire, des règles avec version et un bouclier de confidentialité des données ; les chercheurs peuvent tester les remplacements et mesurer l’impact sur la qualité du plan dans d’autres lieux et domaines.

    En pratique, l’approche gère beaucoup de variance : elle peut traiter les contraintes artificielles comme souples ou rigides, et les contraintes représentées comme des gardes explicites que le planificateur vérifie avant de s’engager à des actions, assurant ainsi la robustesse et la traçabilité dans les flux de travail de gouvernance.

    Gestion de l’incertitude, des imprévus et des environnements dynamiques dans les plans publics

    Recommandez le déploiement d’une pile de planification modulaire tenant compte de l’incertitude avec une gestion explicite des imprévus pour les plans publics urbains, permettant une replanification rapide à mesure que le monde change.

    Structurez la pile autour de cinq modules principaux : la prévision, le raisonnement en situation d’incertitude, la cartographie aux actions, la surveillance de l’exécution et la traduction des politiques. Chaque module fonctionne sur des flux de données provenant de la détection urbaine, des commentaires du public et des dossiers administratifs, et communique par le biais d’interfaces bien définies pour maintenir l’évolutivité et l’adaptabilité. Dans les contextes urbains à enjeux élevés, cette configuration maintient la cohérence des décisions même lorsque les signaux divergent. Actuellement, les organismes publics s’appuient sur des mises à jour ponctuelles ; la pile proposée normalise ces processus et réduit la dérive entre les équipes.

    La gestion de l’incertitude utilise des arbres de scénarios ou des modèles probabilistes pour représenter les cas importants. Le système évalue chaque plan par rapport aux imprévus et choisit des actions qui maximisent une fonction d’utilité tout en respectant les contraintes de sécurité 1. Pour les plans opérationnels, maintenez la longueur de l’horizon de planification à 1 à 3 jours et rafraîchissez quotidiennement ; les stratégies à plus long terme peuvent être mises à jour hebdomadairement avec des raffinements grossiers. Cette approche est conçue pour être évolutive d’un seul district à des déploiements multi-districts.

    Pour traduire les objectifs politiques en actions, mettez en œuvre une couche de traduction qui mappe les valeurs et les objectifs en contraintes de planification et en signaux de récompense. Cette cartographie correspond aux valeurs urbaines telles que la sécurité, l’accessibilité, l’efficacité et l’équité. Utilisez les objectifs traduits pour guider les décisions de planification, puis traduisez les résultats en ordres réalisables pour les équipes de terrain et les contrôleurs automatisés. Dans les plans publics impliquant des objets importants (feux de circulation, parcs de véhicules de transport en commun, événements publics), maintenez un registre des objets et de leurs états pour soutenir un raisonnement robuste. Ce qui intéresse les planificateurs (la sécurité, la mobilité et l’équité) doit être représenté dans la fonction de valeur afin de maintenir les résultats conformes aux attentes du public. Les objectifs traduits fournissent un pont clair entre la gouvernance et l’exécution.

    • Choisir une formulation : optimisation robuste, planification contingente ou approches basées sur POMDP selon la qualité des données et les garanties.
    • Développer un pipeline de détection en temps réel avec des mesures de qualité des données et des limites de latence pour soutenir une replanification en temps opportun.
    • Intégrer les budgets de sécurité 1 et de risque ; s’assurer que les décisions évitent les violations de sécurité critiques.
    • Concevoir pour un déploiement évolutif en commençant dans un district urbain limité et en s’étendant ; réutiliser les modules dans tous les cas.
    • Évaluer à l’aide de cas réels ; mesurer la continuité du plan, la latence de la décision et la satisfaction du public.
    • Gestion du changement : intégrer progressivement aux flux de travail existants ; fournir des modules de formation au personnel pour interpréter les résultats.
    • Maintenir une cartographie et des règles de raisonnement claires : mettre à jour les imprévus au fur et à mesure que les événements se déroulent ; s’assurer que les explications sont accessibles aux décideurs.

    Les chercheurs ont démontré qu’une pile correctement conçue réduit les événements de rupture dans les exercices urbains ; la participation des parties prenantes améliore l’acceptation ; l’approche se traduit par une valeur réelle. L’architecture prend en charge le raisonnement sur des objets comme les feux de circulation, les compteurs, les capteurs et les flux de foule, et la durée du cycle de planification peut être adaptée au tempo opérationnel. La cartographie et l’évaluation par rapport aux conditions mondiales actuelles permettent de maintenir les plans alignés sur les valeurs politiques et les attentes du public.

    Intégration des contraintes juridiques, éthiques et d’équité dans les modèles de planification

    Incorporating Legal, Ethical, and Equity Constraints into Planning Models

    Encoder une couche de contraintes qui applique les règles juridiques, éthiques et d’équité dans chaque cycle de planification. Inclure des contraintes strictes pour les lois et la sécurité, avec des mises à jour en temps opportun pour refléter les nouvelles réglementations ; fixer les résultats souhaités en matière d’équité et de sécurité, et poursuivre les objectifs de sécurité et d’équité. Utiliser une interface d’audit dédiée pour montrer pourquoi les éléments ont été sélectionnés ou rejetés, permettant ainsi la responsabilisation et des pistes de décision transparentes.

    Représenter les contraintes comme un mélange de règles strictes et de pénalités douces. Pour les contraintes juridiques, appliquer les limites de vitesse, le droit de passage, les protections de la vie privée comme des limites strictes ; pour les considérations éthiques et d’équité, utiliser des contraintes douces qui pénalisent l’impact disproportionné sur les groupes protégés ou les communautés mal desservies. Cartographier ceux-ci à l’objectif du planificateur avec des pondérations qui reflètent les priorités politiques ; ce cadre optimise la sécurité et l’équité tout en restant au-dessus des seuils de risque et en justifiant les décisions. Recueillir les données des analyses pour quantifier les impacts ; ajuster les pondérations à mesure que les consignes juridiques évoluent. Lorsque les contraintes sont violées, enregistrer les actions prises et passer à des alternatives conformes.

    Données et évaluation : utiliser des données en temps opportun provenant des analyses de la circulation, des flux de capteurs et des commentaires des utilisateurs pour maintenir les modèles précis et appliqués en pratique. Valider la généralisation dans tous les domaines en exécutant divers scénarios ; examiner les interactions entre les contraintes (p. ex., sécurité par rapport à la confidentialité). Atténuer la mauvaise qualité des données avec la validation croisée et des sources redondantes. Mettre en œuvre des simulations et des projets pilotes réels pour tester les récompenses et les pénalités, en s’assurant que les décisions de conduite autonome restent sûres et acceptables ; s’assurer que les contraintes de temps ne dégradent pas l’expérience utilisateur. Voici une ligne directrice pratique : commencer par les contraintes de base et étendre progressivement à mesure que les mises en œuvre mûrissent.

    Modèles réalisables pour la gestion des interactions : lorsque les contraintes sont en conflit, privilégier les priorités en matière de sécurité et d’équité ; utiliser une optimisation lexicographique ou contrainte pour équilibrer les objectifs. Dans les déploiements à conduite autonome, toujours privilégier les exigences légales ; si un itinéraire souhaité viole les contraintes d’équité, réacheminer vers une solution de rechange conforme, même si cela ajoute du temps. Le système gère les entrées inattendues en déclenchant des plans de repli sûrs et en enregistrant les actions prises à des fins de responsabilisation. Suivre les écarts et fournir des explications aux opérateurs à des fins de responsabilisation. Appliquer ces modèles à d’autres domaines tels que la logistique, la planification urbaine et les interventions d’urgence afin d’assurer une large applicabilité.

    Feuille de route de la mise en œuvre pour les équipes : concevoir une architecture à trois couches : spécification des politiques, solutionneur de contraintes et harnais d’évaluation. Utiliser des mises en œuvre modulaires qui peuvent être permutées au fur et à mesure de l’évolution des lois ou des directives en matière d’éthique ; tirer parti des représentations communes pour soutenir la généralisation dans tous les domaines et toutes les analyses, permettant ainsi des progrès continus dans la planification responsable de l’IA. Cette approche maintient l’accent sur les décisions opportunes et précises qui traitent les récompenses et les coûts avec transparence, de sorte que les domaines de la conduite autonome, de la circulation et des services restent alignés sur les objectifs politiques.

    Mesurer l’impact et la responsabilisation des initiatives publiques basées sur la planification

    Publier un tableau de bord d’impact trimestriel qui rend compte de la portée, des coûts et des résultats, ancré dans des bases de données et rafraîchi avec l’automatisation. Commencer par définir deux tableaux de bord, en termes de portée et d’équité, avec des mesures comme la participation et l’accessibilité des services : mesures de la production (portée, participation) et mesures des résultats (changements dans la prestation des services, équité urbaine). Utiliser une carte routière partagée des services et des quartiers pour visualiser la couverture, et fixer des limites pour un rendement acceptable. Ces mesures permettent des corrections de cap proactives et ne peuvent pas s’appuyer uniquement sur l’intuition, soutiennent une responsabilisation transparente. Utiliser des ensembles de valeurs cibles et une comparaison à une référence pour cerner les changements inattendus, en particulier lorsque les besoins de la population se déplacent entre les districts.

    Modéliser les flux de travail avec des graphes de Petri et des filets d’inspiration nurix pour quantifier la dynamique. Pour chaque instance, saisir les mouvements, les positions et le flux dans les petites équipes urbaines ; calculer les ensembles réalisables de tâches et de ressources ; utiliser les nombres entiers pour les participants, les appareils et les étapes de temps. Élaborer des formules pour estimer l’impact dans divers scénarios et adapter le plan lorsque de nouvelles données arrivent ; les graphes visualisent les progrès et mettent en évidence les changements de couverture. Cette approche offre un avantage en rendant explicites les hypothèses implicites et en clarifiant où l’automatisation peut réduire le travail répétitif.

    Assurer la responsabilisation grâce à une gouvernance des données transparente et à des mesures partagées. Créer une architecture de données légère qui relie les plans de projet aux résultats, avec une propriété claire et des pistes d’audit. Publier des tableaux de bord pour les parties prenantes et les conseils de contrôle ; utiliser des hypothèses transparentes et des analyses de sensibilité pour montrer les limites des résultats. En pratique, la provenance des données et les audits réguliers maintiennent la crédibilité de ces initiatives, tandis que les rapports axés sur les objectifs aident les urbanistes à décider où mettre à l’échelle ou à interrompre les efforts, et à documenter le type d’initiative aux fins d’une interprétation appropriée.

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation