AI EngineeringDecember 10, 202511 min read
    SC
    Sarah Chen

    AAAI 2022 Tutorial - Teoria i praktyka planowania w AI — Kluczowe koncepcje, metody i wnioski

    AAAI 2022 Tutorial - Teoria i praktyka planowania w AI — Kluczowe koncepcje, metody i wnioski

    AAAI 2022 Tutorial: AI Planning Theory and Practice — Key Concepts, Methods, and Takeaways

    Zacznij od konkretnej rekomendacji: zmapuj swoje zadanie planowania do zwartego procesu i uruchom odtwarzalny eksperyment. Wybierz główny przypadek użycia, taki jak zarządzanie ruchem drogowym lub planowanie logistyczne, i przedstaw go jako liniowy ciąg działań, który prowadzi od stanu początkowego do celu. Utrzymuj domenę jako znaną i niezależną od szczegółów platformy, aby je przetestować za pomocą wielu planistów. Zbuduj mały poligon testowy z 2–3 agentami, aby obserwować interakcje, mierzyć czas wykonania i śledzić kilka transakcji jako punkty odniesienia.

    Od teorii do praktyki, zidentyfikuj trzy filary: przeszukiwanie przestrzeni stanów, grafy planowania i metody oparte na ograniczeniach. W praktyce połącz analizy z heurystycznym przewodnictwem, aby poruszać się po dużych przestrzeniach wyszukiwania i pomóc w szybszym podejmowaniu solidnych decyzji. Zastosuj sprawdzanie modelu i lekką weryfikację, aby ujawnić zakleszczenia, konflikty zasobów lub naruszone ograniczenia przed wdrożeniem; one przydatne do szybkiej iteracji.

    Trzy praktyczne osie pomagają w porównywaniu podejść: reprezentacja (podobna do STRIPS lub warianty PDDL), obsługa współbieżności (niezależne działania vs. współdzielone zasoby) i ocena (punkty odniesienia, metryki i odtwarzalne przebiegi). Wybierz reprezentację, która utrzymuje jasne warunki wstępne i efekty, aby planista mógł rozumować o zależnościach procesowych. Użyj heurystycznego przewodnictwa do przycinania gałęzi i testuj na ustalonym zestawie zadań z takim samym limitem czasu, aby umożliwić uczciwe porównania.

    Kluczowe wnioski obejmują modułowe kodowania, które przenoszą się między domenami, wspólny pakiet benchmarków z jasnymi liniami bazowymi oraz dokumentację założeń. Użyj symulacji, aby przetestować planistów pod obciążeniem, uruchom analizy, aby porównać wyniki, i rejestruj czas, pamięć i długość planu. Połącz weryfikację ze sprawdzaniem modelu, aby potwierdzić aktywność i spełnienie ograniczeń w ustawieniach współbieżnych.

    Zastosowania w administracji publicznej i wskazówki praktyczne

    Public Administration Applications and Practical Guidance

    Wdróż ukierunkowany pilot, który rozwiązuje rzeczywiste zadanie, takie jak kierowanie zapytań o usługi lub przydzielanie personelu terenowego. Zbuduj ustrukturyzowany model składający się ze zmiennych reprezentujących budżet, liczbę pracowników, priorytet sprawy, cele dotyczące poziomu usług i przedziały czasowe. Zdefiniuj reguły warunkowe, które odzwierciedlają ograniczenia polityki i wymogi prawne. Wykorzystaj automatyczne planowanie do generowania wykonalnych sekwencji działań i zastosuj sprawdzanie modelu przed wdrożeniem, aby zweryfikować bezpieczeństwo, uczciwość i wykonalność. Przeprowadź test z istniejącymi danymi, porównaj zaplanowane wyniki z rzeczywistymi i zmierz rzeczywisty wzrost wydajności. Wysiłek powinien obejmować jasne miejsce na informacje zwrotne i iteracje, aby zaostrzyć założenia przed szerszym wdrożeniem.

    Połącz planistę z istniejącymi systemami miejskimi i utwórz wspólną przestrzeń dla użytkowników do przeglądania planów, dostosowywania parametrów oraz zatwierdzania lub odrzucania działań. Użyj pulpitu nawigacyjnego w czasie rzeczywistym, aby pokazać przewidywany wpływ na czasy oczekiwania i koszty, pomagając pracownikom pierwszej linii i menedżerom podejmować świadome decyzje. Pozwól administratorom i użytkownikom pierwszej linii współpracować w zakresie ograniczeń, zapewniając jednocześnie prywatność i zgodność. Ta integracja umożliwia bezproblemowy przepływ danych i przejrzysty ślad audytu decyzji, poprawiając zaufanie i adopcję.

    Zastosuj ustrukturyzowane rozumowanie i sprawdzanie modelu, aby zweryfikować krytyczne właściwości, takie jak bezpieczeństwo, zgodność z polityką i uczciwość. Zbuduj warstwę rozumowania, która wykorzystuje prognozy predykcyjne do wykrywania wąskich gardeł i przekroczeń, zanim wystąpią. Rozkładaj problemy na moduły do czyszczenia danych, obsługi ograniczeń i kontroli ryzyka, zapewniając możliwość konserwacji w miarę ewolucji systemów. Postępy w automatycznym planowaniu umożliwiają szybkie porównywanie alternatywnych planów, zwiększając wydajność bez poświęcania zarządzania. Publikuj jasne uzasadnienia decyzji, aby przestrzeń do przeglądu pozostała otwarta i odpowiedzialna.

    Ustal praktyczne kryteria oceny i punkty odniesienia: śledź średni czas obsługi, koszt na sprawę, wskaźnik błędów i satysfakcję użytkowników. Użyj rzeczywistych danych z operacji pilotażowych, aby przetestować plany pod obciążeniem przy zmiennym popycie, i użyj wyników sprawdzania modelu do dostosowania kopert ryzyka i procedur awaryjnych. Zapewnij bieżące szkolenia dla użytkowników na temat interpretacji planów i interweniowania w przypadku potrzeby aktualizacji polityki. Utrzymuj mapę drogową, która jest zgodna z wymogami zarządzania, jednocześnie obejmując cykle eksperymentalne, które szanują prywatność danych i obawy interesariuszy, zapewniając stały postęp i wymierny wpływ.

    Skaluj, zaczynając od małego zestawu usług, a następnie replikując podejście w różnych działach za pomocą modułowych komponentów i współdzielonych bibliotek. Utrzymuj aktualny katalog zmiennych, aby odzwierciedlał nowe zasady i ograniczenia fiskalne, i iteracyjnie dostosowuj model w miarę napływu danych (dostosowując). Zaprojektuj przepływ pracy w sposób przyszłościowy, pozwalając planowaniu z wyprzedzeniem informować o alokacji zasobów w okresach szczytowych. Udokumentuj praktyczny plan przejścia, który podkreśla wczesne sukcesy, wymagany wysiłek i harmonogramy, aby agencje mogły przyjąć praktyki planowania bez zakłóceń iz jasnymi, rzeczywistymi korzyściami.

    Mapowanie problemów politycznych na domeny planowania AI w sektorze publicznym

    Rekomendacja: Kadrowanie oparte na kontekście, gromadzenie kontekstu problemu politycznego i tłumaczenie go na problem planowania. Reprezentuj cele i ograniczenia oraz zestawiaj kombinacje działań, które prowadzą do zdefiniowanego wyniku. Użyj planowania do przodu, aby wygenerować produkt, który kieruje pracami programistycznymi w rzeczywistych programach, i porównuj postępy ze scenariuszami w stylu rt-1gt, co pomaga porównać wyniki.

    Aby zastosować to w sektorze publicznym, zmapuj instrumenty polityczne na działania w domenie planowania, używając małego, modułowego zestawu dźwigni. Zaprojektuj te działania tak, aby można je było przetestować w małych pilotażach i oceniaj wyniki wcześnie. Utrzymuj mniejsze obciążenie, wprowadzając dodatkowe ograniczenia i umożliwiając uogólnienie w różnych jurysdykcjach; użyj danych pobranych z wielu kontekstów, aby udoskonalić modele i zdecydować, które interwencje zostaną przeskalowane.

    Etapy wdrażania obejmują: sformalizuj język domeny w kategoriach programowania, wylicz działania z jasnymi warunkami wstępnymi i efektami oraz zakoduj ograniczenia, aby utrzymać ryzyko na niższym poziomie. Uruchom planistę poinformowanego przez maszynę, aby wygenerować plany kandydatów, sprawdź ich pracę względem określonych celów i iteruj, aby ulepszyć w miarę napływu nowych danych. Upewnij się, że proponowane prace przynoszą zamierzony wynik.

    Perspektywy geffnera na planowanie w warunkach niepewności informują o tym, jak zrównoważyć wiedzę domenową z automatycznym wyszukiwaniem, dając wskazówki, jak wybierać kombinacje, które uogólniają się w różnych kontekstach zaczerpniętych z różnych ustawień. Połączenie tych spostrzeżeń z benchmarkami rt-1gt pomaga zapewnić, że plany polityczne przekładają się na możliwe do wdrożenia programy.

    Uwaga końcowa: ustrukturyzuj problemy polityczne tak, aby domena planowania wspierała ponowne wykorzystanie w różnych programach, umożliwiając niższą barierę dla nowych wdrożeń i zmniejszając narzut związany z powtarzającym się modelowaniem. Wynik mapuje kontekst i cele na kroki programowania możliwe do podjęcia, które dostosują się do przyszłych ograniczeń i dodatkowych wymagań.

    Wybór i dostosowanie algorytmów planowania do danych dotyczących zarządzania

    Zacznij od podejścia planowania częściowego porządku, które wykorzystuje jawne schematy działań i adapter danych uwzględniający zarządzanie, zapewniając, że aplikacja może się skalować i zachowywać pochodzenie w różnych zestawach danych.

    Podstawowa logika utrzymuje jawne stany następników, modelując warunki wstępne, efekty i ograniczenia danych, dzięki czemu planista może w sposób jawny rozumować o zależnościach i zmieniać ich kolejność, gdy dane się zmieniają.

    W kontekstach zarządzania formaty danych różnią się, a etykiety mogą być zaszumione; reprezentuj wiedzę w sposób modułowy i pozwól planiście na adaptację bez przerabiania całego planu, pomimo wahań jakości danych przede wszystkim.

    Ograniczenia czasowe mają znaczenie: parametryzuj planistów z terminami i budżetowanymi krokami, aby wyszukiwanie znajdowało wykonalne sekwencje w oknach polityki, nawet gdy ilość przychodzących danych dotyczących zarządzania rośnie w czasie.

    Aby dostosować się do potrzeb zarządzania, uruchom mały, jawny produkt: usługę planowania z jasnym API, wersjonowanymi regułami i tarczą prywatności danych; naukowcy mogą testować zamienniki i mierzyć wpływ na jakość planu w innych miejscach i domenach.

    W praktyce podejście radzi sobie z dużą zmiennością: może traktować ograniczenia sztuczne jako miękkie lub twarde, a ograniczenia reprezentowane jako jawne strażniki, które planista sprawdza przed podjęciem działań, zapewniając solidność i identyfikowalność w przepływach pracy zarządzania.

    Obsługa niepewności, nieprzewidzianych zdarzeń i dynamicznych środowisk w planach publicznych

    Zaleca się wdrożenie modułowego stosu planowania uwzględniającego niepewność z jawną obsługą nieprzewidzianych zdarzeń dla miejskich planów publicznych, umożliwiając szybkie ponowne planowanie w miarę zmian na świecie.

    Ustrukturyzuj stos wokół pięciu podstawowych modułów: prognozowanie, wnioskowanie w warunkach niepewności, mapowanie na działania, monitorowanie wykonania i tłumaczenie polityki. Każdy moduł działa na strumieniach danych z miejskiego wykrywania, danych wejściowych od społeczeństwa i ewidencji administracyjnych i komunikuje się za pomocą dobrze zdefiniowanych interfejsów, aby zachować skalowalność i adaptowalność. W miejskich kontekstach o wysokich stawkach ta konfiguracja zapewnia spójność decyzji, nawet jeśli sygnały są sprzeczne. Obecnie agencje publiczne polegają na aktualizacjach ad hoc; proponowany stos standaryzuje te procesy i zmniejsza rozbieżności między zespołami.

    Obsługa niepewności wykorzystuje drzewa scenariuszy lub modele probabilistyczne do reprezentowania znaczących przypadków. System ocenia każdy plan pod kątem nieprzewidzianych zdarzeń i wybiera działania, które maksymalizują funkcję użyteczności, przestrzegając jednocześnie ograniczeń 1-bezpieczeństwa. W przypadku planów operacyjnych utrzymuj długość horyzontu planowania na poziomie od 1 do 3 dni i odświeżaj codziennie; strategie długoterminowe można aktualizować co tydzień z grubszymi udoskonaleniami. To podejście jest zaprojektowane tak, aby można je było skalować od jednej dzielnicy do wdrożeń w wielu dzielnicach.

    Aby przełożyć cele polityki na działania, wdróż warstwę tłumaczenia, która mapuje wartości i cele na ograniczenia planowania i sygnały nagrody. To mapowanie odpowiada miejskim wartościom, takim jak bezpieczeństwo, dostępność, wydajność i sprawiedliwość. Użyj przetłumaczonych celów do kierowania decyzjami dotyczącymi planowania, a następnie przełóż wyniki z powrotem na możliwe do podjęcia rozkazy dla zespołów terenowych i automatycznych kontrolerów. W przypadku planów publicznych obejmujących znaczące obiekty (sygnalizacja świetlna, floty transportu publicznego, wydarzenia publiczne) prowadź rejestr obiektów i ich stanów, aby wspierać solidne wnioskowanie. To, na czym zależy planistom - bezpieczeństwo, mobilność i sprawiedliwość - musi być reprezentowane w funkcji wartości, aby utrzymać wyniki zgodne z oczekiwaniami społecznymi. Przetłumaczone cele zapewniają wyraźny pomost między zarządzaniem a wykonaniem.

    • Wybierz formułę: solidną optymalizację, planowanie nieprzewidzianych zdarzeń lub podejścia oparte na POMDP w zależności od jakości danych i gwarancji.
    • Opracuj rurociąg wykrywania w czasie rzeczywistym z metrykami jakości danych i ograniczeniami opóźnień, aby wspierać terminowe ponowne planowanie.
    • Włącz 1-bezpieczeństwo i budżety ryzyka; upewnij się, że decyzje unikają krytycznych naruszeń bezpieczeństwa.
    • Zaprojektuj skalowalne wdrożenie, zaczynając w ograniczonej dzielnicy miejskiej i rozszerzając ją; używaj ponownie modułów w różnych przypadkach.
    • Oceniaj za pomocą rzeczywistych przypadków; mierz ciągłość planu, opóźnienie decyzji i satysfakcję społeczną.
    • Zarządzanie zmianami: integruj stopniowo z istniejącymi przepływami pracy; zapewnij moduły szkoleniowe dla personelu, aby interpretować wyniki.
    • Utrzymuj jasne mapowanie i reguły wnioskowania: aktualizuj nieprzewidziane zdarzenia w miarę rozwoju wydarzeń; upewnij się, że wyjaśnienia są dostępne dla osób podejmujących decyzje.

    Naukowcy wykazali, że właściwie zaprojektowany stos zmniejsza liczbę zdarzeń przełomowych w miejskich ćwiczeniach; zaangażowanie interesariuszy poprawia akceptację; podejście przekłada się na rzeczywistą wartość. Architektura obsługuje wnioskowanie o obiektach, takich jak sygnalizacja świetlna, liczniki, czujniki i przepływy tłumów, a długość cyklu planowania można dostroić do tempa operacyjnego. Mapowanie i ocena w stosunku do aktualnych warunków światowych pomaga utrzymać plany zgodne z wartościami polityki i oczekiwaniami społecznymi.

    Włączanie ograniczeń prawnych, etycznych i dotyczących równości do modeli planowania

    Incorporating Legal, Ethical, and Equity Constraints into Planning Models

    Zakoduj warstwę ograniczeń, która egzekwuje reguły prawne, etyczne i dotyczące równości w każdym cyklu planowania. Dołącz twarde ograniczenia dotyczące prawa i bezpieczeństwa, z terminowymi aktualizacjami odzwierciedlającymi nowe przepisy; ustal pożądane wyniki dotyczące uczciwości i bezpieczeństwa, a także dąż do celów w zakresie bezpieczeństwa i uczciwości. Użyj dedykowanego interfejsu audytu, aby pokazać, dlaczego elementy zostały wybrane lub odrzucone, umożliwiając odpowiedzialność i przejrzyste ścieżki decyzyjne.

    Reprezentuj ograniczenia jako mieszankę twardych reguł i miękkich kar. W przypadku ograniczeń prawnych egzekwuj ograniczenia prędkości, pierwszeństwo przejazdu, ochronę prywatności jako twarde granice; w przypadku rozważań etycznych i dotyczących równości stosuj miękkie ograniczenia, które karzą nieproporcjonalny wpływ na grupy chronione lub niedostatecznie obsługiwane społeczności. Zmapuj je na cel planisty z wagami odzwierciedlającymi priorytety polityki; ta struktura optymalizuje bezpieczeństwo i równość, pozostając powyżej progów ryzyka i uzasadniając decyzje. Zbieraj dane z analiz, aby określić ilościowo wpływ; dostosuj wagi w miarę ewolucji wytycznych prawnych. W przypadku naruszenia ograniczeń rejestruj podjęte działania i przechodź na alternatywy zgodne z przepisami.

    Dane i ocena: Użyj aktualnych danych z analiz ruchu drogowego, kanałów czujników i opinii użytkowników, aby modele były dokładne i stosowane w praktyce. Sprawdź poprawność uogólnienia w różnych domenach, uruchamiając różne scenariusze; zbadaj interakcje między ograniczeniami (np. bezpieczeństwo a prywatność). Zminimalizuj słabą jakość danych za pomocą walidacji krzyżowej i nadmiarowych źródeł. Wdróż symulacje i rzeczywiste piloty, aby przetestować nagrody i kary, zapewniając, że samodzielne decyzje pozostają bezpieczne i akceptowalne; upewnij się, że ograniczenia czasowe nie pogarszają komfortu użytkowania. Oto praktyczna wskazówka: zacznij od podstawowych ograniczeń i rozwijaj stopniowo w miarę dojrzewania wdrożeń.

    Działania możliwe do podjęcia w zakresie obsługi interakcji: gdy ograniczenia są sprzeczne, preferuj priorytety bezpieczeństwa i równości; użyj optymalizacji leksykograficznej lub ograniczonej, aby zrównoważyć cele. W przypadku samodzielnych wdrożeń zawsze priorytetowo traktuj wymogi prawne; jeśli żądana trasa narusza ograniczenia dotyczące równości, zmień trasę na alternatywę zgodną, nawet jeśli wydłuży to czas. System obsługuje nieoczekiwane dane wejściowe, uruchamiając bezpieczne plany awaryjne i rejestrując podjęte działania w celu rozliczalności. Śledź odchylenia i przekazuj operatorom wyjaśnienia w celu rozliczalności. Zastosuj te wzorce do innych domen, takich jak logistyka, planowanie miejskie i reagowanie w sytuacjach awaryjnych, aby zapewnić szerokie zastosowanie.

    Mapa drogowa wdrożenia dla zespołów: zaprojektuj architekturę trójwarstwową - specyfikację zasad, solver ograniczeń i uprząż do oceny. Użyj modułowych wdrożeń, które można zamieniać w miarę ewolucji prawa lub wytycznych etycznych; wykorzystaj wspólne reprezentacje, aby wspierać uogólnienie w różnych domenach i analizach, umożliwiając dalszy postęp w odpowiedzialnym planowaniu AI. To podejście koncentruje się na terminowych, dokładnych decyzjach, które traktują nagrody i koszty w sposób przejrzysty, dzięki czemu samodzielne domeny, domeny ruchu drogowego i domeny usług pozostają zgodne z celami polityki.

    Pomiar wpływu i odpowiedzialności publicznych inicjatyw opartych na planowaniu

    Opublikuj kwartalny pulpit nawigacyjny dotyczący wpływu, który raportuje zasięg, koszty i wyniki, zakotwiczony w bazach danych i odświeżany za pomocą automatyzacji. Zacznij od zdefiniowania dwóch kart wyników, pod względem zasięgu i równości, z metrykami, takimi jak uczestnictwo i dostępność usług: miary wyjściowe (zasięg, uczestnictwo) i miary wyników (zmiany w świadczeniu usług, równość miejska). Użyj wspólnej mapy tras usług i dzielnic, aby wizualizować zasięg, i ustaw granice dla akceptowalnej wydajności. Te metryki umożliwiają proaktywne korekty kursu i nie mogą polegać wyłącznie na intuicji, wspierają przejrzystą odpowiedzialność. Użyj zestawów wartości docelowych i porównania z linią bazową, aby zidentyfikować nieoczekiwane zmiany, zwłaszcza gdy potrzeby populacji przemieszczają się między dzielnicami.

    Modeluj przepływy pracy za pomocą grafów Petriego i sieci inspirowanych nurix w celu określenia ilościowego dynamiki. Dla każdego wystąpienia przechwytuj ruchy, pozycje i przepływ w małych miejskich zespołach; oblicz osiągalne zbiory zadań i zasobów; użyj liczb całkowitych dla uczestników, urządzeń i kroków czasowych. Opracuj formuły do oszacowania wpływu w różnych scenariuszach i dostosuj plan, gdy pojawią się nowe dane; wykresy wizualizują postęp i podkreślają zmiany w zasięgu. To podejście zapewnia przewagę, czyniąc ukryte założenia jawnymi i wyjaśniając, gdzie automatyzacja może zmniejszyć powtarzalną pracę.

    Zapewnij odpowiedzialność poprzez przejrzyste zarządzanie danymi i udostępnione metryki. Stwórz lekką architekturę danych, która łączy plany projektów z wynikami, z jasną własnością i śladami audytu. Publikuj pulpity nawigacyjne dla interesariuszy i rad kontroli; użyj przezroczystych założeń i analiz wrażliwości, aby pokazać granice wyników. W praktyce pochodzenie danych i regularne audyty sprawiają, że inicjatywy te są wiarygodne, a raporty oparte na celach pomagają planistom miejskim decydować, gdzie skalować lub wstrzymywać wysiłki, oraz dokumentować rodzaj inicjatywy w celu właściwej interpretacji.

    Powiązane artykuły

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation