AAAI 2022 튜토리얼 - AI 계획 이론과 실천 — 주요 개념, 방법, 그리고 요점

구체적인 추천으로 시작하세요: 계획 작업을 간결한 프로세스로 매핑하고 재현 가능한 실험을 실행하세요. 교통 관리나 물류 스케줄링과 같은 주요 사용 사례를 선택하고, 이를 초기 상태에서 목표로 이동하는 선형 작업 순서로 구성하세요. 도메인을 알려진 상태로 유지하고 플랫폼 세부 사항과 독립적으로 하여 그들은 여러 계획자로 테스트되도록 하세요. 2–3개의 에이전트로 구성된 작은 테스트 베드를 구축하여 상호작용을 관찰하고, 실행 시간을 측정하며, 몇 가지 트랜잭션을 벤치마크로 추적하세요.
이론에서 실천으로, 세 가지 기둥을 식별하세요: 상태 공간 탐색, 계획 그래프, 제약 기반 방법. 실천에서, 대형 검색 공간을 탐색하고 견고한 결정을 더 빠르게 내리는 데 분석을 휴리스틱 지침과 혼합하세요. 배포 전에 데드락, 자원 충돌 또는 위반된 제약을 드러내기 위해 모델 검사와 경량 검증을 적용하세요; 그들은 빠른 반복에 유용합니다.
접근 방식을 비교하는 데 세 가지 실용적인 축이 도움이 됩니다: 표현(STRIPS-like 또는 PDDL 변형), 동시성 처리(독립 작업 vs 공유 자원), 평가(벤치마크, 메트릭 및 재현 가능한 실행). 전제 조건과 효과를 명확하게 유지하는 표현을 선택하여 계획자가 프로세스 종속성에 대해 추론할 수 있도록 하세요. 가지를 전지하는 데 휴리스틱 지침을 사용하고, 공정한 비교를 가능하게 하기 위해 동일한 시간 제한으로 고정된 작업 세트에서 테스트하세요.
주요 요점에는 도메인 간 이동 가능한 모듈러 인코딩, 명확한 베이스라인을 가진 공유 벤치마크 스위트, 가정 문서화가 포함됩니다. 시뮬레이션을 사용하여 계획자를 스트레스 테스트하고, 결과를 비교하기 위해 분석을 실행하며, 타이밍, 메모리 및 계획 길이를 캡처하세요. 동시 설정에서 활성과 제약 만족을 확인하기 위해 검증을 모델 검사와 쌍으로 하세요.
공공 행정 응용 및 실용 지침

서비스 요청 라우팅이나 현장 인력 할당과 같은 실제 작업을 해결하는 집중된 파일럿을 구현하세요. 예산, 인원 수, 사례 우선순위, 서비스 수준 목표 및 시간 창을 나타내는 변수로 구성된 구조화된 모델을 구축하세요. 정책 제약과 법적 요구사항을 반영하는 조건부 규칙을 정의하세요. 실행 가능한 작업 순서를 생성하기 위해 자동 계획을 사용하고, 배포 전에 안전성, 공정성 및 실현 가능성을 검증하기 위해 모델 검사를 적용하세요. 기존 데이터로 시험을 실행하고, 계획된 결과를 실제 결과와 비교하며, 실제 효율성 향상을 측정하세요. 노력에는 더 넓은 배포 전에 가정을 강화하기 위한 피드백 및 반복을 위한 명확한 공간이 포함되어야 합니다.
계획자를 기존 시립 시스템에 연결하고, 사용자가 계획을 탐색하고, 매개변수를 조정하며, 작업을 승인하거나 거부할 수 있는 공유 공간을 만드세요. 대기 시간과 비용에 대한 예측 영향을 보여주는 실시간 대시보드를 사용하여 프론트라인 직원과 관리자가 정보에 기반한 결정을 내릴 수 있도록 하세요. 관리자와 프론트라인 사용자가 제약에 대해 협력할 수 있게 하면서 프라이버시와 규정 준수를 보장하세요. 이 통합은 원활한 데이터 흐름과 결정에 대한 투명한 감사 추적을 가능하게 하여 신뢰와 채택을 개선합니다.
안전성, 정책 준수 및 공정성과 같은 중요한 속성을 검증하기 위해 구조화된 추론과 모델 검사를 적용하세요. 병목 현상과 초과를 발생하기 전에 감지하기 위해 예측 예측을 활용하는 추론 계층을 구축하세요. 시스템이 진화함에 따라 유지 가능성을 보장하기 위해 데이터 세정, 제약 처리 및 위험 검사를 위한 모듈로 문제를 분해하세요. 자동 계획의 발전은 거버넌스를 희생하지 않으면서 효율성을 증가시켜 대안 계획을 빠르게 비교할 수 있게 합니다. 검토 공간이 개방적이고 책임지도록 명확한 결정 근거를 게시하세요.
실용적인 평가 기준과 벤치마크를 수립하세요: 평균 처리 시간, 사례당 비용, 오류율 및 사용자 만족도를 추적하세요. 다양한 수요 하에서 계획을 스트레스 테스트하기 위해 파일럿 운영의 실제 데이터를 사용하고, 모델 검사 결과를 사용하여 위험 범위와 대체 절차를 조정하세요. 정책이 업데이트될 때 개입하는 방법과 계획을 읽는 방법에 대한 사용자 교육을 지속적으로 보장하세요. 데이터 프라이버시와 이해관계자 우려를 존중하는 실험 주기를 수용하면서 거버넌스 요구사항과 일치하는 로드맵을 유지하여 안정적인 진행과 측정 가능한 영향을 보장하세요.
작은 서비스 세트로 시작하여 모듈러 구성 요소와 공유 라이브러리를 사용하여 부서 간 접근 방식을 복제함으로써 확장하세요. 새로운 정책과 재정 제약을 반영하기 위해 변수의 살아있는 카탈로그를 유지하고, 데이터가 도착함에 따라 모델을 반복적으로 조정하세요(조정). 워크플로를 미래 지향적으로 설계하여 피크 기간 동안 자원 할당을 안내하는 선행 계획을 허용하세요. 초기 승리, 필요한 노력 및 타임라인을 강조하는 실용적인 전환 계획을 문서화하여 기관이 중단 없이 계획 관행을 채택하고 명확하고 실제적인 이점을 얻을 수 있도록 하세요.
공공 부문에서 정책 문제를 AI 계획 도메인으로 매핑하기
추천: 맥락 중심 프레임, 정책 문제의 맥락을 조합하고 이를 계획 문제로 번역하세요. 목표와 제약을 표현하고, 정의된 결과로 이끄는 작업 조합을 조립하세요. 실제 프로그램에서 프로그래밍 작업을 안내하는 제품을 생성하기 위해 순방향 계획을 사용하고, rt-1gt 스타일 시나리오로 진행 상황을 벤치마크하여 결과를 비교하는 데 도움이 됩니다.
공공 부문에 적용하기 위해, 작은 모듈러 레버 세트를 사용하여 정책 도구를 계획 도메인 작업으로 매핑하세요. 이러한 작업을 작은 파일럿에서 테스트 가능하게 설계하고, 결과를 조기에 평가하세요. 여러 관할권 간 일반화를 허용하고 추가 제약을 도입하여 편향을 줄이세요; 모델을 세밀하게 하고 확장할 개입을 결정하기 위해 여러 맥락에서 가져온 데이터를 사용하세요.
구현 단계에는: 프로그래밍 용어로 도메인 언어를 형식화하고, 명확한 전제 조건과 효과를 가진 작업을 열거하며, 위험을 낮추기 위해 제약을 인코딩하는 것이 포함됩니다. 후보 계획을 생성하기 위해 기계 정보 계획자를 실행하고, 명시된 목표에 대해 작업을 검사하며, 새로운 데이터가 도착함에 따라 개선을 위해 반복하세요. 제안된 작업이 목표 결과를 제공하도록 보장하세요.
불확실성 하 계획에 대한 geffner의 관점이 도메인 지식과 자동 검색의 균형을 조정하는 방법을 안내하며, 다른 설정에서 가져온 맥락 간 일반화할 조합을 선택하는 데 지침을 제공합니다. 이러한 통찰을 rt-1gt 벤치마크에 연결하면 정책 계획이 구현 가능한 프로그램으로 번역되도록 보장합니다.
최종 노트: 계획 도메인이 프로그램 간 재사용을 지원하도록 정책 문제를 구조화하여 새로운 배포에 대한 장벽을 낮추고 반복 모델링의 오버헤드를 줄입니다. 결과는 맥락과 목표를 미래 제약과 추가 요구사항에 적응할 수 있는 실행 가능한 프로그래밍 단계로 매핑합니다.
거버넌스 데이터에 대한 계획 알고리즘 선택 및 적응
명시적 작업 스키마와 거버넌스 인식 데이터 어댑터를 사용하는 부분 순서 계획 접근으로 시작하여, 애플리케이션이 데이터 세트 간 확장되고 출처를 보존할 수 있도록 하세요.
핵심 로직은 후속 상태를 명시적으로 유지하며, 전제 조건, 효과 및 데이터 제약을 모델링하여 계획자가 종속성에 대해 명시적으로 추론하고 데이터가 변경될 때 이를 재정렬할 수 있도록 합니다.
거버넌스 맥락에서 데이터 형식은 다양하고 레이블은 노이즈가 있을 수 있습니다; 지식을 모듈러 방식으로 표현하고 데이터 품질 변동에도 불구하고 전체 계획을 재작업하지 않고 계획자가 적응할 수 있도록 하세요.
타이밍 제약이 중요합니다: 정책 창 내에서 실행 가능한 순서를 찾도록 계획자를 마감일과 예산 단계로 매개변수화하여, 들어오는 거버넌스 데이터의 양이 시간에 따라 증가하더라도요.
거버넌스 요구에 적응하기 위해, 명확한 API, 버전 관리 규칙 및 데이터 프라이버시 보호를 가진 작은 명시적 제품을 실행하세요: 계획 서비스; 연구자들은 대체를 테스트하고 다른 장소와 도메인에서 계획 품질에 대한 영향을 측정할 수 있습니다.
실천에서, 접근 방식은 많은 변동을 처리합니다: 인공 제약을 소프트 또는 하드로 취급할 수 있으며, 계획자가 작업에 커밋하기 전에 확인하는 명시적 가드로 표현된 제약; 거버넌스 워크플로에서 견고성과 추적성을 보장합니다.
공공 계획에서 불확실성, 비상 사태 및 동적 환경 처리
도시 공공 계획을 위한 명시적 비상 사태 처리와 함께 모듈러 불확실성 인식 계획 스택을 배포하여 세상이 변경됨에 따라 빠른 재계획을 가능하게 하세요.
스택을 다섯 가지 핵심 모듈 주위에 구조화하세요: 예측, 불확실성 하 추론, 작업 매핑, 실행 모니터링 및 정책 번역. 각 모듈은 도시 감지, 공공 입력 및 행정 기록의 데이터 스트림에서 작동하며, 확장성과 적응성을 유지하기 위해 잘 정의된 인터페이스를 통해 통신합니다. 고위험 도시 맥락에서 이 설정은 신호가 불일치할 때 결정의 일관성을 유지합니다. 현재 공공 기관은 임시 업데이트에 의존합니다; 제안된 스택은 이러한 프로세스를 표준화하고 팀 간 드리프트를 줄입니다.
불확실성 처리는 중요한 사례를 나타내기 위해 시나리오 트리 또는 확률 모델을 사용합니다. 시스템은 각 계획을 비상 사태에 대해 평가하고, 1-안전 제약을 존중하면서 유틸리티 함수를 최대화하는 작업을 선택합니다. 운영 계획의 경우 계획 지평선을 1~3일로 유지하고 매일 새로 고치세요; 장기 전략은 주간으로 업데이트하며 거친 세밀화를 할 수 있습니다. 이 접근은 단일 지구에서 다중 지구 배포까지 확장 가능하도록 설계되었습니다.
정책 목표를 작업으로 번역하기 위해, 가치와 목표를 계획 제약과 보상 신호로 매핑하는 번역 계층을 구현하세요. 이 매핑은 안전성, 접근성, 효율성 및 공평성과 같은 도시 가치에 해당합니다. 번역된 목표를 사용하여 계획 결정을 안내하고, 결과를 현장 팀과 자동 컨트롤러를 위한 실행 가능한 명령으로 다시 번역하세요. 중요한 객체(교통 신호, 대중교통 차량, 공공 이벤트)가 포함된 공공 계획에서, 견고한 추론을 지원하기 위해 객체와 상태의 등록부를 유지하세요. 계획자가 신경 쓰는 것—안전성, 이동성 및 공평성—은 공공 기대와 결과를 일치시키기 위해 가치 함수에 표현되어야 합니다. 번역된 목표는 거버넌스와 실행 간의 명확한 다리를 제공합니다.
- 공식 선택: 데이터 품질과 보장에 따라 견고 최적화, 비상 계획 또는 POMDP 기반 접근.
- 실시간 감지 파이프라인 개발: 데이터 품질 메트릭과 지연 한계로 적시 재계획 지원.
- 1-안전 및 위험 예산 통합; 결정이 중요한 안전 위반을 피하도록 보장.
- 제한된 도시 지구에서 시작하여 확장함으로써 확장 가능한 배포 설계; 사례 간 모듈 재사용.
- 실제 사례 사용 평가; 계획 연속성, 결정 지연 및 공공 만족도 측정.
- 변경 관리: 기존 워크플로와 점진적으로 통합; 결과를 해석하기 위한 직원 교육 모듈 제공.
- 명확한 매핑 및 추론 규칙 유지: 이벤트가 전개됨에 따라 비상 사태 업데이트; 결정자에게 설명 접근 가능 보장.
연구자들은 적절히 설계된 스택이 도시 연습에서 중단 이벤트를 줄인다는 것을 입증했습니다; 이해관계자 참여가 수용을 개선합니다; 접근 방식은 실제 가치로 번역됩니다. 아키텍처는 교통 신호, 미터, 센서 및 군중 흐름과 같은 객체에 대한 추론을 지원하며, 계획 주기의 길이는 운영 템포에 맞게 조정될 수 있습니다. 현재 세계 조건에 대한 매핑과 평가는 정책 가치와 공공 기대와 계획을 일치시키는 데 도움이 됩니다.
계획 모델에 법적, 윤리적 및 공평 제약 통합

매 계획 주기에서 법적, 윤리적 및 공평 규칙을 시행하는 제약 계층을 인코딩하세요. 법률과 안전을 위한 하드 제약을 포함하고 새로운 규정을 반영하도록 적시 업데이트; 공정성과 안전을 위한 원하는 결과를 설정하고 안전 및 공정성 목표를 추구하세요. 항목이 선택되거나 거부된 이유를 보여주는 전용 감사 인터페이스를 사용하여 책임성과 투명한 결정 추적을 가능하게 하세요.
제약을 하드 규칙과 소프트 페널티의 혼합으로 표현하세요. 법적 제약의 경우, 속도 제한, 통행권, 프라이버시 보호를 하드 한도로 시행하세요; 윤리적 및 공평 고려사항의 경우, 보호 그룹이나 취약 커뮤니티에 대한 불균형 영향을 패널티화하는 소프트 제약을 사용하세요. 정책 우선순위를 반영하는 가중치로 계획자의 목표에 매핑하세요; 이 프레임워크는 위험 임계값 이상을 유지하면서 안전과 공평성을 최적화하고 결정을 정당화합니다. 영향을 정량화하기 위해 분석에서 데이터를 수집하세요; 법적 지침이 진화함에 따라 가중치를 조정하세요. 제약이 위반되면 취해진 작업을 로그하고 준수 대안을 전환하세요.
데이터 및 평가: 모델을 정확하고 실천적으로 적용하기 위해 교통 분석, 센서 피드 및 사용자 피드백의 적시 데이터를 사용하세요. 다양한 시나리오를 실행하여 도메인 간 일반화를 검증하세요; 제약 간 상호작용(예: 안전 vs. 프라이버시) 검사. 교차 검증과 중복 소스로 데이터 품질 저하를 완화하세요. 보상과 패널티를 테스트하기 위해 시뮬레이션과 실제 파일럿을 구현하여 자율 주행 결정이 안전하고 수용 가능하도록 보장하세요; 시간 제약이 사용자 경험을 저하시키지 않도록 하세요. 실용 지침: 핵심 제약으로 시작하고 구현이 성숙함에 따라 점진적으로 확장하세요.
상호작용 처리에 대한 실행 가능한 패턴: 제약이 충돌할 때 안전과 공평 우선순위를 선호하세요; 목표를 균형화하기 위해 사전순 또는 제약 최적화를 사용하세요. 자율 주행 배포에서 항상 법적 요구사항을 우선하세요; 원하는 경로가 공평 제약을 위반하면 시간 추가에도 준수 대안으로 재라우팅하세요. 시스템은 예상치 못한 입력을 처리하기 위해 안전 대체 계획을 트리거하고 책임을 위해 취해진 작업을 로그합니다. 편차를 추적하고 운영자에게 설명을 제공하여 책임을 지세요. 이러한 패턴을 물류, 도시 계획 및 비상 대응과 같은 다른 도메인에 적용하여 광범위한 적용성을 보장하세요.
팀을 위한 구현 로드맵: 정책 사양, 제약 솔버 및 평가 하네스 세 계층 아키텍처 설계. 법률이나 윤리 지침이 진화함에 따라 교체할 수 있는 모듈러 구현 사용; 도메인과 분석 간 일반화를 지원하기 위해 공통 표현 활용, 책임 있는 AI 계획의 지속적인 발전을 가능하게 합니다. 이 접근은 보상과 비용을 투명하게 처리하여 적시, 정확한 결정에 초점을 유지하여 자율 주행, 교통 및 서비스 도메인이 정책 목표와 일치되도록 합니다.
계획 기반 공공 이니셔티브의 영향 및 책임 측정
도달, 비용 및 결과를 보고하는 분기별 영향 대시보드를 게시하세요. 데이터베이스에 고정되고 자동화로 새로 고침. 도달과 공평성 측면에서 두 점수카드를 정의하여 참여 및 서비스 접근성과 같은 메트릭으로 시작하세요: 출력 측정(도달, 참여) 및 결과 측정(서비스 제공 변화, 도시 공평성). 서비스와 이웃의 공유 경로 지도를 사용하여 커버리지를 시각화하고, 수용 가능한 성능에 대한 한계를 설정하세요. 이러한 메트릭은 직관에만 의존하지 않고 사전 코스 수정과 투명한 책임을 지원합니다. 목표 값 세트와 베이스라인 비교를 사용하여 예상치 못한 변화를 식별하세요. 특히 인구 필요가 지구 간 이동할 때요.
페트리 그래프와 nurix-inspired 네트로 워크플로를 모델링하여 동역학을 정량화하세요. 각 인스턴스에 대해 작은 도시 팀 간의 이동, 위치 및 흐름을 캡처하세요; 작업과 자원의 도달 가능 세트를 계산하세요; 참가자, 장치 및 시간 단계에 대한 정수 개수를 사용하세요. 다양한 시나리오 하 영향 추정 공식을 개발하고 새로운 데이터가 도착할 때 계획을 적응하세요; 그래프는 진행 상황을 시각화하고 커버리지 변화 강조. 이 접근은 암시적 가정을 명시적으로 만들어 자동화가 반복 작업을 줄일 수 있는 곳을 명확히 하는 이점을 제공합니다.
투명한 데이터 거버넌스와 공유 메트릭을 통해 책임을 보장하세요. 프로젝트 계획을 결과에 연결하는 경량 데이터 아키텍처를 생성하여 명확한 소유권과 감사 추적을 가지세요. 이해관계자와 통제 위원회를 위한 대시보드 게시; 결과에 대한 한계를 보여주기 위해 투명한 가정과 민감도 분석 사용. 실천에서, 데이터 출처와 정기 감사가 이러한 이니셔티브를 신뢰할 수 있게 유지하며, 목표 중심 보고는 도시 계획자가 노력의 확장 또는 일시 중지 장소를 결정하고 적절한 해석을 위해 이니셔티브 유형을 문서화하는 데 도움이 됩니다.
Ready to leverage AI for your business?
Book a free strategy call — no strings attached.
Related Articles

The Golden Specialist Era: How AI Platforms Like Claude Code Are Creating a New Class of Unstoppable Professionals
March 25, 2026
AI Is Replacing IT Professionals Faster Than Anyone Expected — Here Is What Is Actually Happening in 2026
March 25, 2026