{# Generated per-post OG image: cover + headline rendered onto a 1200×630 PNG by apps/blog/og_image.py. Cached for 24 h via cache_page on the URL pattern; immutable Cache-Control so social crawlers don't refetch. #} Перейти к содержимому
>_ KeyGroup / blog

AAAI 2022 Tutorial - Теория и практика планирования ИИ — Ключевые концепции, методы и выводы

updated 6 дней, 18 часов ago AI Engineering Sarah Chen 13 мин чтения 5 просмотров
{# Banner is the LCP image — fetchpriority=high stays on the JPEG so the browser starts loading immediately even if AVIF/WebP haven't been content-negotiated yet. w=1680 covers retina desktop. #} AAAI 2022 Tutorial - Теория и практика планирования ИИ — Ключевые концепции, методы и выводы
{# body_html is precompiled at save time (apps.blog.signals.precompile_body_html). Fall back to runtime `|md` on the off-chance an old post slipped past the backfill — keeps the page from rendering blank. #}

AAAI 2022 Tutorial: AI Planning Theory and Practice — Key Concepts, Methods, and Takeaways

Начните с конкретной рекомендации: отобразите свою задачу планирования в компактный процесс и запустите воспроизводимый эксперимент. Выберите основной вариант использования, такой как управление дорожным движением или логистическое планирование, и представьте его как линейную последовательность действий, которая перемещается из начального состояния к цели. Поддерживайте известную область и независимую от деталей платформы, чтобы они тестировались с помощью нескольких планировщиков. Создайте небольшую тестовую среду с 2–3 агентами, чтобы наблюдать за взаимодействиями, измерять время выполнения и отслеживать несколько транзакций в качестве эталонов.

Переходя от теории к практике, определите три столпа: поиск в пространстве состояний, графы планирования и методы, основанные на ограничениях. На практике объедините аналитику с эвристическими указаниями для навигации по большим пространствам поиска и чтобы помочь вам быстрее принимать обоснованные решения. Примените проверку моделей и облегченную верификацию, чтобы выявить взаимоблокировки, столкновения ресурсов или нарушенные ограничения перед развертыванием; они полезны для быстрой итерации.

Три практические оси помогут вам сравнить подходы: представление (типа STRIPS или варианты PDDL), обработка параллелизма (независимые действия против общих ресурсов) и оценка (эталоны, метрики и воспроизводимые запуски). Выберите представление, которое позволит обеспечить логичность предусловий и последствий, чтобы планировщики могли рассуждать о зависимостях процесса. Используйте эвристические указания для отсечения ветвей и проверяйте на фиксированном наборе задач с тем же ограничением по времени, чтобы обеспечить справедливые сравнения.

Ключевые выводы включают модульное кодирование, которое перемещается между областями, общий набор эталонных тестов с четкими исходными данными и документацию допущений. Используйте моделирование для стресс-тестирования планировщиков, запускайте аналитику для сравнения результатов и сбора данных о времени, памяти и длине плана. Соедините верификацию с проверкой моделей, чтобы подтвердить живучесть и удовлетворение ограничений в параллельных условиях.

Приложения для государственного управления и практические рекомендации

Public Administration Applications and Practical Guidance

Реализуйте целевой пилотный проект, который решает реальную задачу, такую как маршрутизация запросов на обслуживание или назначение полевого персонала. Создайте структурированную модель, состоящую из переменных, представляющих бюджет, численность персонала, приоритет случая, целевые уровни обслуживания и временные окна. Определите условные правила, которые отражают политические ограничения и юридические требования. Используйте автоматизированное планирование для создания жизнеспособных последовательностей действий и примените проверку модели до развертывания, чтобы проверить безопасность, справедливость и осуществимость. Запустите испытание с существующими данными, сравните запланированные результаты с фактическими и измерьте реальные выгоды в эффективности. Усилия должны включать четкое пространство для обратной связи и итерации для ужесточения допущений перед более широким развертыванием.

Подключите планировщик к существующим муниципальным системам и создайте общее пространство для пользователей, чтобы исследовать планы, корректировать параметры и утверждать или отклонять действия. Используйте панель мониторинга в реальном времени для отображения прогнозируемого воздействия на время ожидания и стоимость, помогая персоналу передовой линии и менеджерам принимать обоснованные решения. Позвольте администраторам и передовым пользователям сотрудничать в отношении ограничений, обеспечивая при этом конфиденциальность и соответствие требованиям. Эта интеграция обеспечивает беспрепятственный поток данных и прозрачный контрольный журнал для принятия решений, повышая доверие и внедрение.

Примените структурированные рассуждения и проверку модели для проверки критических свойств, таких как безопасность, соответствие политике и справедливость. Создайте уровень рассуждений, который использует прогнозные прогнозы для обнаружения узких мест и перерасходов до того, как они произойдут. Разбейте проблемы на модули для очистки данных, обработки ограничений и проверки рисков, обеспечивая удобство обслуживания по мере развития систем. Достижения в автоматизированном планировании дают вам возможность быстро сравнивать альтернативные планы, повышая эффективность без ущерба для управления. Опубликуйте четкие обоснования принятия решений, чтобы пространство для обзора оставалось открытым и подотчетным.

Установите практические критерии оценки и эталоны: отслеживайте среднее время обработки, стоимость случая, частоту ошибок и удовлетворенность пользователей. Используйте реальные данные из пилотных операций для стресс-тестирования планов при переменном спросе и используйте результаты проверки модели для корректировки диапазонов риска и резервных процедур. Обеспечьте постоянное обучение пользователей тому, как читать планы и как вмешиваться при необходимости обновления политики. Поддерживайте дорожную карту, которая соответствует требованиям управления, при этом поддерживая экспериментальные циклы, которые уважают конфиденциальность данных и проблемы заинтересованных сторон, обеспечивая устойчивый прогресс и измеримое воздействие.

Масштабируйте, начиная с небольшого набора сервисов, а затем воспроизводите подход по отделам с модульными компонентами и общими библиотеками. Ведите текущий реестр переменных, чтобы отражать новые политики и финансовые ограничения, и итеративно корректируйте модель по мере поступления данных (корректировка). Спроектируйте рабочий процесс так, чтобы он был ориентирован на будущее, позволяя перспективному планированию информировать о распределении ресурсов в периоды пиковой нагрузки. Задокументируйте практический план перехода, который выделяет ранние победы, необходимые усилия и сроки, чтобы агентства могли внедрять методы планирования без сбоев и с четкими, реальными преимуществами.

Отображение политических проблем в области планирования ИИ в государственном секторе

Рекомендация: контекстно-ориентированное кадрирование, сбор контекста политической проблемы и ее преобразование в проблему планирования. Представляйте цели и ограничения и собирайте комбинации действий, которые ведут к определенному результату. Используйте перспективное планирование для создания продукта, который направляет рабочее программирование в реальных программах, и оценивайте прогресс с помощью сценариев в стиле rt-1gt, которые помогают сравнивать результаты.

Чтобы применить это в государственном секторе, сопоставьте политические инструменты с действиями в области планирования, используя небольшой модульный набор рычагов. Спроектируйте эти действия так, чтобы их можно было протестировать в небольших пилотных проектах, и оцените результаты на раннем этапе. Поддерживайте меньшую предвзятость, вводя дополнительные ограничения и допуская обобщение по юрисдикциям; используйте данные, взятые из нескольких контекстов, для уточнения моделей и решения, какие вмешательства масштабируются.

Этапы реализации включают в себя: формализацию языка предметной области в терминах программирования, перечисление действий с четкими предпосылками и последствиями и кодирование ограничений для снижения риска. Запустите машинный информированный планировщик для создания планов-кандидатов, проверьте их работу на соответствие заявленным целям и итеративно улучшайте по мере поступления новых данных. Убедитесь, что предлагаемая работа обеспечивает целевой результат.

Перспективы Геффнера в отношении планирования в условиях неопределенности информируют о том, как сбалансировать знания предметной области с автоматизированным поиском, направляя, как выбирать комбинации, которые обобщаются между контекстами, взятыми из разных настроек. Связывание этих идей с эталонными тестами rt-1gt помогает обеспечить, чтобы политические планы преобразовывались в реализуемые программы.

Последнее примечание: структурируйте политические проблемы так, чтобы область планирования поддерживала повторное использование в программах, позволяя снизить барьер для новых развертываний и уменьшить накладные расходы на повторное моделирование. Результат сопоставляет контекст и цели с практическими этапами программирования, которые будут адаптироваться к будущим ограничениям и дополнительным требованиям.

Выбор и адаптация алгоритмов планирования для данных государственного управления

Начните с подхода к планированию частичного порядка, который использует явные схемы действий и адаптер данных с поддержкой управления, гарантируя, что приложение может масштабироваться и сохранять происхождение данных по наборам данных.

Основная логика поддерживает явное состояние преемника, моделируя предпосылки, эффекты и ограничения данных, чтобы планировщик мог явно рассуждать о зависимостях и изменять их порядок при изменении данных.

В контексте управления форматы данных различаются, а метки могут быть шумными; представляйте знания модульным образом и позволяйте планировщику адаптироваться без переделки всего плана, прежде всего несмотря на колебания качества данных.

Ограничения по времени имеют значение: параметризуйте планировщики крайними сроками и запланированными этапами, чтобы поиск находил возможные последовательности в пределах политических окон, даже когда объем входящих данных управления увеличивается с течением времени.

Чтобы адаптироваться к потребностям управления, запустите небольшой явный продукт: службу планирования с четким API, правилами с контролем версий и защитой конфиденциальности данных; исследователи могут тестировать замены и измерять влияние на качество плана по другим местам и областям.

На практике подход обрабатывает большую дисперсию: он может рассматривать искусственные ограничения как мягкие или жесткие, а ограничения представлены как явные охранники, которые планировщик проверяет, прежде чем согласиться на действия, обеспечивая надежность и отслеживаемость в рабочих процессах управления.

Обработка неопределенности, непредвиденных обстоятельств и динамических сред в государственных планах

Рекомендуется развернуть модульный стек планирования с учетом неопределенности и явной обработкой непредвиденных обстоятельств для городских общественных планов, что позволяет быстро перепланировать по мере изменения мира.

Структурируйте стек вокруг пяти основных модулей: прогнозирование, рассуждение в условиях неопределенности, сопоставление с действиями, мониторинг выполнения и перевод политики. Каждый модуль работает с потоками данных от городского зондирования, общественного вклада и административных записей и взаимодействует через четко определенные интерфейсы для поддержания масштабируемости и адаптивности. В городских контекстах с высокими ставками эта установка обеспечивает согласованность решений, даже если сигналы не согласованы. В настоящее время государственные учреждения полагаются на специальные обновления; предложенный стек стандартизирует эти процессы и снижает дрейф между командами.

Обработка неопределенности использует деревья сценариев или вероятностные модели для представления важных случаев. Система оценивает каждый план на предмет непредвиденных обстоятельств и выбирает действия, которые максимизируют функцию полезности, соблюдая при этом 1-безопасные ограничения. Для оперативных планов поддерживайте длину горизонта планирования от 1 до 3 дней и обновляйте ежедневно; более долгосрочные стратегии можно обновлять еженедельно с грубыми уточнениями. Этот подход разработан для масштабирования от одного района до развертываний в нескольких районах.

Чтобы преобразовать политические цели в действия, реализуйте уровень преобразования, который отображает ценности и цели в ограничения планирования и сигналы вознаграждения. Это сопоставление соответствует городским ценностям, таким как безопасность, доступность, эффективность и справедливость. Используйте переведенные цели для направления решений по планированию, а затем переведите результаты обратно в действенные заказы для полевых команд и автоматизированных контроллеров. В общественных планах, включающих значительные объекты (светофоры, транзитные парки, общественные мероприятия), поддерживайте реестр объектов и их состояний для поддержки надежных рассуждений. То, что важно для планировщиков - безопасность, мобильность и равенство - должно быть представлено в функции ценности, чтобы результаты соответствовали ожиданиям общественности. Переведенные цели обеспечивают четкий мост между управлением и исполнением.

  • Выберите формулировку: надежная оптимизация, условное планирование или подходы на основе POMDP в зависимости от качества данных и гарантий.
  • Разработайте конвейер зондирования в реальном времени с показателями качества данных и границами задержки для поддержки своевременного перепланирования.
  • Включите 1-безопасность и бюджеты рисков; убедитесь, что решения избегают критических нарушений безопасности.
  • Разработайте для масштабируемого развертывания, начав с ограниченного городского района и расширяясь; повторно используйте модули в разных случаях.
  • Оценивайте, используя реальные случаи; измеряйте непрерывность плана, задержку принятия решения и удовлетворенность общественности.
  • Управление изменениями: постепенно интегрируйтесь с существующими рабочими процессами; предоставьте учебные модули для персонала, чтобы интерпретировать результаты.
  • Поддерживайте четкие правила сопоставления и рассуждений: обновляйте непредвиденные обстоятельства по мере развития событий; убедитесь, что объяснения доступны для лиц, принимающих решения.

Исследователи продемонстрировали, что правильно разработанный стек уменьшает количество критических событий в городских учениях; привлечение заинтересованных сторон улучшает принятие; подход преобразуется в реальную ценность. Архитектура поддерживает рассуждения об объектах, таких как светофоры, счетчики, датчики и потоки толпы, а длину цикла планирования можно настроить в соответствии с оперативным темпом. Сопоставление и оценка по отношению к текущим мировым условиям помогает поддерживать соответствие планов политическим ценностям и ожиданиям общественности.

Включение юридических, этических и справедливости ограничений в модели планирования

Incorporating Legal, Ethical, and Equity Constraints into Planning Models

Закодируйте слой ограничений, который обеспечивает соблюдение юридических, этических норм и правил справедливости в каждом цикле планирования. Включите жесткие ограничения для законов и безопасности, со своевременными обновлениями, чтобы отразить новые правила; установите желаемые результаты для справедливости и безопасности и преследуйте цели безопасности и справедливости. Используйте специальный интерфейс аудита, чтобы показать, почему элементы были выбраны или отклонены, что обеспечивает подотчетность и прозрачные журналы решений.

Представляйте ограничения как смесь жестких правил и мягких штрафов. Для юридических ограничений обеспечьте соблюдение ограничений скорости, права проезда, защиты конфиденциальности в качестве жестких границ; для этических соображений и соображений справедливости используйте мягкие ограничения, которые наказывают несоразмерное воздействие на охраняемые группы или недостаточно обслуживаемые сообщества. Сопоставьте их с целью планировщика с весами, которые отражают политические приоритеты; эта структура оптимизирует безопасность и справедливость, оставаясь выше пороговых значений риска и обосновывая решения. Собирайте данные из аналитики для количественной оценки воздействия; корректируйте веса по мере развития юридических указаний. Когда ограничения нарушаются, регистрируйте предпринятые действия и переходите к совместимым альтернативам.

Данные и оценка: Используйте своевременные данные из аналитики трафика, каналов датчиков и отзывов пользователей, чтобы поддерживать точность моделей и применять их на практике. Проверьте обобщение по доменам, выполнив разнообразные сценарии; изучите взаимодействие между ограничениями (например, безопасность и конфиденциальность). Смягчите низкое качество данных с помощью перекрестной проверки и избыточных источников. Внедряйте моделирование и реальные пилотные проекты для тестирования вознаграждений и санкций, гарантируя, что автономные решения остаются безопасными и приемлемыми; убедитесь, что временные ограничения не ухудшают пользовательский опыт. Вот практическое руководство: начните с основных ограничений и постепенно расширяйте их по мере созревания реализаций.

Практические шаблоны для обработки взаимодействий: когда ограничения конфликтуют, отдавайте предпочтение безопасности и приоритетам справедливости; используйте лексикографическую оптимизацию или оптимизацию с ограничениями для балансировки задач. В автономных развертываниях всегда отдавайте приоритет юридическим требованиям; если желаемый маршрут нарушает ограничения по справедливости, измените маршрут на совместимую альтернативу, даже если это увеличивает время. Система обрабатывает неожиданные входные данные, запуская безопасные резервные планы и регистрируя предпринятые действия для подотчетности. Отслеживайте отклонения и предоставляйте объяснения операторам для подотчетности. Примените эти шаблоны к другим областям, таким как логистика, городское планирование и реагирование на чрезвычайные ситуации, чтобы обеспечить широкую применимость.

Дорожная карта реализации для команд: разработайте трехуровневую архитектуру - спецификацию политики, решатель ограничений и жгут оценки. Используйте модульные реализации, которые можно поменять по мере развития законов или руководств по этике; используйте общие представления для поддержки обобщения по доменам и аналитике, что позволяет продолжать прогресс в ответственном планировании ИИ. Этот подход позволяет сосредоточиться на своевременных, точных решениях, которые рассматривают вознаграждения и затраты с прозрачностью, чтобы автономные домены, домены трафика и сервисов оставались в соответствии с политическими целями.

Измерение воздействия и подотчетности общественных инициатив, основанных на планировании

Опубликуйте ежеквартальную панель мониторинга воздействия, в которой сообщается об охвате, затратах и ​​результатах, закрепленных в базах данных и обновляемых с помощью автоматизации. Начните с определения двух систем показателей, с точки зрения охвата и справедливости, с такими показателями, как участие и доступность услуг: показатели выпуска (охват, участие) и показатели результатов (изменения в предоставлении услуг, городская справедливость). Используйте общую карту маршрутов услуг и районов для визуализации покрытия и установите границы для приемлемой производительности. Эти показатели позволяют активно корректировать курс и не могут полагаться только на интуицию, поддерживают прозрачную подотчетность. Используйте наборы целевых значений и сравнение с базовым уровнем для выявления неожиданных сдвигов, особенно когда потребности населения перемещаются между районами.

Смоделируйте рабочие процессы с помощью графов Petri и сетей, вдохновленных nurix, для количественной оценки динамики. Для каждого экземпляра зафиксируйте ходы, позиции и поток по небольшим городским командам; вычислите достижимые наборы задач и ресурсов; используйте целые числа для участников, устройств и временных шагов. Разработайте формулы для оценки воздействия в различных сценариях и адаптируйте план по мере поступления новых данных; графики визуализируют прогресс и выделяют изменения в охвате. Этот подход обеспечивает преимущество, делая неявные предположения явными и разъясняя, где автоматизация может уменьшить повторяющуюся работу.

Обеспечьте подотчетность посредством прозрачного управления данными и общих показателей. Создайте легкую архитектуру данных, которая связывает планы проекта с результатами, с четкой собственностью и контрольными журналами. Публикуйте панели мониторинга для заинтересованных сторон и советов по контролю; используйте прозрачные предположения и анализ чувствительности, чтобы показать границы результатов. На практике происхождение данных и регулярные аудиты поддерживают доверие к этим инициативам, в то время как отчеты, ориентированные на цели, помогают градостроителям решать, где масштабировать или приостанавливать усилия, а также документировать тип инициативы для правильной интерпретации.

Похожие статьи

subscribe

Будьте в курсе

Новые статьи про AI, рост и B2B-стратегию — без шума.

{# No on purpose — see apps.blog.views.newsletter_subscribe for the reasoning (anon pages must not Set-Cookie: csrftoken or the nginx edge cache skips them). Protection is via Origin/Referer in the view, not via the token. #}
$ cd .. # Все посты
X / Twitter LinkedIn

ls -la ./ai-engineering/

Похожие посты

{# Browsers pick the smallest supported format: AVIF → WebP → JPEG. w=640 covers retina mobile + most desktop cards (the slot is ~320 px wide; 640 doubles for 2× screens). #} Эпоха Золотых Специалистов: Как AI-платформы, такие как Claude Code, создают новый класс неудержимых профессионалов

Эпоха Золотых Специалистов: Как AI-платформы, такие как Claude Code, создают новый класс неудержимых профессионалов

Конец специализации, какой мы ее зналиДесятилетиями в технологической индустрии восхваляли специалистов. Компании нанимали людей, которые делали что-то одн...

~/ai-engineering 7 мин