Технологии искусственного интеллекта (AI) и машинного обучения (ML) развиваются сверхбыстрыми темпами и находят свое применение в различных областях, оказывая положительное влияние на жизнь людей, ведение бизнеса и реализацию государственных инициатив. О некоторых возможностях использования разработок в области искусственного интеллекта в ходе Петербургского международного экономического форума-2023 рассказал руководитель центра прикладного искусственного интеллекта Сколковского института науки и технологий (СколТех) Евгений Бурнаев.
– Сегодня мы наблюдаем некоторые климатические изменения, и для того, чтобы демпфировать их последствия, необходима значимая перестройка энергетической системы, энергопотребления. На пути энергоперехода возникают так называемые ESG-риски, связанные с изменением внешней среды, структуры общества, системы управления.
В этом случае искусственный интеллект позволяет обрабатывать данные, строить модели для прогнозирования ESG-рисков и минимизировать их. То есть это набор технологий для решения инженерных задач такого типа. Безусловно, есть еще некоторое второе направление – по сути, ситуация обратная: технологии искусственного интеллекта ресурсоемкие, они требуют значимых вычислительных мощностей, и поэтому их нужно делать энергоэффективными.
Я остановлюсь на технологиях AI для решения инженерных задач. Эти инженерные задачи можно разбить на крупные группы, направления, расскажу о некоторых из них, а именно о мониторинге и дистанционном зондировании, анализе мультимодальных данных в режиме реального времени, моделировании экономических и физических рисков, оптимизации решений для индустриальной инженерии и промышленности. Речь пойдет о приложениях, реализация которых позволяет делать конкретные индустриальные продукты на основе технологий AI.
Начнем с мониторинга и дистанционного зондирования. По поручению заместителя председателя Правительства Российской Федерации Дмитрия Чернышенко совместно с МЧС России и Министерством природных ресурсов и экологии России мы занялись решением задачи по прогнозированию вероятности возникновения лесных пожаров. Были определены регионы интереса. На регионе интереса выбирается сетка, и в каждой ячейке сетки на несколько дней вперед прогнозируется вероятность возникновения пожара в зависимости от разных факторов, которые оцениваются за предыдущие семь дней. Это факторы, влияющие на вероятность возникновения пожара: метеорологические измерения, а также факторы, которые считаются по ним, – индекс пожароопасности Нестерова, увлажненность, характеристики, рассчитываемые по данным дистанционного зондирования (тип растительности, различные спектральные свойства, рельеф местности, удаленность от населенного пункта, плотность населения и так далее). В общем, это то, что действительно может повлиять на пожароопасную обстановку. Модель обучается на основе исторических данных, где, какие пожары были, есть термические точки, спутниковые измерения. В результате на выходе она может прогнозировать пожары на каждый из пяти дней вперед, где вероятность их возникновения высокая и есть риск, а где вероятность низкая и риска нет.
Мы построили модель на открытых данных на ряде тестовых регионов – Иркутская область, Республика Саха (Якутия), Красноярский край. В 2023 году распространим работу этого сервиса на всю Россию. Мы уже достигли результатов, требуемых для МЧС, и до конца года планируем внедрить данную модель для эксплуатации во внутренний контур МЧС.
Если чрезвычайная ситуация уже произошла, искусственный интеллект может быстро оценить ее последствия: какая площадь затронута, какие разрушения произошли. Это важно для понимания развития ситуации, например, в случае наводнений, пожаров и так далее.
Другой пример прикладной задачи в этом направлении, связанной с мониторингом, так называемое прогнозирование ледовой обстановки в арктическом регионе. Для обеспечения безопасности на Северном морском пути, безопасности при операциях рядом с нефтегазовыми платформами необходимы мониторинг и прогнозирование ледовой обстановки, как происходит движение ледовых масс, какая локальная погода. Это сложная задача, поскольку прогноз требуется до трех дней вперед с регулярным шестичасовым обновлением, также необходима визуализация. Важно учитывать гидродинамическую модель, которая описывает, как взаимодействуют между собой океан, атмосфера и другие объекты. Также необходим искусственный интеллект для того, чтобы ускорять расчеты и прогноз, насыщать его точными данными точечных измерений с буев или судов, которые могут измерять, например, скорость течения и другие характеристики непосредственно рядом с ледоколом. В результате получается сервис, который предоставляет оперативные наблюдения и прогноз, что позволит оптимизировать логистику.
Еще один пример задачи в этом же направлении – прогнозирование распространения загрязнений.
В каком‑то регионе устанавливается ряд датчиков, которые измеряют концентрацию тех или иных загрязняющих веществ. С учетом локального прогноза погоды, если есть какой‑то источник загрязнения, можно спрогнозировать распространение шлейфа этого загрязнения и как со временем будет развиваться ситуация. Это прямая задача. Есть и обратная, очень сложная: если у нас есть какие‑то точечные измерения с этих станций, мы должны понимать, с учетом локального прогноза погоды, где потенциально находится источник загрязнения, какой он мощности и когда он произвел выброс. В этой задаче ресурсоемким местом является сам прогноз погоды, поскольку его расчет на локальный регион требует большой вычислительной мощности и занимает много времени. Поэтому нужно каким‑то образом ускорить процесс.
Приведу несколько примеров в других направлениях. Если говорить о физических рисках, то, конечно, мы не можем спрогнозировать конкретно, что вот здесь произойдет такое‑то чрезвычайное событие. Но мы можем понять, какой из регионов наиболее подвержен какому‑то риску и в какой момент времени. К примеру, значительная часть нефтегазовой инфраструктуры располагается в арктическом регионе с многолетней мерзлотой. Сейчас в результате климатических изменений глубина промерзаний меняется, что может привести к катастрофическому разрушению критической инфраструктуры. Поэтому, с одной стороны, на основе модели специальных физических теплопроводностей можно примерно оценить, как происходят и как будут происходить в будущем изменения промерзания почвы и какую часть инфраструктуры какого‑то крупного предприятия это может затронуть. Машинное обучение здесь может как раз позволить по данным оперативных измерений с датчиков, которые в почве фиксируют температуру, глубину промерзания в конкретных местах, уточнить этот прогноз физической моделью для того, чтобы лучше понимать, какую часть предприятия или производства это действительно может затронуть, оценить экономические последствия, вероятность дефолта предприятия. Для этого используются специализированные экономические модели на основе стохастических хроник. В итоге получается инструмент, который позволяет оценить, как можно перебалансировать кредитный портфель или более точно оценить, допустим, страховую ставку. Здесь тоже возникает некоторая потребность в каплинге (coupling), физике машинного обучения.
Еще один пример связан с производственным направлением. Речь идет о нефтегазе, так называемой самообучающейся модели пласта.
На месторождении довольно часто постепенно с работой появляются какие‑то локальные измерения, связанные с конкретными скважинами. Это, допустим, свойства керна, есть какие‑то глобальные измерения по всему месторождению, это сейсмика, гидродинамические и геологические исследования скважин. Все эти данные имеют разную природу, разную локальность, необходимо их каким‑то образом соединить, комплексировать, чтобы получить описание всего месторождения, например, проницаемость породы, и чтобы лучше прогнозировать, сколько нефти мы можем добыть, это важно для планирования сложных технологических операций. Данная задача зачастую требует значительных ручных усилий: когда аналитики что‑то рассчитывают, используя разрозненное программное обеспечение. Вместе с тем, необходима автоматизация, и фактически речь идет о построении мультиагентной системы на основе искусственного интеллекта, которая автоматизированным образом всю эту цепочку расчетов одних данных по другим автоматизирует и позволяет адаптировать модель пласта по мере поступления новых данных.
Таким образом, можно сделать вывод, что сегодня нам приходится иметь дело с обработкой мультимодальных данных, учитывать какие‑то физические и даже экономические модели. Очевидно, требуется разработка соответствующих инструментов, фреймворков искусственного интеллекта. Так называемый фреймворк Data Fusion (консолидация мультимодальных пространственно-временных данных) или Science-Informed ML (объединение физическо-математической и ML-моделей).
Пример технологии Data Fusion включает в себя ряд блоков. Например, блок Повышение разрешения (SR): спутниковые данные в плохом разрешении выходят дешевле, но на них хуже видны конкретные объекты. Нейросети могут повысить разрешение спутниковых данных и за счет этого увеличить качество распознавания. При этом платить мы будем меньше. Далее, как только какие‑то конкретные объекты распознались, можем сравнить, изменились ли свойства объектов, и понять, в случае, допустим, ЧС, произошло ли какое‑то разрушение. Это относится к технологии консолидации мультимодальных данных дистанционного зондирования.
Что касается технологии физически информированных моделей. Приведу пример конкретного блока, который в рамках этого фреймворка реализуется. Допустим, мы хотим сделать прогноз погоды. Это занимает довольно много вычислительной мощности. Гораздо проще сделать расчет погоды по какой‑то мелкой сетке, но он будет менее точный. Обучается специальная нейросеть, которая может повысить разрешение и получается более детальный прогноз погоды с учетом характеристик рельефа местности и других внешних факторов.
Проблема в том, что мы прогнозируем не просто какое‑то изображение, а фактически физическое поле, например, распределение скоростей ветра. Этот физический объект имеет свои свойства, которые должны в каком‑то смысле сохраняться, например, должна сохраняться энергия этого поля ветра. При обучении нейросетей в таком случае необходимо использовать специализированные инструменты, которые вносят в алгоритмы обучения нейросетей специализированные штрафы. Регуляризация или какие‑либо другие архитектуры позволяют эти физические свойства объектов сохранять, чтобы это походило на что‑то реальное. Это достаточно активно развивающаяся область машинного обучения, искусственного интеллекта, сейчас крайней важная.
Подводя итог, отмечу: мы видим, что есть сложные приложения, их реализация важна для экономики в течение ближайших лет. Реализация этих сложных приложений требует разработки сложных технологий, основанных в том числе на научных исследованиях. Мы имеем дело с многомерными данными. Фактически есть какие‑то связи между компонентами этих данных, здесь необходимо использовать топологический анализ данных, вероятностное моделирование, генеративные модели, которые лежат в основе того же ChatGPT, этот инструмент тоже необходим для решения таких инженерных задач, о которых я рассказал. В итоге получаем такую связку, когда сложное реальное приложение тянет за собой развитие технологий.
Подготовила Елена ВОСКАНЯН
В качестве иллюстраций использованы слайды из презентации Евгения Бурнаева