Умные решения и новые возможности

84

Искусственный интеллект (ИИ) порой называют «электричеством XXI века». О трендах развития ИИ, новых умных решениях и возможностях, которые эти решения открывают, говорили на форуме «Nobel Vision. Open Innovations 2.0» в декабре 2021 года.

Константин Вишневский, директор Центра исследований цифровой экономики Института статистических исследований и экономики знаний НИУ «Высшая школа экономики»:

– Искусственный интеллект занимает центральное место в цифровой трансформации экономики, общества, так как он обладает сквозным характером, что позволяет ему проникать во все сектора, формировать технологическую базу для развития и распространения прочих технологий – таких, как робототехника и интернет вещей.

Само по себе явление ИИ очень многогранно. С помощью нашей системы интеллектуального анализа больших данных iFORA мы посмотрели ландшафт искусственного интеллекта и насчитали порядка двух тысяч разного рода направлений. Даже такие понятные специалистам сущности, как компьютерное зрение, как показал наш анализ, содержат более 170 различных тематик, которые либо декомпозируют понятие компьютерного зрения (анализ сцен, отслеживание объектов), либо отражают смежные тематики, например связанные с робототехникой. Россия, кстати, входит в топ-15 рейтинга стран по вкладу в глобальную повестку AI (Artificial Intelligence, искусственный интеллект) исследований и непосредственно участвует в порядка 2–3% тематик по ИИ.

Анализируя рейтинг наиболее значимых и динамичных тематик в области искусственного интеллекта за 2021 год, мы пришли к выводу, что одним из топовых направлений является компьютерное зрение, что в том числе связано с распространением решений по распознаванию медицинских изображений и отслеживанию контактов во время пандемии COVID-19. Новым этапом развития ИИ становится распознавание эмоций. ИИ-технологии для обработки текстов (распознавание естественного языка, машинный перевод) и речи (распознавание голоса, разговорный ИИ) выходят на новый виток развития ввиду массового распространения интеллектуальных помощников и тенденции к роботизации.

Профессиональное сообщество все больше фокусируется на поиске возможности преодолеть проблему «черного ящика», когда мы не понимаем, что и почему делает ИИ, и создать методы объяснимого ИИ, что позволит интерпретировать работу алгоритмов машинного обучения.

Динамично развивающиеся новые модели и методы ИИ (AutoML – автоматическое машинное обучение, трансферное обучение, рекуррентные нейронные сети, федеративное обучение) позволяют решать задачи быстрее, с большей точностью и меньшими энергозатратами.

Приведу несколько примеров кейсов применения ИИ и возможных эффектов. Первый кейс – распознавание эмоций для детей с аутизмом. Проект Autism Glass Project реализуется американской компанией Cognoa. Камеры Google Glass распознают эмоциональную реакцию собеседника и передают их ребенку в форме звуковых и визуальных сигналов в режиме реального времени. Этот проект повышает социальную вовлеченность детей с аутизмом, улучшает их взаимодействие с окружающими.

 

На данный момент около 70% спроса на искусственный интеллект обеспечивается такими секторами, как финансовые услуги, транспорт и логистика, образование и наука.

 

Другой кейс – интеллектуальные счетчики для оптимизации потребления воды и электроэнергии. Благодаря инициативе SmartLiving Управления электроэнергетики и водоснабжения Дубая (DEWA) потребители получают актуальную информацию о своих расходах энергоресурсов через интеллектуальные сервисы. Кроме того, удалось оптимизировать внутренние процессы коммунальных служб и автоматизировать сервисные операции с использованием ИИ и обработки больших данных.

Несмотря на то что тематик ИИ достаточно много, среди них можно выделить определенные группы и категории. В рамках подготовки «Белой книги» по высокотехнологичным направлениям в части ИИ (подготовить «Белую книгу» для форума «Nobel Vision. Open Innovations 2.0» поручил первый заместитель председателя Правительства РФ Андрей Белоусов. – Прим.авт.) мы выделили шесть таких групп. Большая часть из них стандартна и типична для российской практики: это компьютерное зрение, обработка естественного языка, распознавание и синтез речи, рекомендательные системы и интеллектуальные системы поддержки принятия решений, перспективные методы.

Считаем необходимым выделить отдельно такое значимое для развития искусственного интеллекта направление, как электронная компонентная база ИИ. Дело в том, что сегодня при высоких темпах развития ИИ мы имеем ограниченное количество зарубежных поставщиков электронной компонентной базы, что приводит к нарастанию рисков, связанных с введением возможных ограничений. Как показывает мировой опыт, большинство стран мира нацелены на то, чтобы последовательно развивать собственную электронную компонентную базу для ИИ, чтобы не зависеть от ограниченного числа мировых производителей электроники.

Именно в области электронной компонентной базы наблюдается заметный скачок в части публикационной и патентной активности. Отчасти это связано с эффектом низкой базы, да и абсолютные числа пока невелики, но очевидно, что это направление является крайне важным и требует отдельного внимания. В нашей стране так или иначе представлены все направления мировой научно-технологической повестки. В среднем доля российских научных публикаций составляет порядка 1,5%, доля по патентам несколько ниже, выделяется разве что сюжет по обработке естественного языка.

Если сравнить Россию с миром, то по совокупности за три года по числу научных публикаций по ИИ мы входим в топ-20 стран и по патентам в топ-15. Основными драйверами развития ИИ, как показывает анализ публикационной и патентной активности, являются крупные университеты, ведущие научные центры, большинство из которых одержало победу в конкурсе центров ИИ. Это НИУ «ВШЭ», МФТИ, Сколтех, а также крупные компании – Сбер, Яндекс, Kaspersky, ABBYY и ряд других.

Разумеется, масштабные усилия со стороны государства и бизнеса, включая, например, реализацию Стратегии цифровой трансформации отраслей, инициативы по ИИ трансформации крупных компаний находят отражение в росте спроса на ИИ. Можно отметить интересную деталь: на данный момент около 70% спроса на искусственный интеллект обеспечивается такими секторами, как финансовые услуги, транспорт и логистика, образование и наука. Ожидается, что на горизонте 2030 года распределение станет чуть более диверсифицированным и чуть более равномерным, но ключевым является тот факт, что спрос на ИИ может вырасти более чем в 18 раз. Таким образом, ИИ является абсолютным лидером среди всех цифровых технологий по ожидаемой динамике роста и распространения.

Владимир Авербах, старший управляющий директор, начальник Управления национального развития ИИ ПАО «Сбербанк»:

– По информации McKinsey, наблюдается рост внедрения искусственного интеллекта в разных отраслях в четыре раза. В каждой сфере есть энтузиасты, которые применяют ИИ для улучшения своих бизнес-процессов. В среднем, по нашим оценкам, внедрение ИИ позволяет повысить эффективность в пять-семь раз по таким критериям, как скорость процессов, качество, объективность, экономическая эффективность и персонализация.

ИИ не перестает нас удивлять. Как пример – базовые модели (Foundation models). Одна из них – GPT-3 от компании OpenAI. Это самая крупная и продвинутая языковая модель в мире, использующая глубокое обучение для создания человекоподобного текста. GPT-3 обладает более чем 170 миллиардами параметров. Допустим, она может дописать текст, имея несколько вводных предложений. На основе GPT-3 разработана крупнейшая русскоязычная модель ruGPR-3 от Сбера.

Второй такой моделью является DALL-E, которая по текстовому описанию генерирует изображения: иллюстрации, фото, картины. На основе DALL-E сделана ruDALL-E – модель, обученная Сбером, с помощью которой нейросеть может создать реалистичные изображения.

Foundation models становятся очень популярными, это новый тренд. Однако стоит уточнить: они доступны только очень большим организациям, которые могут инвестировать много ресурсов и сил в данные модели.

Внутри Сбера мы сейчас работаем над Fusion Brain – мультимодальной мета-моделью, способной одновременно решать широкий круг задач и объединяющей в себе NLP (Natural language processing – обработка естественного языка), CV (Computer Vision – компьютерное зрение), Time Series (временной ряд), Audio (голос).

За последние шесть лет Сбербанк прошел путь от уровня Legacy, когда реализовывались точечные проекты по развитию искусственного интеллекта, до AI Native компании, когда мы применяем ИИ как внутри компании для принятия решений, так и для управления экосистемой. Трансформация, произошедшая в Сбере, существенно изменила то, как банк разрабатывает и применяет искусственный интеллект. Среди технологий, которые к настоящему моменту реализованы, можно отметить: кредит за семь минут – эта технология позволяет выдавать кредиты для юридических лиц гораздо быстрее, чем прежде (ранее на обработку и выдачу кредита требовался почти 21 день). Также активно используются виртуальные ассистенты, чат-боты, роботы-юристы, которые обрабатывают документы; биометрия, фото- и видеоаналитика.

Кроме того, у нас применяется семейство виртуальных ассистентов «Салют», они помогают клиентам в приложении «Сбербанк Онлайн».

Активно применяем и биометрию, в том числе для контроля доступа в здание и биометрию клиентов в устройствах самообслуживания – банкоматах.

Хотел бы обратить внимание на финансовый эффект от применения технологий искусственного интеллекта, который мы считаем подтвержденным в Сбере, – в 2021 году он составил 200 миллиардов рублей.

Сбером был создан научно-исследовательский институт искусственного интеллекта. Прорывные исследования Института ИИ сосредоточены на крупномасштабных системах обучения, включающих в себя языковые и мультимодальные модели, а также на вдохновленных логикой и нейробиологией подходах к изучению искусственного интеллекта.

Кроме того, Сбер стал индустриальным партнером для трех вузов, на базе которых создаются исследовательские центры в области искусственного интеллекта, а именно НИУ «ВШЭ», МФТИ и Сколтех. В коллаборации с ними планируем развивать исследовательское направление и инвестировать в него.

Сбер – это еще и центр компетенций по искусственному интеллекту в России. Согласно распоряжению Правительства Российской Федерации от 8 июля 2019 года № 1484‑р, было заключено соглашение между Правительством России и ПАО «Сбербанк». Основные направления работы центра компетенций: поддержка реализации федерального проекта «Искусственный интеллект», внедрение искусственного интеллекта в федеральных органах исполнительной власти, подготовка дата-сетов и организация хакатонов, обучение и популяризация, разработка отраслевых продуктов, методологическая поддержка.

По нашему мнению, искусственный интеллект должен быть контролируемым, прозрачным, предсказуемым, стабильным, надежным, ответственным и непредвзятым. В марте 2021 года мы утвердили принципы этики искусственного интеллекта в Сбере, а в октябре 2021‑го принят Национальный кодекс этики ИИ. Хочу отметить, что главным приоритетом развития технологий ИИ является защита интересов людей, отдельных групп и каждого человека. Технологии ИИ нужно внедрять там, где это принесет пользу людям. Важный принцип, отраженный в Национальном кодексе этики ИИ, – необходимость осознания ответственности при создании и использовании ИИ, ведь ответственность за последствия его применения всегда лежит на человеке. Национальный кодекс этики ИИ закладывает здоровый фундамент для того, чтобы технологии ИИ служили на пользу общества и тех компаний, которые их применяют.

Александр Крайнов, директор по развитию технологий искусственного интеллекта компании «Яндекс»:

– Говоря о новшествах и прорывах, хочу начать с поиска. Качество поиска растет по мере развития технологий, и каждый раз планка поднимается. Когда‑то мы, сотрудники компании, оценивали несколько результатов – этого было достаточно. На тот момент задача машинного обучения, еще очень слабого, заключалась в том, чтобы как‑то попасть в эти результаты.

Потом система становилась сложнее, нам нужно было больше данных, и оценка стала делаться внешними асессорами. Мы стали собирать достаточное количество данных для использования больших систем. Но данных нужно было еще больше, и тогда асессорами стали толокеры – у нас есть платформа «Яндекс. Толока», где любой человек, пройдя небольшое обучение, может выполнять задания и получать за это вознаграждение.

Несколько лет назад благодаря использованию нейронных сетей качество поиска догнало оценки обычных толокеров. Это значит, что результаты поиска уже такие, что их некуда улучшать, если верить оценкам обычных людей. Но мы видели, что поиск еще несовершенен, особенно в тех областях, в которых мы хорошо разбираемся. И тогда толокеры стали сортироваться таким образом, что оценивать эти результаты начали специалисты в какой‑то области. Это новая планка для машинного обучения. Однако сейчас даже этого уже недостаточно – требования к качеству поиска, а значит, и к алгоритмам искусственного интеллекта, такие, что они должны воспроизводить выбор экспертов – не просто специалистов в какой‑то области, а настоящих топовых экспертов. Это сверхтяжелая задача, поскольку экспертных оценок не бывает много. Приходится делать так, чтобы эксперты учили специалистов, а те, в свою очередь, размечали данные, тем самым обучая искусственный интеллект. То есть сейчас планка, которая стоит перед ИИ, – это эксперты. Повторить уровень обычного человека в поиске недостаточно.

Что касается машинного перевода, он тоже прошел через несколько стадий. Когда еще не было никакого ИИ, была простая задача – переводить слова. Для этого системе нужно было просто найти в словаре такое же слово. Затем задача усложнилась – потребовалось переводить текст так, чтобы можно было хоть как‑то понять его смысл. В настоящее время благодаря нейросетям перевод осуществляется таким образом, что невозможно отличить, кто переводил – человек или машина. Текст генерится не просто правильный по смыслу, но и абсолютно корректный с точки зрения языка.

Следующий этап, на который мы перешли в 2021 году, – перевод видеороликов. Нам еще предстоит сделать синхронный перевод в режиме реального времени, а пока есть автоматический перевод, который распознает речь и даже пол говорящего. Мы одними из первых в мире сделали голосовой перевод, что подтверждает: «Яндекс» находится на уровне ведущих мировых компаний в области машинного перевода.

Еще одна история касается беспилотников. Парк «Яндекса» насчитывает 170 беспилотных автомобилей. Наши беспилотники уже проехали больше 17 миллионов километров в автономном режиме по дорогам общего пользования, не считая полигонов. Свыше 24 тысяч поездок совершено без водителей (с инженером на пассажирском сиденье) в Иннополисе.

В 2021 году «выстрелили» роботы-доставщики или, как мы их называем, роверы. В Иннополисе, например, теперь все доставки осуществляются без курьеров. Кроме того, наши роверы работают в Москве, США. Запущен пилотный проект по доставке посылок с «Почтой России». Уже доставлено 70 тысяч заказов. Такого уровня беспилотных доставщиков в мире не очень много. Нас часто спрашивают, может ли ровер ввиду погодных условий доставлять заказы зимой? – да, может. Актов вандализма по отношению к роверам мы еще не встречали, а вот попытки проверить их возможности предпринимаются постоянно.

Сергей Сорокин, генеральный директор ООО «Интеллоджик»:

– Мы одними из первых в России начали развивать проект в области искусственного интеллекта для сферы здравоохранения. Это и хорошо, и плохо: с одной стороны, теперь имеем большой опыт, с другой – наступили на все возможные грабли, которых можно было бы избежать.

Я бы хотел остановиться на технологических проблемах развития искусственного интеллекта для анализа медицинских изображений. Одна из главных – нестабильные результаты анализа изображений в разных клиниках, на разном оборудовании, при разных условиях получения исследований. Вторая проблема – сложности с обеспечением бесшовной интеграции с имеющимися программными и техническими средствами в клиниках, третья – сложности с встраиванием ИИ-технологий в имеющиеся в клиниках процессы.

Наш продукт – платформа анализа медицинской информации Botkin.AI – предназначен в том числе для анализа изображений. Здесь есть два основных показателя – чувствительность (способность алгоритмов не пропустить какие‑то целевые патологии) и специфичность (способность алгоритмов не ошибиться в том, что найденная патология относится к целевой патологии, то есть не является ложным положительным срабатыванием). Если посмотреть результаты работы и достижения врачей-рентгенологов, то у них чувствительность и специфичность находятся на уровне 0,7, это также зависит от патологии и типа изображения. Средние показатели чувствительности и специфичности алгоритмов ИИ при описании КТ несколько другие: чувствительность превышает 0,9, а специфичность, как правило, ниже – менее 0,5. Это «врожденная» проблема искусственного интеллекта.

В своей работе мы делаем фокус на обеспечении эффективного взаимодействия врачей и ИИ для того, чтобы увеличить чувствительность, но не в ущерб специфичности. В чем это выражается: если мы посмотрим, как сейчас диагностируется, например, рак легкого – одного из самых распространенных на данный момент заболевания, то, по данным исследования в рамках международной программы ранней диагностики рака легкого International Early Lung Cancer Action Program (i-ELCAP), практически в 50% случаев рентгенологи не замечают рак легких на ранних стадиях. ИИ помогает не пропустить это заболевание.

Данный пример мы используем для наших проектов по пересмотру большого количества КТ-исследований, которые были сделаны в период пандемии. Мы реализовали несколько проектов в регионах РФ и доказали, что с помощью такого ретроспективного пересмотра можно находить реальные случаи онкологических заболеваний на больших выборках. Инструменты нашей платформы позволяют забирать деперсонифицированные данные из медицинской организации, автоматически анализировать медицинские изображения, выявлять подозрительные зоны, передавать данные для окончательной верификации врачу, формировать отчет. В частности, в России мы пересмотрели более 18 тысяч КТ органов грудной клетки пациентов с подозрением на COVID-19 и нашли свыше 200 реальных кейсов, когда были пропущены случаи злокачественных новообразований. 10 случаев уже подтверждены гистологически, с остальными пациентами с подозрением на ЗНО проводится работа по подтверждению диагноза.

Мы предлагаем масштабировать такие проекты и реализуем уже подобные проекты за рубежом.

Елена ВОСКАНЯН