Мультиагентные AI-системы в здравоохранении работают точнее и дешевле одиночных агентов — исследование Mount Sinai
Мультиагентные AI-системы в здравоохранении превосходят одиночных агентов по точности, скорости и стоимости
Когда искусственный интеллект начинают применять не в лабораторной тишине, а в реальной клинической среде, быстро выясняется одна простая вещь: нагрузка там совсем не игрушечная. Сегодня AI в здравоохранении уже помогает с медицинскими записями, поиском данных, расчетом дозировок и поддержкой принятия решений. Но главный вопрос, по сути, звучит так: что будет, если все это навалится одновременно?
Исследователи из Icahn School of Medicine at Mount Sinai пришли к выводу, что дело не только в мощности модели. Куда важнее архитектура. Новая работа, опубликованная 9 марта в npj Health Systems, показывает: в условиях клинической нагрузки оркестрированные мультиагентные системы заметно устойчивее, чем один универсальный агент.
Иначе говоря, когда задачи распределяются между несколькими специализированными AI-агентами, а не сваливаются на одного «мастера на все руки», система работает ровнее. И быстрее. И, что для больниц совсем не мелочь, дешевле по вычислительным затратам. Это особенно важно для организаций, которые рассматривают разработку AI-агентов и автоматизацию как часть клинической или операционной трансформации.
«Для медицинских организаций наши результаты указывают на более разумный способ внедрения AI», — отметил старший автор исследования Girish N. Nadkarni, MD, MPH, заведующий Windreich Department of Artificial Intelligence and Human Health, директор Hasso Plattner Institute for Digital Health, профессор медицины Icahn School of Medicine и Chief AI Officer в Mount Sinai Health System. По его словам, если поручать отдельным агентам разные функции — например, поиск сведений о пациенте, извлечение данных или проверку дозировок, — система становится надежнее и лучше держит удар под нагрузкой.
Собственно, в этом и суть. Не один агент, который пытается делать все сразу, а координируемая команда. Такой подход близок к тому, что в корпоративной практике называют мультиагентными системами: есть центральный оркестратор, есть специализированные исполнители, и у каждого — своя зона ответственности.
В исследовании сравнивались две схемы клинического AI. Первая — единая система, которая берет на себя множество разных задач. Вторая — сеть специализированных агентов под управлением центрального оркестратора. Команда использовала современные языковые модели и тестировала их на типичных клинических сценариях: поиск информации, извлечение данных, расчеты дозировок лекарств. Все это прогоняли в условиях, приближенных к реальности, с нагрузкой до 80 одновременных задач.
«Мы увидели, что AI-системы в каком-то смысле ведут себя почти по-человечески, — сказал ведущий автор исследования Eyal Klang, MD, ранее работавший в Icahn School of Medicine. — Когда одну систему заставляют делать слишком много разнородных вещей сразу, качество начинает проседать. А вот когда оркестратор распределяет работу между специализированными агентами, система остается точной, отзывчивой и заметно более эффективной».
Ключевой результат звучит весьма жестко: координируемая мультиагентная система сохраняла более высокую точность и при этом требовала до 65 раз меньше вычислительных ресурсов, чем архитектура с одним агентом. Да, цифра внушительная. И, честно говоря, для клинической среды это уже не академическая тонкость, а вполне прикладной аргумент.
Исследователи отдельно подчеркивают, что моделировали не стерильный тестовый стенд, а клинический «трафик» — ситуацию, в которой одновременно поступают разные типы запросов и конкурируют за ресурсы системы. Именно в таких условиях становится особенно заметно, насколько важна архитектура AI-агентов, а не только качество базовой модели.
«Умная координация — это не просто техническая деталь, — отметил Dr. Klang. — Во многих случаях именно она определяет, продолжит ли AI-система работать стабильно или начнет сбоить под давлением реальной клинической нагрузки».
Следующий этап — проверка этих систем уже в клинической практике, с использованием данных пациентов в реальном времени. Если результаты подтвердятся, подход может заметно повлиять на то, как больницы будут масштабировать AI: без провалов в качестве, без лишних задержек и, что особенно важно, без компромиссов по безопасности.
И вот тут начинается самое интересное. Авторы прямо говорят: преимущества не возникают сами собой. Даже очень сильный AI может разочаровать, если он плохо спроектирован, непрозрачен или внедрен на скорую руку. В здравоохранении это особенно критично — там, знаете ли, цена ошибки не абстрактная.
«Здравоохранение не живет по принципу “одна задача за раз”», — подчеркнул Dr. Nadkarni. По его словам, больницы постоянно работают с пересекающимися потоками запросов, особенно в напряженные периоды. Поэтому будущее клинического AI, вероятно, связано не с одной сверхуниверсальной системой, а с координируемой командой специализированных агентов, способных безопасно масштабироваться, контролировать затраты и поддерживать реальные рабочие процессы.
Второй автор исследования, Mahmud Omar, MD, добавил еще один важный аспект — наблюдаемость и аудит. Если один агент делает все подряд, понять, где именно произошел сбой, почти нереально. А когда есть оркестратор, каждый шаг можно отследить: какой инструмент вызвали, что он вернул, как был собран итоговый ответ. В медицине такая прозрачность — не роскошь, а необходимость. По сути, речь идет о требованиях к безопасности AI-агентов и пригодности системы к аудиту.
По словам Dr. Omar, при 80 одновременных задачах точность одиночного агента снижалась до 16 процентов, при этом он потреблял в 65 раз больше вычислительных ресурсов. И если бы такая система ошибалась в реальной среде, быстро установить причину было бы крайне трудно. Ну а в клинике подход «разберемся потом» — мягко говоря, так себе стратегия.
Авторы также отмечают, что agentic AI уже выходит за рамки исследовательских концепций. Автономные и полуавтономные инструменты постепенно попадают в руки клиницистов и пациентов, а значит, требования к контролю, журналированию действий, политике доступа и соответствию нормативным ожиданиям становятся только жестче. Для таких сценариев особенно важны AI compliance и соответствие требованиям, включая возможность аудита, объяснимость и управляемость решений.
Статья опубликована под названием Orchestrated multi-agent systems sustain accuracy under clinical-scale workloads compared to a single agent.
Авторы исследования, согласно публикации в журнале: Eyal Klang, Mahmud Omar, Ganesh Raut, Reem Agbareia, Prem Timsina, Robert Freeman, Lisa Stump, Alexander Charney, Benjamin S. Glicksberg, Girish N. Nadkarni.
Работа была частично поддержана грантом Clinical and Translational Science Awards (CTSA) UL1TR004419 от National Center for Advancing Translational Sciences. Дополнительная поддержка была предоставлена Office of Research Infrastructure при National Institutes of Health в рамках грантов S10OD026880 и S10OD030463.
Подробнее о новостях в области искусственного интеллекта в Mount Sinai: https://icahn.mssm.edu/about/artificial-intelligence.
О Windreich Department of AI and Human Health в Mount Sinai
Под руководством Girish N. Nadkarni, MD, MPH, Windreich Department of AI and Human Health в Mount Sinai стал первым подразделением такого типа в медицинской школе США. Его задача — продвигать безопасное, эффективное и этичное применение искусственного интеллекта в исследованиях, клинической практике, образовании и операционной деятельности.
Подразделение объединяет сильную AI-экспертизу, вычислительную инфраструктуру и доступ к многомасштабным и мультимодальным данным, чтобы ускорять тестирование, валидацию и внедрение новых решений в практику. Важную роль в этой экосистеме играет сотрудничество с Hasso Plattner Institute for Digital Health at Mount Sinai.
В 2024 году AI-приложение NutriScan, разработанное командой Clinical Data Science в партнерстве с преподавателями подразделения, принесло Mount Sinai Health System премию Hearst Health Prize. Решение предназначено для ускоренного выявления и лечения недоедания у госпитализированных пациентов и демонстрирует прикладную ценность AI в здравоохранении.
Дополнительная информация: ai.mssm.edu.
О Hasso Plattner Institute for Digital Health at Mount Sinai
Hasso Plattner Institute for Digital Health at Mount Sinai использует инструменты data science, биомедицинской и цифровой инженерии, а также клиническую экспертизу для улучшения качества и продолжительности жизни пациентов. Институт создан как партнерство между Hasso Plattner Institute for Digital Engineering в Потсдаме и Mount Sinai Health System.
Под руководством Girish Nadkarni, MD, MPH, и профессора Lothar Wieler институт развивает инициативы, направленные на цифровую трансформацию здравоохранения и создание решений, которые реально влияют на опыт пациентов и результаты лечения.
Исследовательские программы института, включая направления machine learning, сосредоточены на совершенствовании диагностики и терапии.
Об Icahn School of Medicine at Mount Sinai
Icahn School of Medicine at Mount Sinai известна своими программами в области исследований, образования и клинической помощи. Это академический партнер семи больниц Mount Sinai Health System — одной из крупнейших академических систем здравоохранения в США.
Школа реализует программы MD, PhD, MD-PhD и магистерские программы, в которых обучаются более 1 200 студентов. Кроме того, в системе проходит подготовку более 2 600 клинических ординаторов и fellows. Graduate School of Biomedical Sciences ведет 13 программ с присуждением степеней и обучает более 560 постдокторантов.
По объему финансирования от NIH Icahn School of Medicine at Mount Sinai занимает 11-е место в США. Более 4 500 ученых, преподавателей и клиницистов работают в междисциплинарной среде, ориентированной на трансляционные исследования и терапевтические разработки.
* Больницы Mount Sinai Health System: The Mount Sinai Hospital; Mount Sinai Brooklyn; Mount Sinai Morningside; Mount Sinai Queens; Mount Sinai South Nassau; Mount Sinai West; New York Eye and Ear Infirmary of Mount Sinai.
О Mount Sinai Health System
Mount Sinai Health System — одна из крупнейших академических медицинских систем Нью-Йорка. В нее входят семь больниц, более 400 амбулаторных практик, свыше 600 исследовательских и клинических лабораторий, школа сестринского дела, медицинская школа и масштабная система последипломного образования.
Система объединяет клиническую помощь, науку и обучение, чтобы решать сложные задачи современного здравоохранения: от разработки новых методов лечения до подготовки будущих лидеров медицины. В центре подхода — пациент, а среди ключевых инструментов развития — искусственный интеллект, медицинская информатика и data-driven практики.
Дополнительная информация: https://www.mountsinai.org/.
