ИИ провалил тест на замену офисных работников: Microsoft проверил нейросети на бенчмарке DELEGATE-52

Компания Microsoft решила проверить, насколько эффективно искусственный интеллект может справляться с рутинными офисными задачами. Для этого был разработан специальный бенчмарк DELEGATE-52, который включает в себя типичные рабочие процессы 52 профессий «белых воротничков». Задачи были стандартными: сортировка документов по категориям и последующая сборка информации обратно в файлы. Результаты тестирования оказались неутешительными для сторонников полной автоматизации офисной работы.

Нейросети продемонстрировали крайне низкую точность: средний процент потерь данных составил от 25% до 50%. ИИ не только пропускал важные детали, но и активно «додумывал» отсутствующую информацию, что приводило к искажению файлов. При этом исследователи отметили, что чем сложнее задача и чем больше времени требовалось на её выполнение, тем хуже становились результаты. Это ставит под сомнение перспективы полной замены сотрудников на их рабочих местах.

Ситуацию усугубило ещё одно исследование, опубликованное на той же неделе. Оно показало, что время, которое компании экономят, передавая задачи нейросетям, фактически уходит на проверку и исправление ошибок, допущенных ИИ. Таким образом, вместо повышения производительности автоматизация приводит к дополнительным трудозатратам. Эксперты шутят, что в ближайшее время людей заменят не нейросети, а аутсорсинговые команды из других стран.

Эксперимент Microsoft стал очередным напоминанием о том, что искусственный интеллект пока не готов полностью заменить человека в офисной работе. Даже в простых задачах, требующих минимальной логики и внимания к деталям, нейросети демонстрируют удручающе низкие результаты. Это заставляет компании пересматривать стратегии автоматизации и искать баланс между использованием ИИ и сохранением человеческого контроля над процессами.

Автор

Сергей Сергеев

Сергей Сергеев — практикующий трейдер и автор FinTerminal. С 2013 года работает с Forex, криптовалютами и акциями, анализируя рыночные риски, волатильность, исполнение сделок и поведение цены в новостные периоды. В материалах сочетает собственный торговый опыт, статистику рынков и проверку условий брокеров для частных трейдеров и инвесторов. При подготовке публикаций опирается на данные регуляторов, рыночную статистику, биржевые котировки и публичные условия брокеров, отдельно отмечая риски, ограничения и спорные моменты, которые важно проверить перед принятием решения.

ИИ провалил тест на замену офисных работников: Microsoft проверил нейросети на бенчмарке DELEGATE-52

Автор

Сейчас читают

Оставьте комментарий Отменить ответ

ИИ провалил тест на замену офисных работников: Microsoft проверил нейросети на бенчмарке DELEGATE-52

Автор

Сейчас читают

По теме

Оставьте комментарий Отменить ответ