
Компания Microsoft решила проверить, насколько эффективно искусственный интеллект может справляться с рутинными офисными задачами. Для этого был разработан специальный бенчмарк DELEGATE-52, который включает в себя типичные рабочие процессы 52 профессий «белых воротничков». Задачи были стандартными: сортировка документов по категориям и последующая сборка информации обратно в файлы. Результаты тестирования оказались неутешительными для сторонников полной автоматизации офисной работы.
Нейросети продемонстрировали крайне низкую точность: средний процент потерь данных составил от 25% до 50%. ИИ не только пропускал важные детали, но и активно «додумывал» отсутствующую информацию, что приводило к искажению файлов. При этом исследователи отметили, что чем сложнее задача и чем больше времени требовалось на её выполнение, тем хуже становились результаты. Это ставит под сомнение перспективы полной замены сотрудников на их рабочих местах.
Ситуацию усугубило ещё одно исследование, опубликованное на той же неделе. Оно показало, что время, которое компании экономят, передавая задачи нейросетям, фактически уходит на проверку и исправление ошибок, допущенных ИИ. Таким образом, вместо повышения производительности автоматизация приводит к дополнительным трудозатратам. Эксперты шутят, что в ближайшее время людей заменят не нейросети, а аутсорсинговые команды из других стран.
Эксперимент Microsoft стал очередным напоминанием о том, что искусственный интеллект пока не готов полностью заменить человека в офисной работе. Даже в простых задачах, требующих минимальной логики и внимания к деталям, нейросети демонстрируют удручающе низкие результаты. Это заставляет компании пересматривать стратегии автоматизации и искать баланс между использованием ИИ и сохранением человеческого контроля над процессами.


