DeepMind закрыл 9 задач Эрдёша: как AlphaProof Nexus меняет математику и программирование


DeepMind закрыл 9 задач Эрдёша: как AlphaProof Nexus меняет математику и программирование

Google DeepMind сделал прорыв, который может перевернуть не только математику, но и инженерные процессы в программировании, криптографии и формальной верификации. Их новая система AlphaProof Nexus не просто генерирует доказательства — она закрывает их в формализованном виде, где каждая логическая цепочка проверяется автоматически через компилятор Lean. Это не первый случай, когда искусственный интеллект берётся за решение математических задач, но впервые модель смогла автономно закрыть 9 открытых проблем Эрдёша — часть из которых висела десятилетиями.

Самое удивительное в этом не только количество решённых задач, но и их стоимость. По оценкам авторов, одно доказательство обошлось в несколько сотен долларов — сумма, которая для ручного труда математиков была бы нереальной. Система не просто генерирует идеи, но и взаимодействует с Lean как с внешним проверяющим: если логическая цепочка некорректна, она не проходит компиляцию. Это убирает необходимость в ручной экспертизе, где ошибки часто остаются незамеченными из-за сложности текста.

Но AlphaProof Nexus работает не только как решатель задач. Он также выявляет неточности в уже существующих математических формулировках — то есть действует как диагностический инструмент для самой постановки проблемы. Например, модель нашла новый алгоритмический параметр в оптимизационной теории, который ранее не был описан человеком. Это говорит о том, что система не просто повторяет известные шаблоны, но и генерирует принципиально новые подходы.

Однако есть и ограничения. Система пока эффективна только в областях, где библиотека Lean уже достаточно развита — комбинаторика, теория чисел, оптимизация. Задачи, требующие построения обширной новой теории, остаются вне её досягаемости. Более того, большинство задач Эрдёша она не решила — это лишь первые шаги. Но даже текущие результаты показывают, что простые циклы «сгенерировал — проверил — исправил» начинают догонять специализированные архитектуры по эффективности.

Интересно, что подход AlphaProof Nexus применим не только к математике. Он может использоваться в верификации кода, спецификациях программ, проверке криптографических протоколов и даже компиляторов. Формальная проверка через Lean отсекает галлюцинации моделей — те самые «известные результаты», которые на самом деле не существуют, или ложные леммы, которые легко пропустить в текстовом формате. Это принципиально меняет подход к автоматизации доказательств и проверки логики.

Базовая версия агента, чередующая генерацию LLM и обратную связь от компилятора, смогла повторить все 9 успешных решений. Более сложная версия с эволюционным поиском и reinforcement learning показала выигрыш только на самых сложных задачах. Это говорит о том, что для многих применений достаточно простых итеративных циклов, а сверхсложные сценарии всё ещё требуют дополнительных механизмов.

Главное отличие AlphaProof Nexus от неформальных подходов — это отсутствие «человеческого фактора» в проверке. В традиционных доказательствах ошибки часто остаются незамеченными, потому что сложно проверить каждую деталь вручную. Lean же отсекает их автоматически, что делает процесс не только быстрее, но и надёжнее. Это может стать стандартом не только для математики, но и для любой области, где важна безошибочная логика — от блокчейна до авиационного программного обеспечения.

Автор

  • фото сергей сергеев

    Сергей Сергеев — практикующий трейдер и автор FinTerminal. С 2013 года работает с Forex, криптовалютами и акциями, анализируя рыночные риски, волатильность, исполнение сделок и поведение цены в новостные периоды. В материалах сочетает собственный торговый опыт, статистику рынков и проверку условий брокеров для частных трейдеров и инвесторов. При подготовке публикаций опирается на данные регуляторов, рыночную статистику, биржевые котировки и публичные условия брокеров, отдельно отмечая риски, ограничения и спорные моменты, которые важно проверить перед принятием решения.

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Прокрутить вверх