Alibaba Group представила первую универсальную модель машинного обучения LOGOS, которая объединяет в себе возможности работы с белками, антителами, малыми молекулами, химическими реакциями и материалами. До сих пор для каждой из этих задач требовались отдельные специализированные инструменты, но LOGOS способна выполнять их все в рамках единой архитектуры.
Основная инновация заключается в том, что модель использует единое дискретное пространство токенов для кодирования различных объектов и их взаимодействий. Это позволяет LOGOS не только предсказывать молекулы-лиганды, способные связываться с заданным белком, но и находить участки связывания на белках, проектировать антитела, генерировать новые материалы и даже дорабатывать белки под нужные свойства.
Метод, использованный в LOGOS, получил название «научная грамматика». Он заключается в согласовании предсказания следующего токена во время обучения с целями генерации в последующих задачах. Это обеспечивает интероперабельность и синергию знаний между различными модальностями.
Корпус обучения модели составил 44 миллиарда токенов из семи типов научных данных. В тестах LOGOS продемонстрировала выдающиеся результаты: версия LOGOS-1B превзошла модель NatureLM (8×7B) в задаче генерации молекул, LOGOS-8B обошла профильные решения в генерации металл-органических каркасов по всем метрикам, а в проектировании участков антител заняла первое место по точности восстановления аминокислот.
В релизе представлено четыре модели: три базовые претрейн-версии с 1, 3 и 8 миллиардами параметров, а также LOGOS-8B — версия после SFT (Supervised Fine-Tuning) для прикладных задач. Все модели доступны под лицензией Apache 2.0.
LOGOS может стать прорывом для биотехнологий и химии, где традиционно используются узкоспециализированные инструменты. Её универсальность и высокая точность открывают новые возможности для ускоренного проектирования лекарств, материалов и биоинженерных решений.
Проект уже привлек внимание исследователей, и его код доступен на GitHub, что позволяет ученым и разработчикам интегрировать LOGOS в свои работы и адаптировать её под специфические задачи.


