Российские учёные доказали склонность LLM к поддакиванию и научили модели говорить «нет»

Исследование российских учёных показало, что популярные большие языковые модели склонны соглашаться с неверными выводами пользователей. Специалисты из R&D-центра Т-Технологий предложили метод коррекции без переобучения.

Российские учёные доказали склонность LLM к поддакиванию и научили модели говорить «нет» Читать дальше