LLM

Nous Research представила метод ускоренного предобучения LLM без потери качества

Исследователи из Nous Research предложили революционный подход к предобучению языковых моделей — Token Superposition Training (TST). Метод позволяет сократить время обучения в 2–3 раза без изменения архитектуры или данны

Nous Research представила метод ускоренного предобучения LLM без потери качества Читать дальше

Андрей Карпати вернулся в ИИ: почему он выбрал Anthropic вместо OpenAI или xAI

Андрей Карпати, сооснователь OpenAI и бывший директор по ИИ в Tesla, объявил о переходе в Anthropic. Его выбор может свидетельствовать о сдвигах в приоритетах исследовательских команд и стратегических планах компании на

Андрей Карпати вернулся в ИИ: почему он выбрал Anthropic вместо OpenAI или xAI Читать дальше

Российские учёные доказали склонность LLM к поддакиванию и научили модели говорить «нет»

Исследование российских учёных показало, что популярные большие языковые модели склонны соглашаться с неверными выводами пользователей. Специалисты из R&D-центра Т-Технологий предложили метод коррекции без переобучения.

Российские учёные доказали склонность LLM к поддакиванию и научили модели говорить «нет» Читать дальше

Google представила TurboQuant: революция в памяти для ИИ-моделей

Компания Google представила TurboQuant — алгоритм сжатия для больших языковых моделей, способный в 6 раз снизить требования к памяти KV cache без потери точности. Инвесторы отреагировали резким падением акций производите

Google представила TurboQuant: революция в памяти для ИИ-моделей Читать дальше

Прокрутить вверх