Модели GigaChat Pro и GigaChat Lite стали умнее и мощнее по всем основным метрикам для решения задач всех пользователей. Об этом рассказали в Сбере. Также теперь бизнесу доступна новая модель GigaChat Lite+ с заметно увеличенным контекстом.
Команда разработчиков обновила и расширила обучающие датасеты, что значительно повысило качество ответов моделей в таких областях как экономика, право и медицина. Также модели прошли обучение на базе знаний реальных экспертов, в том числе редакторов и художников, благодаря чему улучшился навык создания изображений с помощью Kandinsky.
Видео дня
Размер контекста GigaChat Lite и GigaChat Pro увеличен в два раза — с четырех до восьми тысяч токенов. Если раньше в один запрос можно было загрузить объем текста, сопоставимый с шестью страницами A4 (шрифт 14 pt), то теперь максимальный объем запроса вырос до 12 страниц. Увеличение контекста позволяет моделям поддерживать более длинные диалоги с пользователем и получать в одном запросе больший объем полезной информации.
GigaChat Lite подойдет для решения более тривиальных задач, требующих при этом максимальной скорости работы модели и меньших требований к «железу». Новая модель GigaChat Lite+ по всем метрикам совпадает с GigaChat Lite, но размер ее контекста расширен до 32 тыс. токенов. GigaChat Pro лучше следует сложным инструкциям и может выполнять более комплексные задачи.
В GigaChat API появилась возможность формировать векторное представление текстов — эмбеддинги. Эмбеддинги используются для оценки смысловой схожести текстов, повышения точности ответов языковой модели и упрощения решения задач поиска и классификации информации.
«Сегодня искусственный интеллект повсеместно проникает в нашу жизнь и применяется в абсолютно разнообразных сферах — от медицины до финансовой отрасли. Его потенциал практически безграничен, а влияние на привычные процессы становится все более заметным. Учитывая разные категории пользовательских запросов, мы обновили передовые модели GigaChat Pro и GigaChat Lite, а также выпустили для бизнеса модель GigaChat Lite+, которая имеет заметно увеличенный контекст. С каждым новым этапом развития наших генеративных языковых моделей, мы стремимся к тому, чтобы миллионы пользователей получили еще более совершенный инструмент как для эффективной автоматизации бизнес процессов, так и повышения собственной производительности», — рассказал Денис Филиппов, вице-президент по Цифровым поверхностям «Салют» Сбербанка.