Сбер улучшил ИИ "Гигачат": поддержка 30 языков народов СНГ
В пресс-службе Сбера ТАСС сообщили об обновлении технологии ИИ-помощника "Гигачат", который теперь способен более эффективно обрабатывать и генерировать текст на более чем 30 языках народов России и стран СНГ. Среди них выделяются такие языки, как татарский, башкирский, чувашский, удмуртский, якутский, бурятский, осетинский, чеченский и карачаево-балкарский.
Общая языковая палитра "Гигачата" охватывает свыше 40 языков, включая международные. Для каждого языка требовалась целенаправленная настройка модели. Обучение включало использование множества источников, объём которых насчитывал от сотен тысяч до миллионов текстовых документов. Реализация поддержки осуществлена в текстовом формате, а в процессе разметки и оценки качества активно участвовали носители языков.
Ранее Сбер также анонсировал модель "Гигачат ультра" с улучшенной функцией долгосрочной памяти. Это программное обеспечение было разработано с нуля российскими специалистами на внутренней инфраструктуре компании. В сборе данных приняли участие:
- ФГБУ "Дом народов России"
- интернет-энциклопедия "Рувики"
- региональные академии наук
- научные и образовательные организации
- некомерческие фонды
