Top.Mail.Ru

Университет МИСИС примет участие в развитии GigaChat

Сбер определил список академических команд, которым будет предоставлена возможность для проведения экспериментов с дообучением и донастройкой нейросетевых моделей, на базе которых работает GigaChat. Команды вузов, отобранные экспертами Сбера, в число которых вошла объединенная команда студентов НИТУ МИСИС и МГУ имени М.В. Ломоносова, получат доступ к платформе ML Space и ресурсы, необходимые для экспериментов.

Основная задача, которую поставила перед собой сборная Университета МИСИС и МГУ имени М.В. Ломоносова, — научить языковую модель корректно цитировать заслуживающие доверия источники. При помощи платформы ML Space студенты планируют научить языковую модель подкреплять свои слова цитатами и ссылками так, как это принято делать в научных публикациях.

Цитирование в научных работах — это отдельное языковое явление, структура которого сложнее линейного текста. Цитирование — это взаимосвязь между текстами, оно бывает дословным, но чаще всего это парафраз, для которого в цитируемом документе, существует близкий фрагмент, но его местоположение неизвестно.

Источником текстовых данных для обучения навыку цитирования станут коллекции научных публикаций. В планах команды — дообучить большую языковую модель на англоязычной коллекции Semantic Scholar и русскоязычной коллекции научной электронной библиотеки eLibrary, научившись при этом моделировать цитирование в явном виде. То есть, места в тексте с добавлением дословного цитирования и цитирования со ссылкой будут отмечаться специальными токенами.

В дальнейшем студенты планируют получить модель, способную по контексту давать адекватную цитату и ссылку на научную публикацию на русском или английском языке.

В состав команды от Университета МИСИС вошли студенты Института компьютерных наук Данило Малбашич, Даниил Стрижаков и Егор Коновалов, также являющийся сотрудником Лаборатории компьютерного моделирования новых материалов. Научный руководитель команды профессор РАН, д.ф.-м.н., Константин Воронцов.

В список также вошли команды из представителей НИУ ВШЭ, РАНХиГС, Университета Иннополис, Петрозаводского государственного университета и гимназии № 63 Санкт-Петербурга.

Андрей Белевцев, старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка: «Вовлечение академического сообщества в совместные исследования и разработки является важнейшим элементом построения надёжного и этичного искусственного интеллекта. Поэтому я благодарю всех, кто подал заявки на участие в нашем отборе, и поздравляю победителей. Теперь вы станете частью команды, которая работает над совершенствованием одного из самых прорывных решений в области технологий искусственного интеллекта. Уверен, что вместе мы сможем расширить возможности GigaChat и сделать его одним из сильнейших сервисов в мире. Хочу подчеркнуть, что этот конкурс лишь начало такой работы. Мы планируем ещё больше вовлекать вузы в нашу работу».

Опыт реализации пилотного проекта обсудили на аналитической сессии Минобрнауки РоссииОпыт реализации пилотного проекта обсудили на аналитической сессии Минобрнауки России
Процесс пайки до нанесения покрытия на аддитивный протезПроцесс пайки до нанесения покрытия на аддитивный протез
Открытка с Днём защитника ОтечестваОткрытка с Днём защитника Отечества