YandexGPT — нейросеть семейства GPT от компании «Яндекс», которая может создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы с пользователем.
Для обучения YandexGPT используется датасет, включающий в себя информацию из книг, журналов, газет и других открытых источников из интернета. Нейросеть может ошибаться в фактах и фантазировать, однако по мере обучения будет выдавать всё более точные ответы.
В феврале 2023 года «Яндекс» сообщил, что разрабатывает собственную версию генеративной нейросети ChatGPT в рамках развития языковой модели из семейства YaLM (Yet another Language Model).Проект получил предварительное название YaLM 2.0, которое впоследствии поменяли на YandexGPT.
17 мая компания представила нейросеть под названием YandexGPT (YaGPT), добавив в своего виртуального ассистента «Алису» специальный навык, позволяющий взаимодействовать с новой языковой модель.
5 июня 2023 года в пресс-службе «Яндекса» сообщили, что нейросеть научилась запоминать контекст беседы и задавать уточняющие вопросы.
15 июня 2023 года «Яндекс» добавил языковую модель YandexGPT в приложение для генерации изображений «Шедеврум». Благодаря этому его пользователи получили возможность создавать содержательные посты с текстом, заголовком и подходящей по смыслу иллюстрацией.
27 июня в «Яндексе» сообщили, что нейросеть научилась тезисно пересказывать статьи из интернета. Функция работает с русскоязычными текстами и статьями из интернета объёмом до 30 тысяч знаков.
В июле 2023 года нейросеть YandexGPT стала доступна бизнесу для создания виртуальных ассистентов и чат-ботов, а также генерирования и структурирования текстовой информации.
7 сентября 2023 года «Яндекс» представил на конференции Practical ML Conf новую версию языковой модели — YandexGPT 2. По сравнению с предыдущей она способна решать больше видов задач, при этом качество её ответов улучшилось. По утверждению разработчиков, YandexGPT 2 отвечает на запросы пользователей лучше первой версии нейросети в 67 % случаев.
14 сентября 2023 года «Яндекс» начал тестировать YandexGPT для создания быстрых ответов на запросы в «Поиске». Нейросеть в режиме реального времени находит несколько самых подходящих источников по запросу пользователя, делает краткую выжимку каждого из них, а затем выбирает наиболее полезный ответ из получившихся. Он отображается под поисковой строкой вместе со ссылкой на источник.
С 6 октября 2023 года YandexGPT может создавать краткие пересказы русскоязычных видеороликов в интернете. Она обобщает видео длиной от двух минут до четырёх часов, в которых есть речь.
В декабре 2023 года Яндекс Казахстан открыл доступ к YandexGPT API для казахстанских компаний.
28 марта 2024 года Yandex запустил третье поколение нейросетей YandexGPT. Первая версия — YandexGPT 3 Pro предназначена для бизнеса и доступна пользователям Yandex Cloud. По словам разработчиков, на тестах YandexGPT 3 Pro в среднем отвечает лучше, чем YandexGPT 2 в 67 % случаев, а при работе с простыми пользовательскими запросами её результаты оказались выше на 69 %.
28 мая 2024 года вышло третье поколение облегчённой версии нейросети YandexGPT Lite.
24 октября 2024 года появилось четвёртое поколение нейросети — YandexGPT 4, включающее облегчённую модель Lite и мощную Pro.
16 апреля 2024 года Яндекс представил сервис «Нейро», он объединяет в себе возможности традиционных поисковых технологий и больших языковых генеративных моделей. В «Нейро» пользователь может задать системе любой вопрос простыми словами, YandexGPT 3 проанализирует поисковую выдачу Яндекса по запросу и объединит найденную информацию в одном сообщении со ссылками на источники. Взаимодействие с сервисом ведется в формате диалога, заданный ранее вопрос можно уточнить, а так же его можно дополнить картинкой.
Обучение проходит в несколько этапов:
1. Pretraining. Модель учит структуру языка и запоминает факты о мире. Ей подаются в обучение терабайты текста из интернета, книг и других общедоступных источников, отобранные с помощью поисковых моделей «Яндекса» и разбитые на небольшие фрагменты (токены).
2. Fine-tuning. Эксперты оптимизируют миллиарды параметров модели, собирая большой датасет из сотен тысяч примеров максимально разнообразных задач с хорошими ответами.
Созданием качественных обучающих примеров занимаются AI-тренеры «Яндекса». Это эксперты широкого круга гуманитарных профессий: журналисты, педагоги, филологи, редакторы, социологи, психологи, филологи. «Яндекс» стал первой в России компанией, которая начала нанимать и обучать таких специалистов.
3. Продуктовые доработки. Модели придают «человеческий характер», чтобы она могла отвечать на вопросы о себе и была более живой в общении.
Для обучения YandexGPT используются суперкомпьютеры «Яндекса».
В октябре 2023 года YandexGPT 2 смогла сдать ЕГЭ по литературе на 55 баллов. При этом минимальный порог, необходимый для поступления в вуз, — 40 баллов. Это первый случай в России, когда искусственный интеллект успешно справился с ЕГЭ, ответив не только на вопросы тестов, но и выполнив творческие задания.
источник -
здесь