Сегодня 03 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → berrylm

ИИ-модель Wildberries вошла в топ-3 русскоязычного бенчмарка MERA

Большая языковая модель BerryLM-XL, которая была дообучена специалистами RWB, вошла в тройку лидеров текстового рейтинга русскоязычного бенчмарка MERA. По итогам тестирования алгоритм получил интегральную оценку 0,835. Для сравнения, эталонная оценка на основе ответов людей на аналогичные вопросы Human Benchmark составляет 0,852.

 Источник изображения: Steve Johnson / Unsplash

Источник изображения: Steve Johnson / Unsplash

В настоящее время BerryLM-XL расположилась на третьем месте общего рейтинга MERA и на втором среди ИИ-моделей. Оценка алгоритма сформирована по результатам выполнения 15 заданий, предназначенных для проверки работы с русскоязычным текстом, оценке знаний, логики и прикладных навыков. В первую пятёрку также вошла созданная RWB модель BerryLM-v2 — она заняла пятое место с оценкой 0,810.

ИИ-модели семейства BerryLM используются в продуктах Wildberries, включая ИИ-ассистента для покупателей, а также инструменты сравнения и поиска товаров. В дополнение к этому модели интегрированы в инструменты для продавцов. Они помогают формировать ответы на отзывы и вопросы пользователей. Параллельно с этим ИИ-алгоритмы помогают автоматизировать внутренние процессы RWB. По оценке компании, совокупный эффект от использования ИИ-инструментов на базе моделей BerryLM превышает 1 млрд рублей дополнительной выручки в год.


window-new
Soft
Hard
Тренды 🔥
Bandai Namco подтвердила цену DLC с новым контентом из версии Elden Ring для Switch 2 — мнения игроков разделились 20 мин.
Cloudflare объявила войну ИИ-ботам — теперь они будут блокироваться по умолчанию 49 мин.
Microsoft создала подразделение Frontier Company для предоставления услуг по внедрению ИИ 2 ч.
Встраиваемые системы становятся главным фронтом ИТ-суверенитета России 2 ч.
Meta без лишнего шума выпустила мобильное приложение Pocket для вайб-кодинга игр на ходу 2 ч.
Улучшения производительности, меньше вылетов и никаких телепортирующихся NPC: для ремейка «Готики» вышло обновление 1.0.3 3 ч.
Meta вложила миллиарды в ИИ, но Цукерберг признал: агенты не спешат умнеть 3 ч.
Сливший iOS 26 до анонса блогер свалил вину на своего сообщника 3 ч.
«Время — это конструкт»: научно-фантастический триллер Ontos от создателей Amnesia и Soma перенесли на 2027 год 4 ч.
Citrix анонсировала XenServer 9 — альтернативу решениям VMware 4 ч.
Предел терпения достигнут: цены на память продолжат расти и в третьем квартале, но не так быстро 45 мин.
До встречи в августе: Starship зажёг все шесть двигателей при подготовке к 13-му тестовому полёту 49 мин.
Российские двигатели в последний раз доставили на орбиту пакет спутников Amazon Leo на ракете Atlas V 52 мин.
Самым популярным смартфоном в российской рознице в этом году стал iPhone 17 3 ч.
Учёные вдохновились пустельгой и разработают дрон, противостоящий порывам ветра 4 ч.
2 июля начали принимать работы для участия в фотоконкурсе «Снято на Camon» компании Tecno 4 ч.
Квартальные продажи Ethernet-коммутаторов взлетели на 40 %, а NVIDIA выбилась в лидеры в ЦОД-сегменте 5 ч.
Илон Маск признался, что объёмы выпуска роботов Tesla Optimus на первых порах будут скромными 6 ч.
Kioxia начала поставлять образцы передовой 332-слойной памяти 3D NAND десятого поколения 7 ч.
Новая статья: Снято в Голливуде? Почему Стэнли Кубрик физически не смог бы подделать лунную походку 12 ч.