Сегодня 03 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba представила ИИ-генератор изображений Qwen-Image с высокой степенью грамотности

Alibaba представила модель искусственного интеллекта Qwen-Image 20B MMDiT, предназначенную для работы с изображениями — в ней разработчик значительно улучшил механизмы прорисовки сложных текстов и реализовал возможности точного редактирования изображений.

 Источник изображения: huggingface.co/Qwen

Источник изображения: huggingface.co/Qwen

Модель, доступ к которой откроется на платформе Qwen Chat в разделе «Генерация изображений», обладает расширенными возможностями рендеринга текста, в том числе многострочных макетов с семантикой на уровне абзацев и детализированными элементами. Поддерживаются языки на основе букв и иероглифов. Усовершенствованные механизмы многозадачного обучения помогли расширить возможности редактирования изображений с сохранением смыслового наполнения и визуального реализма.

Новая Qwen-Image, уверяет Alibaba, обошла существующие решения в нескольких тестах по задачам на генерацию и редактирование изображений, включая GenEval, DPG, OneIG-Bench, GEdit, ImgEdit и GSO. Особых успехов удалось добиться в тестах на качество прорисовки текста, таких как LongText-Bench, ChineseWord и TextCraft — новая модель превзошла современные аналоги. Qwen-Image, в частности, справляется с точным отображением китайских иероглифов на вывесках магазинов с правильной глубиной резкости, с созданием детализированного английского текста на обложках книг и информационных слайдах, поддерживается работа с двуязычным контентом.

Помимо обработки текста, модель свободно ориентируется в художественных жанрах от фотореализма до импрессионизма; поддерживаются различные операции при редактировании изображений, в том числе изменение стиля, добавление, удаление и улучшение деталей, а также редактирование текста и изменение поз у персонажей. В проекте Qwen-Image разработчики Alibaba, по их словам стремились способствовать развитию генерации изображений, снизить технические барьеры для создания визуальных материалов и вдохновить коллег на инновационные приложения.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Роборука» начала перекладывать блюда на заводе «Яндекс Лавки» в Санкт-Петербурге 29 мин.
GitHub подшутила над Sony и предложила разработчикам выслать их репозитории на CD-дисках 33 мин.
Предел терпения достигнут: цены на память продолжат расти и в третьем квартале, но не так быстро 2 ч.
До встречи в августе: Starship зажёг все шесть двигателей при подготовке к 13-му тестовому полёту 3 ч.
Российские двигатели в последний раз доставили на орбиту пакет спутников Amazon Leo на ракете Atlas V 3 ч.
Самым популярным смартфоном в российской рознице в этом году стал iPhone 17 4 ч.
Учёные вдохновились пустельгой и разработают дрон, противостоящий порывам ветра 5 ч.
2 июля начали принимать работы для участия в фотоконкурсе «Снято на Camon» компании Tecno 5 ч.
Квартальные продажи Ethernet-коммутаторов взлетели на 40 %, а NVIDIA выбилась в лидеры в ЦОД-сегменте 6 ч.
Илон Маск признался, что объёмы выпуска роботов Tesla Optimus на первых порах будут скромными 8 ч.