Статьи

Ideogram — новый генератор изображений с искусственным интеллектом.

Ideogram AI, стартап, основанный бывшими инженерами Google и сотрудниками престижных учреждений, таких как Калифорнийский университет в Беркли, Университет Карнеги-Меллон и Университет Торонто, объявил о выпуске первой полной версии своего одноименного генератора изображений.

«Мы рады представить Ideogram 1.0, нашу самую совершенную на сегодняшний день модель преобразования текста в изображение», — говорится в официальном заявлении. Сообщение в блоге об идеограмме AI. «Построенная с нуля, Ideogram 1.0, как и все модели Ideogram, предлагает современную визуализацию текста, беспрецедентный фотореализм и быстрое выполнение, а также новую функцию под названием Magic Prompt, которая помогает вам создавать подробные подсказки для создания красивых, творческих изображений.»

В пресс-релизе сообщается о сборе средств серии A в размере 80 миллионов долларов, который возглавил Андриссен Горовиц вместе с Redpoint Ventures, Pear VC и SV Angel.

Я рад сообщить, что Ideogram собрала 80 миллионов долларов США в рамках серии A, чтобы помочь людям стать более творческими с помощью генеративного искусственного интеллекта! Спасибо @a16z за лидерство в раунде и @Redpoint, @pearvc, @IndexVentures, @свангель за участие!

Идеограмма 1.0 скоро появится!

Мохаммад Норузи (@mo_norouzi) 29 февраля 2024 г.



Расшифровать смог протестировать модель, и заявления Ideogram AI не сильно преувеличены — параллельное сравнение можно найти ниже. Первая версия Ideogram представляет собой явное улучшение по сравнению со своими предшественниками v0.1 и v0.2 и может похвастаться быстрым подключением, качеством изображения и возможностями генерации текста.

Модель не имеет открытого исходного кода, поэтому ее функциональность ограничена, и нет никаких исследований, которые можно было бы оценить. Но результаты, полученные с помощью модели, говорили сами за себя, потенциально делая ее лучшей моделью, доступной на данный момент — по крайней мере, до публичного выпуска. Стабильная диффузия 3.

Новая модель, пожалуй, самый мощный генератор изображений с точки зрения текстовых возможностей: она генерирует более длинные текстовые строки с меньшим количеством ошибок, чем Dall-E 3 или MidJourney. Текущий уровень бесплатного пользования также дает ему преимущество перед конкурентами, такими как Dall-E 3 и MidJourney, у последнего из которых нет уровня бесплатного пользования. Microsoft Copilot также использует Dall-E 3, но он генерирует только квадратные изображения с соотношением сторон 1:1, тогда как Ideogram поддерживает более широкий диапазон соотношений сторон.

Идеограмма также предлагает два платных тарифных плана стоимостью 7 и 15 долларов в месяц, которые предоставляют доступ к более чем 400 поколениям в день, а также другие привилегии, такие как редактор изображений, загрузка более высокого качества, img2img, который позволяет вносить изменения в существующее изображение, и частные поколения. Все нижние уровни публично отображают запрошенные изображения.

Представляем Ideogram 1.0: самую совершенную модель преобразования текста в изображение, доступную сейчас https://t.co/Xtv2rRbQXI!

Он предлагает передовой рендеринг текста, беспрецедентный фотореализм, исключительную скорость выполнения и новую функцию Magic Prompt, помогающую с подсказками. pic.twitter.com/VOjjulOAJU

Идеограмма (@ideogram_ai) 28 февраля 2024 г.

Ideogram способен понимать длинные подсказки, не отставать от Stable Diffusion 3 и превосходит все другие генераторы изображений в этой области.

Одной из выдающихся особенностей Ideogram является «Магия подсказок», которую можно включать и выключать. Эта функция анализирует подсказку и улучшает ее для получения изображений более высокого качества, по сути давая модели возможность понимать естественный язык, как Dall-E 3. Однако Ideogram более универсален, поскольку эта функция является необязательной. Он всегда включен в ChatGPT Plus, что иногда приводит к неточностям.

Наконец, Ideogram подвергается менее жесткой цензуре, чем MidJourney и Dall-E 3, и по-прежнему способен генерировать изображения известных людей, логотипы компаний и художественные стили. Он не работает полностью NSFW, но более дискретен, когда дело доходит до цензуры подсказок.

И первые тестеры, похоже, предпочитают Ideogram другим моделям. «Используя протокол оценки, аналогичный протоколу DALL E 3, мы обнаружили, что люди, оценивающие Ideogram 1.0, предпочитают DALL E 3 и Midjourney V6 из-за быстрого выравнивания, согласованности изображения, общих предпочтений и качества рендеринга текста», — заявили в стартапе.

Расшифровать протестировал возможности Ideogram и сравнил его с ведущими конкурентами MidJourney и Dall-E 3. Стабильная версия Diffusion 3 и лучшая ИзображениеFX от Google здесь не оцениваются, поскольку SD3 еще не выпущен, а ImageFX широко не доступен.

Генерация длинных строк текста

Подсказка: футуристический андроид в киберпанк-городе с табличкой «Не опаздывайте к тренду искусственного интеллекта: уходите с Decrypt».

Поколения с идеограммой (слева), MidJourney (в центре) и Dall-e 3 (справа)
с Ideogram (слева), MidJourney (в центре) и Dall-E 3 (справа).

Искусственный интеллект Ideogram смог визуализировать как необходимую эстетику, так и текст. Однако произошла опечатка, из-за которой вместо «the» было написано «ты».

MidJourney вообще не смогла сгенерировать связный текст и сосредоточилась на создании футуристического андроида с деталями. Это основная тема всей композиции. Город вовсе не киберпанк.

Далл -Е 3 занимает среднее место. Ему удалось создать футуристического робота, киберпанк-город, но на вывеске не было слова «Эмердж».

Интересно, что Ideogram поняла, что робот находится в городе и связан со знаком, тогда как Dall-E предположил, что знак является частью городского пейзажа.

Длинные подсказки и пространственные возможности

Подсказка: сюрреалистическая и интригующая сцена с котом, сидящим на телевизоре рядом с табличкой «Появляйся». На заднем плане с одной стороны стоит футуристический андроид, а с другой — космонавт. Стены комнаты украшены ярким изображением молекулы и нити ДНК.

Ideogram — новый генератор изображений с искусственным интеллектом.
Идеограмма поколений (вверху), MidJourney (внизу слева) и Dall-e 3 (внизу справа)

Идеограмма была, безусловно, лучшим генератором в целом. Он понял каждую часть подсказки, сгенерировал текст без опечаток, понял расположение каждого элемента с котом на телевизоре, табличкой рядом, андроидом и космонавтом по обе стороны и даже придумал, что должно быть быть молекулой и цепью ДНК на заднем плане.

Эстетика MidJourney была не сюрреалистической, а скорее гиперреалистичной. Он придумал слово «Появление», но поместил его на телевизор вместо вывески. Кот тоже рядом с телевизором, а не на нем. Он не создал Android и не смог выполнить фоновый запрос, вместо этого создав тот, который лучше соответствовал эстетике композиции, придавая большую значимость объекту (коту) в общей сцене.

Dall -E 3 сохранил свой фирменный мультяшный стиль и не смог полностью следовать подсказке. Он лучше осведомлен о пространстве и быстрее обращается к нему, чем MidJourney, но гораздо меньше, чем Ideogram. Однако он проигрывает с точки зрения стиля. Он сгенерировал кота на телевизоре, но не смог создать знак Emerge рядом с котом. Он не создавал Android и не следовал инструкциям при создании фона.

Заключение

Бесплатный и широко доступный, Ideogram, пожалуй, лучший генератор изображений на рынке в настоящее время. Он обладает отличным пониманием естественного языка, выдающимися пространственными способностями и быстрой съемкой. Это также лучший текстовый генератор, доступный на данный момент.

Если эстетика является наиболее важным фактором (до такой степени, что соответствие требованиям и копирование менее важны), то MidJourney может оставаться серьезным конкурентом в конкретных случаях использования. Несмотря на то, что Dall-E 3 не особенно хорош и подвергается жесткой цензуре, он все равно может иметь смысл как часть подписки ChatGPT Plus.

Идеограмма AI на данный момент удерживает корону среди наших генераторов изображений.


Подборка статей по криптовалютам и технологии блокчейн. Подпишитесь на нас в социальных сетях.

Информация для Вас была полезна?
0
0
0
0
0
0
0

Похожие статьи

Кнопка «Наверх»