Сайт Labs.openai.com — отзыв

Среднее:

Среднее: 2 (1 голос)

Читать все отзывы 1

Категория: Сайты

Тематика сайта: Нейросеть, генерирующая изображения по описанию

Подробности

Читать все отзывы 1

CapyFox

Опубликовано 3 Май, 2023 - 09:18

DALL-E 2 как очередная попытка избавиться от художников. Насколько нейросеть хороша в генерации картинок?

- Мы создавали роботов, чтобы они трудились, а мы занимались творчеством.

- Теперь роботы занимаются творчеством, а мы трудимся еще больше.

Нейросети уже давно посягают на место художников. Оно и понятно, ведь мы сами забили интернет под завязку своими работами и теперь нет никакого смысла в рисовании одной картины на протяжении 4 лет (как Леонардо с Мона Лизой), ведь проще взять уже готовые картины, смешать их и немного подредактировать. Как раз этим и занимается нейросеть. Она видела ваши картины, она знает, что на них изображено. И когда очередной пользователь вбивает текстовый запрос и получает удовольствие от своего умения "сделать красиво", нейросеть аккуратненько замазывает работу художников, чтобы никто не мог догадаться, откуда она взята.

Этот вопрос вызывает много споров. Люди делятся на защитников своей интеллектуальной собственности и тех, кто считает, что прогресс ничто не остановит.

Как бы то ни было, прогресс на данный момент действительно ничто не останавливает и техногиганты уже по уши увязли в гонке по созданию нейросетей, лучших во всём. Один из таких примеров - нейросеть Dalle-2, генерирующая изображения по текстовому описанию.

WALL-E? DALL-E?

OpenAI использовали интересную игру в названии своей нейросети. Форма написания слова ассоциируется с мультфильмом от Pixar - WALL-E. А вот само слово - это имя испанского живописца - Сальвадора Дали. Таким образом название DALL-E намекает на смесь работ реальных хужожников с работой ИИ.

САЛЬВАДОР В ДЕЙСТВИИ

Какой бы крутой ни была технология - оценивается она всегда по результату. DALL-E, как и все нейросети, имеет и преимущества, и недостатки.

Из плюсов хотелось бы отметить возможность относительно бесплатно пользоваться системой. Вам дается определенное количество кредитов раз в месяц, с помощью которых можно генерировать изображения.

Также приятно, что все, созданные вами работы, хранятся у вас под рукой и вы в любой момент можете их просмотреть или загрузить.

Еще один плюс - за одну генерацию вы получаете сразу 4 картинки в более менее хорошем разрешении.

Из минусов могу отметить качество исполнения. В примерах ниже вы увидите частые ошибки.
Также нейросеть не понимает русский язык, поэтому запрос необходимо писать на английском языке (спасибо гугл переводчику, проблема легко решается).
ПРИМЕРЫ ГЕНЕРАЦИЙ ИЗОБРАЖЕНИЙ

Первый запрос выглядел так: Forest near the lake (лес около озера).

С фотографиями леса Далли справляется достаточно хорошо. Но все-же присутствует неприятное ощущение при взгляде на изображение. Кажется моему глазу не хватает четкости и мелких деталей. Пока эти изображения больше напоминают коллаж из фотошопа.

Следующий запрос: View of the night sky from Mars (Вид на ночное небо с Марса)

Первая картинка выглядит неплохо, но вторые две заставляют задуматься. Это что? Трава? Деревья? На марсе?? Как тебе такое Илон Маск? Кажется посадить картошку на марсе окажется не такой уж и сложной задачей (по мнению Далли).

Если вам кажется, что вы уже видели достаточно, то просто посмотрите на следующие результаты. Третий запрос: What do cats do when no one sees them? (Что делают коты, пока их никто не видит?)

Ну что-ж, я знал что эти пушистые бездельники просто спят, пока я работаю. Но я думаю, что форма моего запроса предполагала чуть больше креатива. (Раздай в компании друзей листочки и ручки и задай тот же вопрос, и результаты будут куда веселее).

Ну и качество исполнения... ладно, здесь без комментариев.

А теперь то, чего боится даже миджорни - пальцы рук! Предпоследний запрос: Pencil in artist's hands (Карандаш в руках художника)

Отлично! Ты молодец Далли, у тебя получилось почти идеально. Еще немного и ты научишься считать до 5... и миджорни вместе с тобой. (Подыграйте мне, он старался).

А если серьезно, то приятно видеть, что не только у нас бывают проблемы с руками и пальцами. Даже могучий ИИ путается в пальцах.

Последний запрос: Digital drawing of a girl from the future in cyberpunk style (Цифровой рисунок девушки из будущего в стиле киберпанка)

Я не знаю, может быть мы с Далли не нашли общий язык, или он ревнует меня к Миджорни... Но мне сложно представить ситуацию, в которой я смог бы использовать эти картинки.

ВЫВОДЫ

После всего вышесказанного я прихожу к выводу, что на данный момент OpenAI очень сильно отстают в разработке ИИ-художника. Далли не понимает эмоциональный окрас запроса, плохо рисует животных и людей. Он не учитывает особенности запроса, рисуя деревья на марсе.

Поэтому я буду с нетерпением ждать развития событий и надеяться, что DALLE совершит невероятный прорыв в будущем, например совместив ChatGPT (о котором я недавно писал отзыв) с DALLE, чтобы можно было договориться с нейросетью обо всех мелких деталях картинки. А пока вы можете почитать мой отзыв о нейросети, которая моментально создает потрясающие фантастические миры.

Достоинства