Блог
Топ 5 нейросетей для генерации изображений

Масштабы Амазона в цифрах

На связи Антон Бочкарев, и сегодня поговорим о графических нейросетях, которые преобразовывают текст в изображения.

Как думаете, зачем они вам нужны? Чтобы баловаться со своими фотками, примеряя на себя разные образы?

Ну, как вариант, и это тоже. Но главное, если вы научитесь ими пользоваться, — сможете существенно увеличить доходы. Причем не обязательно иметь какие-то художественные навыки, вы можете быть абсолютным новичком в этой сфере.

Представьте себе обычного художника, который рисует портреты на заказ. Стоимость одного портрета, в среднем, 4000 рублей, а чтобы его нарисовать, художник потратит около 20 часов. В месяц он сможет взять примерно 4 заказа, потратив 80 часов и заработать на этом 16 000 рублей.

А теперь возьмем человека, который уже использует графические нейросети для рисования портретов. На один портрет он потратит примерно 1,5 часа, из которых минут 30 он будет просто ждать, пока ИИ обработает анатомию человека. То есть, он сможет выполнять около 40 заказов в месяц и заработает уже не 16 000, а 160 000 рублей, что в 10 раз больше!

Так, вернемся к самым топовым графическим нейронкам.

Нейросети развиваются очень быстро и появляется огромное количество обновлений, новых нейросетей аналогов конкурентов.

Вот мой личный топ-5:

  1. Stable Diffusion
  2. Midjourney
  3. Leonardо
  4. Dall-E
  5. Ideogram

Это самые крутые нейронки для генерации изображений на сегодняшний день. Сейчас я расскажу о каждой подробнее.

Stable Diffusion


Это первая нейросеть в свободном доступе. Она бесплатная, достаточно только установить ее на компьютер или в облако и генерировать столько изображений сколько хотите, без ограничений. Рисовать можно все, что душе угодно и абсолютно на любую тематику, от собачек до картинок 18+.

Это действительно очень крутая нейросеть, которая воплощает любые мечты и задумки. И качество изображение очень высокое. Но, конечно, у нее есть и минусы.

1) Чтобы запустить Stable Diffusion, потребуется очень мощный компьютер, а именно наличие видеокарты только от NVidia (а они достаточно дорогие) и никакой другой.

Если говорить про быструю генерацию изображении, чтобы не ждать по 10 минут, я рекомендую покупать видеокарты серии 3070 или 3090. А если хочется генерировать изображения за 1-2 секунды, это видеокарты 4090, которые стоят 250 000 руб. Возможно, скоро, она сможет работать на любых графических процессорах.

2) Ее интерфейс далеко не юзер-френдли. Для человека, который никогда не пользовался чем-то подобным, не знает, что такое ns-dos, будет вообще непонятно куда нажимать. Там куча разных кнопок, графиков, каких-то выпадающих меню и всё это на английском языке.

Но эти минусы перекрываются плюсами, ведь вы создадите потрясающие произведения искусства за считанные секунды.

Midjourney


Midjourney — это, прям, знаете, такой модный парень на районе. Смотришь на него — он такой интересный, умный, красиво одевается и вообще очень прикольный тип.

На сегодняшний день Midjourney работает только с помощью Discord — специального мессенджера. Это голосовой чат, в котором есть бот Midjourney. Регистрацию можно пройти за 1 минуту, и тогда открывается этот бот.

В Midjourney можно делать очень крутые фотореалистичный изображения, и не обязательно знать аспекты промт-инжиниринга (промт — это текстовый запрос, вводные данные для ИИ).

Конечно, если туда зайдёт человек, который вообще впервые с этим сталкивается — он вряд ли что-то нарисует. Но если есть хотя бы общее понимание — будет получаться очень круто: реалистичные изображения, логотипы, дизайн мебели и интерьеров и т.д.

Главный плюс Midjourney — это то, что она достаточно простая для освоения (в отличии от Stable Diffusion). Это самая распиаренная нейросеть, и поэтому в Интернете существует очень много мануалов, гайдов, как ею пользоваться.

Теперь о минусах.

1) Она платная, стоит 20 долларов в месяц, но надо еще умудриться ее оплатить.

У нас на курсе есть специальный бонусный урок, где я рассказываю лайфхаки как оплачивать зарубежные сервисы за 20 секунд.

2) Следующий минус — нужно немного освоить Discord.

Несмотря на то, что ему уже 8 лет, большинство людей о нем даже не знают. Но хватит 2-3 часа, чтобы его изучить.

Midjourney — крутая нейросеть, вы будете поражены результатами, которые она выдает. Поэтому обязательно попробуйте.

Leonardo AI


Leonardо AI — моя любимая нейросеть для изображений

Leonardо AI — это, знаете, такая милая симпатичная библиотекарша, открытая к диалогу. С ней прям вот хочется пообщаться, и чувствуется, что она с радостью обо всем расскажет. У этой нейросети очень дружелюбный интерфейс (максимально юзер-френдли), и она будет понятна даже новичку.

Leonardо AI выдает очень крутые результаты и большим плюсом является то, что у нее есть русскоязычное комьюнити и огромные базы изображений. Там очень простая регистрация, она доступна из любой страны, а также есть бесплатный тариф.

Каждый день вам выдается 150 токенов, и вы можете сгенерировать 20-30 изображений. А на следующий день проснетесь — и у вас снова 150 токенов. Но минус в том, что на бесплатном тарифе огромное количество функций недоступно, а платная подписка стоит 12 долларов в месяц. Но эти 12 долларов даже не жалко заплатить, потому что то, что можно получить на платном аккаунте — это очень крутые изображения.

Я в основном использую в работе только ее. На курсе, кстати, есть целый раздел, посвященный Leonardо AI, где мы учимся с ней работать.

Dall-E


Изначально она была как, знаете, такой вот мальчик, над которым в школе все смеялись, чушпаном, короче. Зовут этого мальчика DALL-E. DALL-E — это нейросеть от компании Open AIi, которая, кстати говоря, создала знаменитый ChatGPT.

Первые версии этой нейронки были очень примитивные и топорные. Допустим, просите ее нарисовать голубя, а она рисует какого-то голубя-инвалида с кривым клювом, и все в таком духе.

Очень долго над ней все смеялись и практически никто не пользовался. И хоть она была бесплатная, зарегистрироваться в ней было очень сложно, потому что на территории России невозможно было пройти эту регистрацию без танцев с бубнами.

А относительно недавно DALL-E выпустили обновление с невероятно огромным дата-сетом, который дал очень крутые результаты в генерации изображений. То есть она теперь не просто рисует картинки, а делает изображения, которые не отличишь от фотографий, очень крутого качества. Причем все это делается с использованием достаточно простых промтов. Не нужно быть промт-инженером, чтобы делать крутые картинки.

Сейчас она стала платная — это конечно минус. Но в планах у DALL-E завоевать весь мир своими новыми технологиями, так что будем наблюдать за ними и за их обновлениями.

Ideogram


Ideogram — лучшая нейросеть для логотипов.

Она очень проста в регистрации и доступна из любой страны. Но, самое крутое ее качество — это то, что она умеет писать тексты.

Безусловно, будут небольшие ошибки, например, какие-то буквы не дорисуются или будут какие-то несущественные помарки, но в целом получится просто идеальнейшее изображение. Это качество помогает нам создавать логотипы.

Мы не можем для этих целей использовать Midjourney, Stable Diffusion или любые другие их аналоги, потому что они не умеют писать тексты, в отличие от Ideogram.

А здесь вы можете просто попросить нарисовать какой-нибудь прикольный логотип в виде, например, дракона, и снизу написать определенный текст. Далее вы нажимаете кнопочку Generation и получаете идеальный логотип, который в дальнейшем нужно будет перевести в вектор. За 20 секунд вы получаете очень крутой результат.

Как научиться создавать изображения в нейросетях?

Сделать первые шаги можно на практическом бесплатном вебинаре. На нем вы научитесь создавать не только изображения (например, обложку для детской книги), но и тексты и даже короткие видео. А еще узнаете, как работать в х50 раз меньше и зарабатывать в 10 раз больше с помощью ИИ.

Переходите по ссылке ниже и присоединяйтесь:

https://university.praktik-pro.ru/ai?gcpc=1b447