Искусственный интеллект: польза или вред?
Считаете ли Вы что искусственный интеллект это инструмент будущего? Является ли он двигателем прогресса или все таки регресса? Обо всем по порядку разберемся ниже в статье.
Навигация по курсу Stable Diffusion
0.1 Вступление
Часть 1. Что такое Stable Diffusion.
1.1. Обзор технологии
1.2 Как создавался Stable Diffusion
1.3 На чьих картинках учился Stable Diffusion?
Часть 2. Установка Stable Diffusion Automatic1111
2.1 Устанавливаем программу на ПК
Список уроков будет обновляться по мере выхода нового материала…
2.1 | Устанавливаем Stable Diffusion Automatic1111 на свой ПК | Курс по Stable Diffusion Automatic
Если программа у вас уже установлена — переходите к третьей части курса.
Есть два основных способа запуска Stable Diffusion Automatic1111: Запуск на своём компьютере и аренда мощного сервера. Выбор зависит от ваших потребностей и возможностей. Установка на собственный ПК обеспечивает больший контроль и гибкость, но требует мощного оборудования. Аренда сервера может быть более доступным вариантом, но менее гибким и часто платным.
1 способ. Установка на свой компьютер
Минимальные требования:
- Видеокарта с объемом видеопамяти не менее 4 ГБ (для комфортной работы рекомендуется 6 ГБ и более)
- Оперативная память: рекомендуется 16 ГБ
- Не менее 100 ГБ свободного места на диске для программы и сгенерированных изображений
Плюсы:
- ✅ Бесплатное и безлимитное использование
- ✅ Гибкая настройка плагинов и моделей под свои нужды
Минусы:
- ❌ Необходим мощный ПК
- ❌ Производитель видеокарты имеет важное значение. Видеокарты NVIDIA лучше подходят для работы с нейросетями, так как большинство программ оптимизировано под них. Запуск Stable Diffusion на видеокартах других производителей сложнее, а генерация будет медленнее и функционал ограничен.
Начинаем установку
☝️Установите Stable Diffusion Automatic1111 одним из трёх способов:
- Портативная версия — рекомендуемый способ установки. Скачайте архив «sd.webui.zip» и разархивируйте его. Удалите папку «venv». Далее запустите файл с названием «webui-user.bat». Дождитесь пока скачаются все необходимые файлы (займёт от 15 минут до нескольких часов). Детальная инструкция есть здесь;
- Обычная установка по youtube инструкции. Перед установкой SD потребуется установить Git и Python версии 3.10.9;
- Через Super installer. Автоматизированный способ (инструкции для него нет).
📃 Ссылки
- Портативная сборка Automatic1111 ⭐
- В Youtube инструкции показаны способы устранения основных ошибок установки. Рекомендую смотреть даже если вы устанавливаете портативную сборку Automatic1111.
- Репозиторий Automatic1111 web-ui на github
- Проблемы при установке и пути решения (англ.)
💬 Дополнительная важная информация!
- Папка, в которую вы устанавливаете Stable Diffusion должна иметь в названии только английские буквы!
- В имени учетной записи пользователя windows должны быть только английские буквы. Иначе в процессе установки вы получите ошибку exit code 3
- В процессе установки Stable Diffusion будут скачиваться файлы библиотек, если у вас медленный интернет, то установка займёт несколько часов.
- После установки программы очистите жёсткий диск от ненужных файлов. Они лежат в папке «c:\Users\ИМЯ_ПОЛЬЗОВАТЕЛЯ\AppData\Local\pip\» (у меня папка весила 7гб).
Изменяем внешний вид программы
- Для изменения цветовой темы программы перейдите в настройки программы: «Settings» -> «User interface» -> «Gradio theme» -> выберите тему.
- Сохраните настройки и перезагрузите программу: Apply settings» -> «Reload UI».
УСТРАНЕНИЕ ОШИБОК И ОПТИМИЗАЦИЯ ПРОГРАММЫ
❗ Если ошибки возникнут в дальнейшем использовании программы — вернитесь к этому сообщению.
Добавление параметров поможет оптимизировать программу: ускорить генерации или избавиться от ошибок. Полный список параметров есть на официальной странице проекта. Далее я приведу список основных параметров.
Для добавления параметров откройте через блокнот файл «webui-user.bat». Параметры добавляются в конце строки «set COMMANDLINE_ARGS=». Все параметры перечисляются через пробел. Подробнее об этом я рассказывал в видео об установке программы.
➡️ Полезные параметры
--opt-sdp-attention
Уменьшает потребление памяти. Уменьшает время генерации картинки на 15-70%. Работает только на видеокартах Nvidia.
--xformers
После выхода torch 2.0.0 этот параметр считается устаревшим. Вместо этого используйте --opt-sdp-attention.
--autolaunch
Рекомендую использовать. Автоматически открывает веб-страницу в браузере после завершения загрузки программы.
--theme=dark
Включает тёмную тему интерфейса программы.
--api
Не включайте пока в этом нет необходимости. Требуется для некоторых сторонних расширений, которые требуют доступ к интернету.
➡️ Параметры для устранения ошибок
--medvram
Для генераций крупных картинок, либо для видеокарт с менее чем 6гб видеопамяти. Увеличивает время генерации! Используйте параметр только при острой необходимости.
--lowvram
Работает как предыдущая настройка, но еще сильнее увеличивает время генерации. Только для самых слабых видеокарт с менее чем 4гб видеопамяти
--no-half-vae
Если генерируются чёрные или коричневые квадраты. Сильно увеличивает использование памяти при генерации.
--no-half
Требуется, если у вас проблемы с любой генерацией, такое бывает на 16хх серии видеокарт, особенно с SD 2.x моделями.
⁉️ Вопросы и ответы
Что делать обладателям видеокарт с низким VRAM? (<=4 ГБ)
- Включите оптимизации с помощью аргументов командной строки, но в жертву придётся принести скорость генерации.
- Если у вас 6 ГБ видеопамяти и вы хотите создавать картинки с разрешением 512×512 пикселей или больше — используйте параметр `--medvram`.
- Если добавление параметра `--medvram` не помогло, используйте вместо него `--lowvram --always-batch-cond-uncond`.
Что делать если генерируется черный экран?
- Причина в том, что некоторые видеокарты не поддерживают «половинную точность»: вместо сгенерированных изображений может появиться зеленый или черный экран. Для решения проблемы используйте параметр `--upcast-sampling`.
- Если это не помогло — используйте аргументы `--upcast-sampling --precision full --no-half`. Эта настройка увеличит потребление VRAM. Для компенсации затраченной VRAM, потребуется включить `--medvram`.
- В некоторых случаях ошибка может быть связана с VAE, тогда добавьте параметр `--no-half-vae`.
Как переустановить программу?
- Удалите папки `venv` и `repositories`. Далее запустите программу через `webui-user.bat`. Необходимые модули будут скачаны заново.
Часто причиной ошибок становятся расширения программы. Расширения делают члены сообщества любителей Stable Diffusion и не всегда это опытные программисты. Закройте программу, переименуйте папку с расширениями `extensions` — так SD потеряет их и запустится без расширений. Если ошибка программы не повторяется, то начинайте поиск того расширения, которое сломало программу.
Следующая статья посвящена аренде Stable DIffusion на удаленных серверах. Если вы уже установили программу — пропустите статью.
1.2 | Как создавался Stable Diffusion? | Курс по Stable Diffusion Automatic
Как обучаются диффузионные модели
В основе работы Stable Diffusion лежит диффузионная модель машинного обучения. Процесс обучения этой модели начинается с того, что исследователи берут реальные изображения из интернета и искусственно добавляют к ним случайный шум, похожий на помехи на старом телевизоре. Затем нейросеть обучают убирать этот шум и восстанавливать исходное изображение.
На ранних этапах обучения шум добавляется в небольших количествах. Постепенно его уровень повышается, пока в конечном итоге изображение не будет полностью замаскировано случайными помехами. Несмотря на это, нейросеть учится находить в этом хаотичном шуме визуальные образы: людей, предметы, растения и другие объекты.
Наступает момент, когда нейросети показывают картинку, состоящую исключительно из случайного шума, и просят сгенерировать изображение цветка, кота или шаурмы. И удивительным образом нейросеть способна увидеть в этом беспорядочном наборе пикселей искомые объекты, какими бы они ни были. Этот процесс и называется «диффузионной моделью» машинного обучения.
Но на этом возможности нейросети не заканчиваются. Она не только находит образы в шуме, но и постепенно добавляет детали к изображению, шаг за шагом преобразуя хаотичные пиксели в привлекательную и реалистичную картинку.
Чем больше шагов удаления шума — тем лучше становится картинка, но только до некоторого предела, после которого картинка перестаёт улучшаться. Этот процесс занимает от 1 секунды до нескольких минут в зависимости от количества шагов удаления шума, размера картинки, мощности компьютера и других параметров.
В рамках этого курса мы сосредоточимся на практическом применении диффузионных моделей, таких как Stable Diffusion. Однако для тех, кто захочет углубиться в технические детали и узнать больше о том, как устроены эти модели, я предоставлю дополнительные материалы и ресурсы.
Секрет ёмкости нейросетей: информация, а не изображения
Задумывались ли вы, сколько изображений может храниться в нейросети весом всего 4 гигабайта? Для сравнения, обычный DVD-диск вмещает до 4,7 гигабайт данных. Представьте, что у вас на компьютере есть папка с фотографиями, занимающая гигабайты или даже десятки гигабайт. Сколько же реально фотографий может содержаться в такой папке? Тысячи или даже десятки тысяч?
Теперь вопрос: сколько изображений, по вашим предположениям, может быть «упаковано» в нейросеть объемом 4 гигабайта? Попробуйте угадать 🤔
Правильный ответ может вас удивить: 5 миллиардов изображений упаковано в SD1.5! 🤯Однако стоит уточнить, что это не полноценные изображения в привычном понимании, а скорее некая информация, описывающая характерные особенности людей, животных, предметов, стилей, художественных техник и многого другого.
Нейросеть не хранит готовые изображения как таковые. Вместо этого она содержит математические представления визуальных концепций, извлеченные из огромного количества обучающих данных. Благодаря этому нейросеть способна генерировать совершенно новые изображения, комбинируя и интерпретируя усвоенные закономерности и паттерны.
Таким образом, 4 гигабайта данных нейросети эквивалентны информации, содержащейся в миллиардах отдельных изображений, что позволяет создавать практически бесконечное разнообразие новых визуальных композиций. Именно эта способность к генерации уникального контента делает нейросети, такие как Stable Diffusion, столь мощным и революционным инструментом.
🧠 Статьи для самых любознательных с углубленным объяснением того, как устроен SD: [рус.] [english 1] [english 2]. Более сложные технические детали о диффузионных моделях: [english].
Далее. 1.3 На чьих картинках учился Stable Diffusion?
1. 1 | Stable Diffusion: обзор технологии | Курс по Stable Diffusion Automatic
Stable Diffusion был выпущен компанией Stability AI в августе 2022 года и сразу же приобрел популярность. Для него создано множество плагинов, оболочек, надстроек, генераторов промптов и дополнительных моделей. Чёрт ногу сломит во всём этом многообразии — будем идти по прядку. Начнём с железа.
Требования к оборудованию
Stable Diffusion может работать даже на домашних ПК, оснащенных видеокартой с 2 ГБ видеопамяти. Генерация на таком компьютере будет долгой, лучше вовсе не использовать настолько слабые видеокарты и рассмотреть аренду онлайн видеокарты, к этому мы ещё вернёмся чуть позже. 6 гигабайт видеопамяти уже приемлемо, но всё ещё мало. Для быстрой и эффективной работы рекомендуется видеокарта с 16 ГБ памяти от NVIDIA, это касается не только стейбла, а вообще любых нейронок. Хотите покупать новую видеокарту — берите Nvidia — не ошибетесь. Использование видеокарт других производителей потребует дополнительной настройки.
«У меня лапки, я просто хочу делать картинки и ничего не смыслю в видеокартах». Окей, вот простая инструкция. Просто запустите диспетчер задач и откройте вкладку «производительность».
Альтернативные способы использования
Есть упрощенные способы использовать SD в виде ботов, сайтов, и приложений. Они не требуют установки, но и возможностей там гораздо-гораздо меньше. Например https://www.mage.space/ или https://playground.ai/
Принцип работы
Чекпоинт Stable Diffusion не содержит картинок — это не библиотека и не база знаний. А генерация картинки — не тоже самое что поиск картинки в гугл. Stable Diffusion не создает коллажи из фотографий. SD скорее является подобием глины: как в куске глине нет отдельных рук, ног и голов, так и в Stable Diffusion нет каких-то конкретных частей, но есть потенциальная возможность обрести форму. Конечный результат зависит от мастерства промпт-инженера. От его навыков написания промпта.
Когда я говорю о Stable Diffusion, то имею ввиду триединую систему, состоящую из: языковой модели, диффузионной модели и декодера. В простонародье всё это зовется просто чекпоинтом Stable Diffusion. Да и пофиг как он там устроен, мы рассматриваем стейбл как пользователи и не будем слишком глубоко погружаться в тонкости, но кое-что на курсе я всё же расскажу. Знание базы сделает нас могущественными промпт-шаманами!
Авторские права
Вопрос авторских прав на изображения, сгенерированные с помощью нейронок, остается спорным. В некоторых случаях создатели таких работ могут претендовать на авторские права для коммерческого использования. Однако юридическая практика в этой области еще не устоялась, и иногда суды отказываются признавать авторство за создателями промптов (промпт-инженерами).
Я провёл опрос среди подписчиков своего канала. 61% людей не поддержало авторское право на промпт. «За» высказалось 20% опрошенных респондентов.
Одна из распространенных точек зрения заключается в том, что Stable Diffusion — это всего лишь инструмент, который выполняет всю работу по генерации изображения, а вклад человека незначителен. Однако то же самое можно сказать и о фотоаппарате. Фотограф нажимает несколько кнопок, а сложный процесс улавливания и преобразования фотонов в пиксели происходит внутри камеры. Фотограф не создает композицию из атомов, а фиксирует существующую реальность. Тем не менее, мы признаем авторские права фотографов на их работы.
Таким образом, можно утверждать, что создатель промпта для Stable Diffusion также вносит творческий вклад, подобно фотографу, который выбирает ракурс, освещение и другие параметры съемки. Генерация изображения с помощью нейросети — это своего рода «фиксация» виртуальной реальности, созданной на основе текстового описания. Следовательно, авторство создателя промпта может быть признано, несмотря на использование автоматизированного инструмента.
Нужно учитывать, что нейронка училась на том, что сделали люди, миллиарды людей. Многие из нас внесли вклад в обучение нейронки, но могут даже не знать об этом. Все мы авторы и учителя для нейронок. Получаем ли мы от этого право на результаты работы нейронных сетей? Что вы думаете об этом?
Особенности генерации
Stable Diffusion имеет ограничения: подвержен социальным предубеждениям, плохо умеет генерировать разборчивый текст, плохо понимают любые языки кроме английского.
Изначально SD был обучен на квадратных изображениях 512×512 пикселей. Поэтому лучше всего он генерирует картинки с равными пропорциями сторон. При попытке создать прямоугольные изображения с людьми высока вероятность получить «мутантов». Позже мы рассмотрим, как этого избежать.
Читать дальше: 1.2 | Как создавался Stable Diffusion?
Tesla начала…
Tesla начала бесплатную пробную версию полного автономного вождения (FSD) сроком на один месяц для владельцев автомобилей по всей территории Соединенных Штатов. Об этом сообщил генеральный директор компании Илон Маск в своём аккаунте http://x.com. Испытание получат все американские автомобили, оснащённые системой полного автономного вождения (FSD). Подобный шаг отражает стремление Tesla обеспечить лучшее представление водителей об ограничениях FSD, подчеркивая необходимость постоянного внимания и вмешательства, несмотря на расширенные возможности системы.
Если ты вдругорядь…
Если ты опять 😂✌️
Факт. Вывод. Заключение.
Факт: Илон Маск не боится темноты. Он знает, что где есть тоннель, там есть и выход.
Вывод: Следуй за Илоном Маском и всегда будешь знать, что даже в самых темных моментах жизни можно найти свет. Как говорится, где Илон, там и свет.
Заключение: Мир может быть жестоким и полным опасностей, но если у вас есть Илон Маск и его тоннели, то свет в конце тоннеля всегда будет в вашем доступе.
Интересная история тоннеля 😉
Интересная история: Однажды Илон Маск застрял в одном из своих тоннелей, но вместо того, чтобы паниковать, он просто начал копать дальше и нашел новый выход. Теперь у него тоннель с двумя светами в конце!
Инструкция 👾
Инструкция: Шаг 1: Найдите тоннель. Шаг 2: Следуйте за Илоном Маском. Шаг 3: Увидите свет в конце тоннеля. Просто, не правда ли?
Лайфхак. Если вы хотите.
Лайфхак: Если вы хотите увидеть свет в конце тоннеля, то просто следуйте за Илоном Маском — он точно знает, куда идти. И не забудьте взять с собой шлем и лопату.
Миф. Многие думают.
Миф: Многие думают, что Илон Маск на самом деле не создает тоннели, а просто ходит по ним на своем космическом корабле. Но это всего лишь миф — он сам носит шлем и копает каждый метр земли своими руками.
Ошибки, если .
Ошибки: Если вы думаете, что Илон Маск создает тоннели только для того, чтобы спрятаться от свекрови, то вы ошибаетесь. Его цель — дать возможность всем увидеть свет в конце тоннеля, даже если это свет от фонаря на вашей голове.
Мы живём.
Мы живем в жестоком мире полным волнений опасностей и тревог🚨, но в нашем беспокойном мире есть человек, который «видит свет в конце тоннеля'. И мало того, он сам создает тоннель, много тоннелей, много много много тоннелей. что бы каждый сумел " увидеть свет в конце тоннеля " и понять что выход к свету есть всегда.И это парень Илон Маск. Главная мысль свет в конце тоннеля может увидеть каждый ведь Илон Маск создаёт такую возможность для каждого, для цивилизации 🧙.
Ух ты, какой вихрь истории🧐
Ух ты, какой вихрь истории! Похоже, что пушистые шмели действительно устроили шум, но, к счастью, погода успокоилась, когда появился Илон Маск! Шмели, наверное, очень любили его слушать, и даже роботы его слушали? Наверное, он действительно классный парень, хорошо, что погода утихла. :)
А пушистые шмели 🐝
А пушистые шмели устроили здесь метель. Пушистые шмели вызвали здесь метель. А ветреная погода метала меня туда-сюда по Москве. вдруг появился Илон Маск и все шмели начали смеяться и слушать Илона. Погода немного успокоилась. Спасибо Илону 😘 Даже роботы слушают Илона. Этот крутой парень — Илон Маск.
Шмели 🐝
Причудливая и красочная картина, изображающая стайку пушистых пчел, создающих метель в Москве. Пчелы вызвали ветреную и непредсказуемую погоду, разбрасывая людей и предметы по городу. Внезапно появляется Илон Маск, и пчелы начинают смеяться и его слушать. Погода немного успокаивается. Спасибо, Илон! Даже роботы слушают Илона. Этот крутой парень — Илон Маск, в сопровождении робота, создаёт восхитительную и хаотичную сцену., живопись
Круто.
Cool
4 апреля 2024 года👾
Сегодня 4 апреля 2024 года от Рождества Христова. 4 октября 2022 года Илон Маск в Твиттере постил пост о мирном плане по Украине. В интернете поднялся шум и я услышала имя Илон Маск. Вчера я сама (опять хвастаюсь) создала чат бот в Телеграм канале где я буду публиковать свои впечатления об Илоне. Свой чат бот 🤖 я назвала по образу и подобию Илона Маска Neuralink.