Midjourney и другие нейросети обработки изображений - страница 560

 
Ivan Butko #:

Попробуйте мыслить шире:

Итак, шиза - это предыдущие видео, похожие на бредогенератор, когда из одной сцены генерируется другая, объект из одного превращается в другой. Этакие сновидения. 

Это первый этап развития анимации. И это шиза - по факту. Содержание было популярно не юмористических ресурсах. 


Второй этап развития - удержание сцены в её первоначальном виде: кот режет ножом. Он не превращается в кролика, нож не превращается в мухобойку, фон не переходит из одной локации в другую. 

То есть шиза - ОТСУТСТВУЕТ. 


Далее третий этап развития, четвёртый и так далее. 

От первого до второго этапа развития прошло пару недель (по факту - больше, просто публикация почти в одно время). 

Не 10 лет, а в 1000 раз быстрее. 


Вопрос: что вас убеждает в том, что шиза будет в голливудских фильмах, если сраный кот держит нож как ни в чём не бывало?

Лучше всего мыслить не шире (или уже), а адекватно реальности.

Лично мне пока недостаточно фактов в пользу утверждения о достижении второго этапа в вашей терминологии. Нужно наличие доступного сервиса для генерации осмысленного видео по произвольному осмысленному промпту. Один кот с ножом (даже двадцать котов с тридцатью ножами) не доказывают существование такого сервиса. В том что модель можно обучить так, что осмысленное видео может быть получено для ограниченного набора промптов, сомнений нет - сразу написал, что такой подход позволяет обойти комбинаторные ограничения.

Если такой сервис реально появится в ближайшее время, то без проблем признаю ошибочность своего утверждения, что он возможен не ранее чем через десять лет и, восхищаясь его создателями, постараюсь понять как они этого достигли.

 

Музей неестественной эволюции. Миджорни


 

Животные в микромире. Миджорни


 

Арты. Midjourney


 
Vitaliy Kuznetsov #:

Когда доводов не останется, скептики начнут уводить тему в сторону, нападать, цепляться за слова, переходить на личности и т.д.


Про реалистов, оптимистов и пессимистов.

Вот есть видео, сгенерированное ИИ, пусть не совершенное, но уже намного лучше, чем было год назад.

Что скажет оптимист? Технология выйдет на профессиональный уровень.

Что скажет пессимист? Технология никогда не выйдет на профессиональный уровень.

Что скажет реалист? Качество за год стало лучше, обучение и конкуренция продолжается. Очевидно будет прогресс в ИИ-видео.

По поводу прогресса. А проблемы с пальцами у Миджорни починили? Просто из картинок которые публикуете непонятно. Там те же торсы с головами манекенов и бессмысленными взглядами. Просто если миджорни стал лучше, то в чем? В количестве генераций в сутки? В смешении признаков животных? В возможности глумления над классической живописью? В чем он прогрессирует? В отдалении толп молодых людей от настоящего искусства и культуры? В отучении уважения кропотливого труда? В потакании их лени и бесвкусице?

Может ChatGPT лучше? В чем он развивается? В легкости выдачи ответов на бестолковые вопросы? В протезировании мышления при ярковыраженном скудоумии? Может он лучше экономит силы на чтении Википедии? У него растет авторитет надежного источника достоверной информации? 

В чем развитие и прогресс для бизнеса и общества? В потере рабочих мест? В увольнении сотрудников? В автоматизации медицинских услуг и поставкой лечения на бездушный конвеер? 

В чем развитие и прогресс? Риторический вопрос.

Это трансформация, а не прогресс. Не стоит их путать.

 

Вышла новая китайская нейронка по генерации изображений Kolors (от создателей конкурента Sora - Kling AI)

Фокус группа отдала этой нейронке первое место.

Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Image Synthesis (arXiv-2024) | Kolors (kwai-kolors.github.io)

GitHub - Kwai-Kolors/Kolors: Kolors Team

Kolors — это крупномасштабная модель генерации текста в изображение, основанная на латентной диффузии, разработанная командой Kuaishou Kolors. Обученный на миллиардах пар текст-изображение, Kolors демонстрирует значительные преимущества как по сравнению с моделями с открытым, так и с закрытым исходным кодом в визуальном качестве, сложной семантической точности и рендеринге текста как для китайских, так и для английских иероглифов. Кроме того, Kolors поддерживает ввод как на китайском, так и на английском языках, демонстрируя высокую производительность в понимании и создании контента, специфичного для китайского языка.

Попробовать тут - Kolors - a Hugging Face Space by gokaygokay

Мои примеры: ящерица катается на велосипеде по Майями

 

У каждой технологии есть плюсы и минусы. У людей есть плюсы и минусы.

Если вы концентрируетесь на минусах, то ничего не добьётесь.

Примеров много.

У ИИ есть куча минусов. И куча плюсов. Слабые и сильные стороны.

Обращайте внимание на то, что ИИ делает хорошо. На этом и сосредоточьтесь.

Оптимист видит только плюсы, пессимист - минусы, реалист видит и то и другое.

Успешный человек, если он реалист, тоже видит и плюсы и минусы, но понимает, как использовать плюсы, и как сэкономить (считай заработать) бюджет на тех вещах, что спокойно сделает ИИ.


Помните. Ваш мир состоит из того, что вы о нём думаете, на чём концентрируете своё внимание. Ходить с плохим или хорошим настроением - это ваш выбор.

 
Vitaliy Kuznetsov #:

У каждой технологии есть плюсы и минусы. У людей есть плюсы и минусы.

Если вы концентрируетесь на минусах, то ничего не добьётесь.

Примеров много.

У ИИ есть куча минусов. И куча плюсов. Слабые и сильные стороны.

Обращайте внимание на то, что ИИ делает хорошо. На этом и сосредоточьтесь.

Оптимист видит только плюсы, пессимист - минусы, реалист видит и то и другое.

Успешный человек, если он реалист, тоже видит и плюсы и минусы, но понимает, как использовать плюсы, и как сэкономить (считай заработать) бюджет на тех вещах, что спокойно сделает ИИ.


Помните. Ваш мир состоит из того, что вы о нём думаете, на чём концентрируете своё внимание. Ходить с плохим или хорошим настроением - это ваш выбор.

Соглашусь. Эта позиция сбалансирована и адекватна. 

Если ставить глобальные пользу и вред от ИИ на чашу весов, придется учитывать не только маркетинговые обещания компаний доящих инвесторов, в условиях вечной захайпованности капиталистических масс-медиа, но и здравые мысли мудрых людей невосприимчивых к взвинчивающему инфошуму. И эти люди есть, только найти их бывает непросто,... в маркетинговом угаре. 

Нужен баланс.
 
Maxim Dmitrievsky #:
Предположительно в том, что прописана некоторая программа свободного взаимодействия и объекты могут взаимодействовать свободно и осмысленно, а не накладываться на другие видео, которые есть в памяти НС.
Для реализации подобного взаимодействия нужен совсем другой тип ИИ. 

Он должен "многомерно" знать реальность, имея развернутый и детальный концепт мироздания и бытия обьектов и людей, выраженный через миллионы и миллионы состояний, процессов и трансформаций. Но и этого мало. Должно присутствовать понимание невербального мира и универсальных свойств психодинамики и поведенческих паттернов, для каждой отдельной уникальности широчайшего разнообразия индивидуальностей. Все для создания реалистичных персонажей, похожих на настоящих людей. 

...чтобы развеять скуку развалившегося на диване обывателя?) 
 
Реter Konow #:
Для реализации подобного взаимодействия нужен совсем другой тип ИИ. 

Он должен "многомерно" знать реальность, имея развернутый и детальный концепт мироздания и бытия обьектов и людей, выраженный через миллионы и миллионы состояний, процессов и трансформаций. Но и этого мало. Должно присутствовать понимание невербального мира и универсальных свойств психодинамики и поведенческих паттернов, в каждой отдельной уникальности широчайшего разнообразия индивидуальностей. Все для создания реалистичных персонажей, похожих на настоящих людей. 

И все это чтобы развеять скуку развалившегося на диване обывателя?) 
Просто тогда это будет действительно ИИ, о котором так упорно пишут местные маркетологи, подменяя понятия :) А пока это просто нейросеть для генерации видосиков.