Midjourney и другие нейросети обработки изображений - страница 72

 
Жалкие попытки художников обвинить мид в "криворукости" разбились в дребезги с выпуском 5-ой версии. 

Руки и пальцы теперь в норме. 
 
Ivan Butko #:
Жалкие попытки художников обвинить мид в "криворукости" разбились в дребезги с выпуском 5-ой версии. 

Руки и пальцы теперь в норме. 
Могу поспорить, что нет. Задайте ему сложную композицию и ляпов будет море. 
 
Например, пусть изобразит Бородинское сражение.
 

Богини постапокалипсиса от MJ5

a centered photo of a post apocalyptic goddess at burning man festival playa, powerful, cinematic, beautifully lit, by artgerm, by craig mullins, by karol bak, 3 d, perfect face and body, trending on artstation, octane render, 8k —q 2 —v 5


 

Властелин колец. Котоверсия от MJ


 

Средневековые супергерои

MJ5


 

Нейронка с исходником по обнаружению объектов в кадре - https://github.com/Deci-AI/super-gradients/blob/master/YOLONAS.md


 
Реter Konow #:
Могу поспорить, что нет. Задайте ему сложную композицию и ляпов будет море. 

Вопрос немного в другом: художники ставили в аргумент факт абсолютной "криворукости". Но, уже тогда было понятно, что апгрейд - дело времени. И со временем кисти приведут в порядок. Что и показал мид 5 на примерах.

 
Ivan Butko #:

Вопрос немного в другом: художники ставили в аргумент факт абсолютной "криворукости". Но, уже тогда было понятно, что апгрейд - дело времени. И со временем кисти приведут в порядок. Что и показал мид 5 на примерах.

Это не удивительно, учитывая что MJ специально сделали акцент обучения своей модели на фотографиях с руками. Кстати, также не удивительно, что они пошли по пути фото-реалистичности, ведь обучающие данные можно клепать бесконечно, просто фотографируя все вокруг и закидывая фотки в сет. Нужны руки? - пожалуйста! Сфоткали десяток тысяч рук, загрузили, обучили и готово. 

Другое дело - сложные композиции. Их просто так не нафоткаешь, а в сети подобных изображений намного меньше, чем котиков и аниме. Поэтому (и не только) Бородинское сражение, MJ нормально не нарисует и скорее всего, получится фигня. 

Но главная проблема даже не в этом. Сложная композиция подразумевает глубокое понимание происходящего на сцене - не просто нагромождение людей и предметов, а продуманные связи элементов и смысл в каждой части изображения. Поскольку, модель MJ работает по принципу генерации статистически закрепленных последовательностей данных, их смысловые связи устанавливаются тоже статистически. То есть - смысл, в человеческом понимании, не извлекается, а взвешивается взаимосвязь признаков. 

Иначе говоря, чтобы модель MJ хорошо генерировала картины сражений по описанию, нужно обучить ее на огромном количестве полотен, и с каждой картиной обучающего сета должна подаваться многостраничная аннотация. В общем, подобный сет создать почти невозможно.

 В этом есть ограничение статистического подхода - без накопления статистики - никуда.)
 

Миджорни умеет писать промт к любой загруженной картинке.

Закидываете картинку, получаете промт, и с помощью этого промта генерите аналоги.

В дальнейшем думаю, что GPT5 дообучит нейросеть картинок до совершенства.

В целом GPT4 уже проходит многие экзамены, обгоняя человека, умеет "видеть" что на картинке с пониманием что там так и не так.

Рано или поздно уложит по всем экзаменам человека. И вот тогда с помощью неё можно обучать нейросети какие-угодно на полном автомате.

Причина обращения: