Midjourney и другие нейросети обработки изображений - страница 390

 
Меня удивляет, почему Чат понимает с полуслова, а для Миджорни нужен какой-то язык промтов. 

Почему нельзя объединить их?

Вот мид нарисовал шесть пальцев. Я ему пишу: "Олежа, какой шестой палец? Ты чё выпил? А нука убрал!"

И вот, новая генерация без шестого пальца. 
 
Ivan Butko #:
Меня удивляет, почему Чат понимает с полуслова, а для Миджорни нужен какой-то язык промтов. 

Почему нельзя объединить их?

Вот мид нарисовал шесть пальцев. Я ему пишу: "Олежа, какой шестой палец? Ты чё выпил? А нука убрал!"

И вот, новая генерация без шестого пальца. 

Dalle is stronger than mid journey i believe but they are throttling it because they are also probably lobbying for limitations , so , they don't want to be breaking the law that will be enforced in the future in my opinion."

Далли сильнее Mid Journey на мой взгляд, но они ограничивают её работу, вероятно, также лоббируя ограничения, чтобы избежать нарушения законов, которые будут применены в будущем, по моему мнению.

 
Ivan Butko #:
Почему нельзя объединить их?

LLM (большая языковая модель) - это отдельный ИИ, который надо обучать.

Тут правильно Lorentzos сказал, что DALLE сильный генератор. Там как раз его встроили в ChatGPT, поэтому картинка максимально близка к тому, что просит пользователь, с кучей деталей, всё как надо. Но страдает именно фотореалистичность.

У Гугл тоже в их Gemini (бывший Bard) встроен генератор картинок.

По РФ разработкам. В Гигачат встроен Кандинский. В Яндекс Алисе это YaGPT и YaART.

Что касается Миджорни, то Маск ведёт переговоры, чтобы на базе X объединить их вместе с ИИ Grok, тогда промты будут естественными. А пока LLM не прикрутили, нужны точные команды-промты.

Ещё Stable Diffusion остаётся без LLM, но это дело времени.

 
Vitaliy Kuznetsov #:

LLM (большая языковая модель) - это отдельный ИИ, который надо обучать.

Тут правильно Lorentzos сказал, что DALLE сильный генератор. Там как раз его встроили в ChatGPT, поэтому картинка максимально близка к тому, что просит пользователь, с кучей деталей, всё как надо. Но страдает именно фотореалистичность.

У Гугл тоже в их Gemini (бывший Bard) встроен генератор картинок.

По РФ разработкам. В Гигачат встроен Кандинский. В Яндекс Алисе это YaGPT и YaART.

Что касается Миджорни, то Маск ведёт переговоры, чтобы на базе X объединить их вместе с ИИ Grok, тогда промты будут естественными. А пока LLM не прикрутили, нужны точные команды-промты.

Ещё Stable Diffusion остаётся без LLM, но это дело времени.

The photorealism is intentionally limited on DallE. It even tells you if you ask it

Трансляция на русский язык: «Фотореализм в DALL·Е ограничен преднамеренно. Он даже сообщает вам об этом, если вы спросите об этом».


Перевод фразы из английского на русский используя информацию из предоставленных источников:


- Фотореализм — это стиль искусства или компьютерной графики, который стремится достичь такого же уровня детализации и реализма, как фотографии.

- В контексте DALL·E, вероятно, имеется в виду генерируемое искусственным интеллектом изображение, которое может быть фотореалистическим, но его степень реализма ограничена по дизайнерским причинам.

- Согласно заявлению, если пользователь обратится к системе DALL·E с вопросом о фотореализме, она явно отвечает, что он является ограниченным.

 
Aleksey Nikolayev #:
Качественных изменений не произошло.

А как же песни?

 

Вот с простого промта текст с рифмой, музыка, исполнение.

У второй песни добавил к промту Metatrader

https://app.suno.ai/song/ca19b82c-5fb4-4e7d-a450-df7bdb0241fb

https://app.suno.ai/song/0967826d-12f9-4b57-bcef-1d617d752b5f

Перевод 1:

[Verse]

Я проснулся утром с планом в голове.

Собираюсь обменять свои проблемы на отдых.

Я бьюсь на бирже, собираюсь заработать немного денег.

Торгую, смотрю, как растут мои деньги (о-о-о да)


[Припев]

Торговля - это круто, да, это путь к успеху.

Покупай дешево, продавай дорого, смотри, как растет твоя прибыль

Акции и опционы, криптовалюта тоже

Я собираюсь торговать, да, я говорю вам.


Перевод 2:

[Verse]

Я просыпаюсь утром, готов к торговле.

Открываю свой ноутбук, Metatrader никогда не угасает (да!)

Анализирую графики, ищу тренды

Нужно получить прибыль, нужно исправить положение.


[Припев]

Торгую весь день, торгую всю ночь

Metatrader - мой путеводный свет (да, да)

Торгую весь день, торгую всю ночь

Делаю шаги, мое будущее выглядит ярко (о-о-о да)

 

Генерация питон кода в чатгпт иногда удивляет. Другие сетки и языки не пробовал.

Но если хотите сделать что-то новое, то будет генерить фигню. Шаблонный код хорошо пишет.

 
Vitaliy Kuznetsov #:

А как же песни?

Ну да, "зато у нас песни хорошие")

Кстати, что-то давно не слыхать про великий и ужасный Q*

 
Maxim Dmitrievsky #:
если хотите сделать что-то новое, то будет генерить фигню. Шаблонный код хорошо пишет.

По мне, это ожидаемое поведение.

 
Aleksey Nikolayev #:

Ну да, "зато у нас песни хорошие")

Мне обычно вообще нет никакого дела до мнения, что ИИ фигня. Но песни - это не просто что-то обыденное. Писать рифмы, петь в ноты, составлять мелодию - это высшая мера развития интеллекта. Ещё видео генерации, то что Sora показала - вообще за гранью. А ElevenLabs с помощью ИИ - озвучила все звуковые эффекты к видео. Мерить развитие ИИ по принципу, что он не разбирается в каком то сложном вопросе, не верно. Обучится и будет шарить куда глубже, просто не обучали. 

То, что не показывают ИИ уровня превосходящего человека, сравнимо с тем, что мы можем собрать ПК из самых современных комплектующих, продаваемых в магазинах, зная, что в мире есть квантовые компьютеры в миллион раз превосходящие по мощности, но их не купить.

Проще говоря, он уже есть, но скрывают (вероятность 99%). Многие страны должны самостоятельно прийти к таким ИИ постепенно. Зачем, другой вопрос. Однозначно только то, что эта технология должна быть повсеместно в каждой стране.

Причина обращения: