Midjourney и другие нейросети обработки изображений - страница 519

 

Китайский робот Unitree G1 за 16к$

Весит 35 кг


 
Maxim Dmitrievsky #:
Очень в яблочко. Но это почти что герметичное знание и со всеми об этом говорить не стоит :)
Даже неправильное дыхание сильно снижает интеллектуальные способности.
Согласен.

 Этот оффтоп в догонку предыдущему оффтопу, о якобы ничтожных различиях между биологической нейросетью и искусственной. Мол, искусственная может настолько точно имитировать естественную, что разница стирается. 

Во первых мы не до конца знаем как работает живая нейросеть. Нейроны и химические процессы очень сложны и динамичны, а область исследована частично. Программная имитация чрезвычайно упрощает и чрезмерно экстраполирует некий базовый шаблон открытый еще в середине прошлого века. Вся вышестоящая архитектура связей и процессов образующих высшую нервную деятельность не воспроизводится никакой LLM. Говорить о каком то подобии, аналогии или схожести бессмысленно. Это как уровень сходства как между живым человеком и механизированным манекеном - ничего общего кроме формы и отдельных движений.

Мозг - эволюционно проверенная машина обеспечивающаяя хорошие шансы на выживание своего обладателя. LLM-ка просто "дурилка картонная".)) 

Собственно, посыл такой: сравнивать разум, интеллект, нервную систему, живые нейроны и разные формы их программной имитации, и утверждать при этом что то, говоря слова типа "единственная разница между живым разумом/интеллектом/нейросетью/нейроном/и тд... и искусственным, ЛИШЬ ТОЛЬКО В ТОМ..." - значит многое чего... не учитывать/не знать/не разбираться/преувеличивать/искажать/ и тд...

Но, это бывает.)
 

Утёнок на чёрном коте. Миджорни


 

Цивилизация Ацтеков. Миджорни


 

Крылатый автомобиль. Midjourney


 

Вышла новая, улучшенная версия GPT-4 Omni, которая уже бьет все рекорды


• Новая модель GPT4 Omni превосходит своих предшественников и таинственный gpt2-chatbot.
• Модель появится в виде приложения для ПК и будет бесплатной для всех пользователей.
• GPT4o натренирована на тексте, фото и видео, обеспечивая мультимодальность.
• Модель доступна через API и стоит в два раза дешевле, работает в 2 раза быстрее.
• GPT-4 Omni понимает эмоции и тон голоса, общается естественным и понятным языком.
• Модель умеет шутить и понимать эмоции, делает паузы при запросах.
• GPT-4 Omni детектирует эмоции на камере и умеет переводить разные языки голосом.
• Модель практически невозможно отличить от живого человека.
• Новая токенизация для различных языков будет дешевле, а длина контекста выросла в разы.
• Модель доступна в виде приложения на ПК и предоставляет личный ассистент.
• Режим разговора будет доступен для подписчиков Plus в ближайшие дни.

 

GPT4 Omni на самом деле большой шаг вперёд по развитию ИИ.

Вот и Мэтт записал видео.

Русская озвучка есть в Яндекс.Браузере

//А завтра будут новости с презентации Google.


 

Цитаты Сэма Альтмана

1. Мне интересно, возможна ли в будущем система универсального базового дохода, где каждый получит часть вычислительных мощностей, к примеру, от GPT-7, и сможет использовать их, продавать, жертвовать на научные исследования.

2. Я не большой поклонник текущей политики, направленной на помощь бедным людям, и отчасти верю в то, что если правительство могло бы просто давать людям деньги, тогда они бы принимали правильные решения, а рынок делал бы свое дело.

В этом интервью было:

В другом интервью Сэм Альтман поделился мнением, как выжить в эпоху ИИ. Важны следующие навыки: 

- Глубокое знакомство с инструментами;

- Быть в курсе изменений;

- Развитие интуиции в отношении ИИ-инструментов, знать, куда все движется, и как этим пользоваться;

- Устойчивость и способность быстро учиться и развиваться вместе с технологиями.

 

Представлен ИИ генератор видео VEO - конкурент Sora, но от Google.

https://deepmind.google/technologies/veo/

Пример генерации


 

Вся презентация Google

Google Keynote (Google I/O ‘24)



51:38 Введение в Google I/O


• Марк Руббиер представляет Google I/O, конференцию, посвященную искусственному интеллекту и музыке.

• Он обсуждает новую технологию, которая генерирует музыку с нуля, используя искусственный интеллект.


52:46 Музыкальные эффекты Google


• Марк демонстрирует, как машина Google может создавать музыку, используя подсказки от пользователя.

• Он также обсуждает, как эта технология может быть использована в других областях, таких как поиск и фотографии.


01:16:27 Будущее искусственного интеллекта


• Марк обсуждает, как Google инвестирует в искусственный интеллект уже более десяти лет и как это помогает разработчикам и стартапам.

• Он также объявляет о планах по внедрению новых возможностей искусственного интеллекта в свои продукты, такие как поиск и фотографии.


01:21:35 Мультимодальность и контекстное окно


• Gemini 1.5 Pro с расширенным контекстным окном позволяет задавать вопросы и получать ответы на основе различных типов входных данных, включая фотографии, текст, аудиозаписи и видео.

• Gemini 1.5 Pro также может обрабатывать большие объемы данных, такие как сотни страниц текста или часы аудиозаписей.


01:27:53 Использование Gemini в Google Workspace


• Gemini 1.5 Pro доступна в Google Workspace для разработчиков и потребителей.

• Gemini может помочь родителям быть в курсе событий в школе своего ребенка, обобщая последние электронные письма и анализируя вложения.

• Gemini также может создавать учебные пособия, часто задаваемые вопросы и тесты на основе материалов, предоставленных пользователем.


01:32:29 Мультимодальность и искусственный интеллект


• Видео демонстрирует возможности мультимодальности и искусственного интеллекта, включая использование агентов с искусственным интеллектом для выполнения различных задач.

• Приводится пример использования агентов для покупок, возврата обуви, подготовки к мероприятиям и обновления информации на веб-сайтах.


01:39:05 Проект Astra и новые достижения


• Проект Astra представляет собой универсальный агент с искусственным интеллектом, способный понимать и реагировать на мультимодальную информацию.

• Представлены новые достижения в области поддержки искусственного интеллекта, включая улучшение звучания агентов и их способности к контекстуальному пониманию.


01:43:15 Будущее искусственного интеллекта


• В будущем ожидается появление новых форм-факторов искусственного интеллекта, таких как очки, и его использование в различных продуктах Google, включая приложение Gemini.


01:44:31 Создание изображений с помощью искусственного интеллекта


• Google представляет новую модель Imagine Three для создания изображений с более высоким качеством и детализацией.

• Модель понимает подсказки, написанные людьми, и может включать мелкие детали, такие как полевые цветы или маленькая синяя птичка.


01:46:43 Генеративная музыка


• Google работает с музыкантами, авторами песен и продюсерами для создания новых инструментальных разделов, переноса стилей между треками и других творческих возможностей.

• Инструменты искусственного интеллекта ускоряют процесс извлечения идей из головы и позволяют достичь скорости света в творческом процессе.


01:48:51 Видео в родительном падеже


• Google DeepMind обучает модель видео в родительном падеже Voo, которая создает высококачественные видеоролики на основе текстовых, графических и видео-подсказок.

• Модель может передавать детали инструкций в различных визуальных и кинематографических стилях, позволяя пользователям создавать более длинные сцены и редактировать видео с помощью дополнительных подсказок.


01:53:47 Графические процессоры и облачные вычисления


• Google предлагает графические процессоры Blackwell от Nvidia для облачных клиентов, а также центральные и графические процессоры для поддержки любых рабочих нагрузок.

• Компания также предлагает гиперкомпьютеры с искусственным интеллектом, которые объединяют аппаратное обеспечение, программное обеспечение и модели потребления для решения сложных задач.


01:56:15 Обзор искусственного интеллекта


• Google Search предлагает новые возможности для поиска, используя искусственный интеллект и информацию в режиме реального времени.

• Обзоры искусственного интеллекта будут доступны для всех пользователей Google Search в США с сегодняшнего дня.


02:01:16 Планирование и мозговой штурм


• Google Search помогает планировать поездки, питание и другие мероприятия, используя многоступенчатое обоснование и информацию в режиме реального времени.

• Поиск может помочь с мозговым штурмом, предоставляя идеи и информацию на основе контекста.


02:05:23 Поиск с помощью видео


• В будущем пользователи смогут задавать вопросы с помощью видео в Google Search.

• Демонстрация показывает, как поиск может помочь с ремонтом проигрывателя грампластинок, используя видео и искусственный интеллект.


02:08:23 Использование Gemini для организации рабочего пространства


• Персонаж видео использует Gemini для организации своего рабочего пространства, справляясь с различными задачами и проблемами.

• Gemini помогает персонажу справиться с различными задачами, такими как организация рабочего пространства и управление проектами.


02:10:44 Использование Gemini в Gmail


• Gemini для Workspace становится еще более полезным для бизнеса и потребителей, с новыми возможностями, такими как боковая панель с питанием от Gemini.

• Gemini для Workspace помогает повысить производительность службы поддержки клиентов на 30%.


02:15:19 Использование Gemini для автоматизации процессов


• Gemini предлагает возможность автоматизировать процессы, такие как создание папок на диске и извлечение информации из электронных писем.

• Gemini может помочь в создании сложных электронных таблиц и анализе данных.

• Gemini также может помочь в планировании и управлении проектами, используя информацию из Gmail.


02:17:42 Возможности Workspace


• В сентябре пользователи Workspace получат возможность упорядочивать вложения, управлять дисками и создавать таблицы для анализа данных.

• Workspace продолжает открывать новые способы выполнения задач, включая автоматизацию и использование искусственного интеллекта.


02:19:28 Виртуальные партнеры по команде


• Виртуальные партнеры по команде настраиваются предприятиями для помощи в выполнении задач.

• Чип, виртуальный партнер по команде, может отслеживать проекты, мониторить и отслеживать их, а также создавать коллективную память о совместной работе.


02:23:05 Приложение Gemini


• Gemini предоставляет доступ к новейшим моделям искусственного интеллекта Google, включая возможность вести углубленную беседу с использованием голоса.

• В приложении Gemini можно настроить "драгоценные камни" - персональных экспертов по любой теме.

• Gemini становится на шаг ближе к тому, чтобы стать настоящим помощником искусственного интеллекта, планируя и предпринимая действия за пользователя.


02:28:56 Возможности искусственного интеллекта


• Чат-бот Gemini Advanced позволяет обрабатывать большие объемы информации, включая PDF-файлы, электронные таблицы и аудиозаписи.

• Gemini Advanced может анализировать данные и предоставлять советы по работе над диссертацией, а также анализировать доходы и расходы.


02:34:01 Использование искусственного интеллекта на Android


• Circle to Search - поиск на базе искусственного интеллекта, доступный на Android.

• Gemini - помощник с искусственным интеллектом на Android, который помогает в учебе и работе.

• Gemini учитывает контекст работы и предлагает полезные предложения в зависимости от ситуации.


02:40:47 Улучшение работы смартфонов с помощью искусственного интеллекта


• Android становится первой мобильной операционной системой с встроенной моделью искусственного интеллекта.

• Gemini Nano улучшает работу смартфонов, обеспечивая более полное и ясное описание мира для пользователей.

• Gemina Nano помогает защитить пользователей от мошенничества, предупреждая о подозрительных звонках и переводах денег.


02:45:44 Использование искусственного интеллекта для разработчиков


• Gemina 1.5 Pro и 1.5 Flash доступны для разработчиков, с возможностью выбора между мультимодальными и одномодальными моделями.

• Gemma - семейство открытых моделей, которые стимулируют инновации и ответственность в области искусственного интеллекта.

• Gemma 2 - следующая генерация Gemma, которая появится в продаже в июне.


02:53:09 Использование искусственного интеллекта для обучения


• В Индии существует огромное разнообразие языков, и технологии должны адаптироваться к таким условиям.

• Gemma - мощный токенизатор, который позволяет моделям использовать сотни тысяч слов и символов в разных алфавитах и языковых системах.

• Navarasa - усовершенствованная модель, основанная на Gemma от Google, которая обучена индийским языкам и помогает людям говорить на своем родном языке и получать ответы на нем.


02:55:51 Ответственное построение искусственного интеллекта


• Google совершенствует свои модели защиты от неправильного использования, используя методы тестирования безопасности и отзывы экспертов.

• Компания также разрабатывает новые инструменты для предотвращения неправильного использования своих моделей, такие как Imagine Three и Vo.

• В будущем планируется открыть доступ к текстовым водяным знакам Synth ID с открытым исходным кодом.


03:00:28 Применение искусственного интеллекта для обучения


• Генеративный искусственный интеллект открывает новые возможности для обучения, позволяя задавать вопросы и получать советы по любой теме.

• В приложении Gemini уже доступны пользовательские версии Gemma, которые могут выступать в качестве персональных экспертов-ассистентов по любой теме.

• На YouTube используется Learner для создания интерактивных обучающих видеороликов, позволяющих задавать уточняющие вопросы и проходить тесты.

• Google сотрудничает с экспертами и учреждениями для тестирования и улучшения новых возможностей в своих моделях обучения.


03:04:52 Рекордное количество упоминаний искусственного интеллекта


• В видео упоминается рекордное количество упоминаний слова "искусственный интеллект" за один день.

• Это отражает прогресс в области искусственного интеллекта и лидерство компании в этой области.


03:05:52 Благодарность сообществу разработчиков


• Компания благодарит сообщество разработчиков за их вклад в развитие искусственного интеллекта.

• Они подчеркивают важность опыта и инноваций, которые создают разработчики каждый день.


03:06:07 Представление Джемини


• Джемини, представитель компании, представляет себя и говорит о том, что они создают новую эру.

• Они объединяют различные инструменты и возможности для создания мощной комбинации.