Midjourney и другие нейросети обработки изображений - страница 520
Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
Вся презентация Google
Google Keynote (Google I/O ‘24)
51:38 Введение в Google I/O
• Марк Руббиер представляет Google I/O, конференцию, посвященную искусственному интеллекту и музыке.
• Он обсуждает новую технологию, которая генерирует музыку с нуля, используя искусственный интеллект.
52:46 Музыкальные эффекты Google
• Марк демонстрирует, как машина Google может создавать музыку, используя подсказки от пользователя.
• Он также обсуждает, как эта технология может быть использована в других областях, таких как поиск и фотографии.
01:16:27 Будущее искусственного интеллекта
• Марк обсуждает, как Google инвестирует в искусственный интеллект уже более десяти лет и как это помогает разработчикам и стартапам.
• Он также объявляет о планах по внедрению новых возможностей искусственного интеллекта в свои продукты, такие как поиск и фотографии.
01:21:35 Мультимодальность и контекстное окно
• Gemini 1.5 Pro с расширенным контекстным окном позволяет задавать вопросы и получать ответы на основе различных типов входных данных, включая фотографии, текст, аудиозаписи и видео.
• Gemini 1.5 Pro также может обрабатывать большие объемы данных, такие как сотни страниц текста или часы аудиозаписей.
01:27:53 Использование Gemini в Google Workspace
• Gemini 1.5 Pro доступна в Google Workspace для разработчиков и потребителей.
• Gemini может помочь родителям быть в курсе событий в школе своего ребенка, обобщая последние электронные письма и анализируя вложения.
• Gemini также может создавать учебные пособия, часто задаваемые вопросы и тесты на основе материалов, предоставленных пользователем.
01:32:29 Мультимодальность и искусственный интеллект
• Видео демонстрирует возможности мультимодальности и искусственного интеллекта, включая использование агентов с искусственным интеллектом для выполнения различных задач.
• Приводится пример использования агентов для покупок, возврата обуви, подготовки к мероприятиям и обновления информации на веб-сайтах.
01:39:05 Проект Astra и новые достижения
• Проект Astra представляет собой универсальный агент с искусственным интеллектом, способный понимать и реагировать на мультимодальную информацию.
• Представлены новые достижения в области поддержки искусственного интеллекта, включая улучшение звучания агентов и их способности к контекстуальному пониманию.
01:43:15 Будущее искусственного интеллекта
• В будущем ожидается появление новых форм-факторов искусственного интеллекта, таких как очки, и его использование в различных продуктах Google, включая приложение Gemini.
01:44:31 Создание изображений с помощью искусственного интеллекта
• Google представляет новую модель Imagine Three для создания изображений с более высоким качеством и детализацией.
• Модель понимает подсказки, написанные людьми, и может включать мелкие детали, такие как полевые цветы или маленькая синяя птичка.
01:46:43 Генеративная музыка
• Google работает с музыкантами, авторами песен и продюсерами для создания новых инструментальных разделов, переноса стилей между треками и других творческих возможностей.
• Инструменты искусственного интеллекта ускоряют процесс извлечения идей из головы и позволяют достичь скорости света в творческом процессе.
01:48:51 Видео в родительном падеже
• Google DeepMind обучает модель видео в родительном падеже Voo, которая создает высококачественные видеоролики на основе текстовых, графических и видео-подсказок.
• Модель может передавать детали инструкций в различных визуальных и кинематографических стилях, позволяя пользователям создавать более длинные сцены и редактировать видео с помощью дополнительных подсказок.
01:53:47 Графические процессоры и облачные вычисления
• Google предлагает графические процессоры Blackwell от Nvidia для облачных клиентов, а также центральные и графические процессоры для поддержки любых рабочих нагрузок.
• Компания также предлагает гиперкомпьютеры с искусственным интеллектом, которые объединяют аппаратное обеспечение, программное обеспечение и модели потребления для решения сложных задач.
01:56:15 Обзор искусственного интеллекта
• Google Search предлагает новые возможности для поиска, используя искусственный интеллект и информацию в режиме реального времени.
• Обзоры искусственного интеллекта будут доступны для всех пользователей Google Search в США с сегодняшнего дня.
02:01:16 Планирование и мозговой штурм
• Google Search помогает планировать поездки, питание и другие мероприятия, используя многоступенчатое обоснование и информацию в режиме реального времени.
• Поиск может помочь с мозговым штурмом, предоставляя идеи и информацию на основе контекста.
02:05:23 Поиск с помощью видео
• В будущем пользователи смогут задавать вопросы с помощью видео в Google Search.
• Демонстрация показывает, как поиск может помочь с ремонтом проигрывателя грампластинок, используя видео и искусственный интеллект.
02:08:23 Использование Gemini для организации рабочего пространства
• Персонаж видео использует Gemini для организации своего рабочего пространства, справляясь с различными задачами и проблемами.
• Gemini помогает персонажу справиться с различными задачами, такими как организация рабочего пространства и управление проектами.
02:10:44 Использование Gemini в Gmail
• Gemini для Workspace становится еще более полезным для бизнеса и потребителей, с новыми возможностями, такими как боковая панель с питанием от Gemini.
• Gemini для Workspace помогает повысить производительность службы поддержки клиентов на 30%.
02:15:19 Использование Gemini для автоматизации процессов
• Gemini предлагает возможность автоматизировать процессы, такие как создание папок на диске и извлечение информации из электронных писем.
• Gemini может помочь в создании сложных электронных таблиц и анализе данных.
• Gemini также может помочь в планировании и управлении проектами, используя информацию из Gmail.
02:17:42 Возможности Workspace
• В сентябре пользователи Workspace получат возможность упорядочивать вложения, управлять дисками и создавать таблицы для анализа данных.
• Workspace продолжает открывать новые способы выполнения задач, включая автоматизацию и использование искусственного интеллекта.
02:19:28 Виртуальные партнеры по команде
• Виртуальные партнеры по команде настраиваются предприятиями для помощи в выполнении задач.
• Чип, виртуальный партнер по команде, может отслеживать проекты, мониторить и отслеживать их, а также создавать коллективную память о совместной работе.
02:23:05 Приложение Gemini
• Gemini предоставляет доступ к новейшим моделям искусственного интеллекта Google, включая возможность вести углубленную беседу с использованием голоса.
• В приложении Gemini можно настроить "драгоценные камни" - персональных экспертов по любой теме.
• Gemini становится на шаг ближе к тому, чтобы стать настоящим помощником искусственного интеллекта, планируя и предпринимая действия за пользователя.
02:28:56 Возможности искусственного интеллекта
• Чат-бот Gemini Advanced позволяет обрабатывать большие объемы информации, включая PDF-файлы, электронные таблицы и аудиозаписи.
• Gemini Advanced может анализировать данные и предоставлять советы по работе над диссертацией, а также анализировать доходы и расходы.
02:34:01 Использование искусственного интеллекта на Android
• Circle to Search - поиск на базе искусственного интеллекта, доступный на Android.
• Gemini - помощник с искусственным интеллектом на Android, который помогает в учебе и работе.
• Gemini учитывает контекст работы и предлагает полезные предложения в зависимости от ситуации.
02:40:47 Улучшение работы смартфонов с помощью искусственного интеллекта
• Android становится первой мобильной операционной системой с встроенной моделью искусственного интеллекта.
• Gemini Nano улучшает работу смартфонов, обеспечивая более полное и ясное описание мира для пользователей.
• Gemina Nano помогает защитить пользователей от мошенничества, предупреждая о подозрительных звонках и переводах денег.
02:45:44 Использование искусственного интеллекта для разработчиков
• Gemina 1.5 Pro и 1.5 Flash доступны для разработчиков, с возможностью выбора между мультимодальными и одномодальными моделями.
• Gemma - семейство открытых моделей, которые стимулируют инновации и ответственность в области искусственного интеллекта.
• Gemma 2 - следующая генерация Gemma, которая появится в продаже в июне.
02:53:09 Использование искусственного интеллекта для обучения
• В Индии существует огромное разнообразие языков, и технологии должны адаптироваться к таким условиям.
• Gemma - мощный токенизатор, который позволяет моделям использовать сотни тысяч слов и символов в разных алфавитах и языковых системах.
• Navarasa - усовершенствованная модель, основанная на Gemma от Google, которая обучена индийским языкам и помогает людям говорить на своем родном языке и получать ответы на нем.
02:55:51 Ответственное построение искусственного интеллекта
• Google совершенствует свои модели защиты от неправильного использования, используя методы тестирования безопасности и отзывы экспертов.
• Компания также разрабатывает новые инструменты для предотвращения неправильного использования своих моделей, такие как Imagine Three и Vo.
• В будущем планируется открыть доступ к текстовым водяным знакам Synth ID с открытым исходным кодом.
03:00:28 Применение искусственного интеллекта для обучения
• Генеративный искусственный интеллект открывает новые возможности для обучения, позволяя задавать вопросы и получать советы по любой теме.
• В приложении Gemini уже доступны пользовательские версии Gemma, которые могут выступать в качестве персональных экспертов-ассистентов по любой теме.
• На YouTube используется Learner для создания интерактивных обучающих видеороликов, позволяющих задавать уточняющие вопросы и проходить тесты.
• Google сотрудничает с экспертами и учреждениями для тестирования и улучшения новых возможностей в своих моделях обучения.
03:04:52 Рекордное количество упоминаний искусственного интеллекта
• В видео упоминается рекордное количество упоминаний слова "искусственный интеллект" за один день.
• Это отражает прогресс в области искусственного интеллекта и лидерство компании в этой области.
03:05:52 Благодарность сообществу разработчиков
• Компания благодарит сообщество разработчиков за их вклад в развитие искусственного интеллекта.
• Они подчеркивают важность опыта и инноваций, которые создают разработчики каждый день.
03:06:07 Представление Джемини
• Джемини, представитель компании, представляет себя и говорит о том, что они создают новую эру.
• Они объединяют различные инструменты и возможности для создания мощной комбинации.
Дендроиды. Миджорни
Известные Миньоны. Миджорни
Не терпится услышать новости с презентации Google - кто знает, какие еще удивительные разработки мы увидим...
Выше уже писал.
Вот кратко:
Gemma, семейство моделей с открытым кодом, основанных на технологиях Gemini, пополнили новые приложения: CodeGemma (для помощи при написании кода), Recurrent Gemma (для оптимизации использования памяти) и PaliGemma (для мультимодальных задач, объединяющих язык и изображения). Кроме того, была анонсирована модель Gemma 2 с 27 миллиардами параметров, в то время как текущие версии имеют 2 и 7 миллиардов параметров.
Также было представлено улучшенное приложение Gemini 1.5 Pro, способное анализировать до 2 миллионов токенов. Мультимодальное приложение Gemini 1.5 Pro будет встроено во все сервисы Google, позволяя модели взаимодействовать с Google Диск, почтой и офисными сервисами.
Кроме того, самая легкая модель от Google, Gemini Nano, будет интегрирована в десктопное приложение Chrome и появится на Android. Эта мультимодальная и автономная модель способна работать с различными типами информации даже без интернета.
Модель Veo от Google представляет собой инструмент, способный создавать видеоклипы разрешением 1080p длительностью около минуты на основе текстового описания. Veo может передавать различные визуальные и кинематографические стили, а также редактировать уже сгенерированные кадры.
Imagen 3 - новая версия модели генерации изображений от Google, которая лучше понимает текстовые запросы и обрабатывает текст, генерируя более креативные и детализированные изображения.
Проект Astra - AI-ассистент, способный быстро отвечать на вопросы пользователя о содержании видео, которое записывается в режиме реального времени с телефона или умных очков.
Наконец, Music AI Sandbox - инструмент искусственного интеллекта для работы с музыкой.
В офисе Open AI снова перестановки. Сооснователь Илья Суцкевер уходит, чтобы заняться своими проектами.
Кибер Скелет. Миджорни
Да, GPT-4 Omni действительно представляет собой значительный прогресс в развитии искусственного интеллекта. Его способность понимать и генерировать текст на различных языках, включая русский, открывает новые возможности для коммуникации и работы с данными...
В офисе Open AI снова перестановки. Сооснователь Илья Суцкевер уходит, чтобы заняться своими проектами.