Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
ONNX Runtime v1.13 — обзор релиза
ONNX Runtime v1.13 — обзор релиза
Недавно была выпущена версия 1.13 среды выполнения ONNX с исправлениями безопасности, исправлениями ошибок и улучшениями производительности. Обновление направлено на оптимизацию моделей Transformer для квантования графического процессора и добавляет поддержку поставщиков прямого выполнения ML, которые не зависят от устройства и поддерживают более 150 операторов. Кроме того, в выпуск включены обновления мобильной инфраструктуры ORT для совместимости с новыми EPS, такими как пакет XNN. Также обсуждается использование квантования для повышения производительности моделей на основе Transformer с оптимизацией поставщика выполнения CUDA для запуска квантованной модели BERT и использованием обучения с учетом квантования для максимальной точности при оптимизации механизма выполнения ONNX.
Что такое ONNX Runtime (ORT)?
Что такое ONNX Runtime (ORT)?
ONNX Runtime (ORT) — это библиотека, которая оптимизирует и ускоряет вывод машинного обучения, позволяя пользователям обучать свои модели в любой поддерживаемой библиотеке машинного обучения, экспортировать в формат ONNX и выполнять вывод на предпочитаемом языке. Докладчик приводит пример выполнения логических выводов с использованием PyTorch с ONNX Runtime и указывает, что пользователи могут посетить ONNXRuntime.ai, чтобы изучить различные API и инструменты, необходимые для предпочтительной настройки.
Обсуждение дорожной карты ONNX на 2020 год №1 20200903
Обсуждение дорожной карты ONNX на 2020 год №1 20200903
Документ дорожной карты ONNX, который был открыт для общественности, является ключевой темой этого видео. Обсуждение охватывает расширение ONNX на конвейере машинного обучения, включая развитие данных, предварительную обработку и расширение ONNX на горизонтальные конвейеры, такие как QFLO. Предложения участников включают поддержку фреймов данных и внедрение новых операторов для предварительной обработки. Выступающие также обсудили принятие стандарта API данных Python для расширения поддержки ONNX и гарантии взаимодействия с другими библиотеками. Кроме того, спикеры обсуждают интеграцию ONNX в Kubernetes и Kubeflow, чтобы упростить разработку машинного обучения для пользователей. Группа планирует продолжить оценку влияния предложения и приветствует отзывы через дорожную карту или руководящий комитет.
Обсуждение дорожной карты ONNX на 2020 год № 2 20200909
/p>
Обсуждение дорожной карты ONNX на 2020 год № 2 20200909
В видео «Обсуждение дорожной карты ONNX» докладчики обсуждают различные темы, связанные с дорожной картой ONNX, включая определение формы, определения операторов, эталонные реализации и спецификацию ONNX. Выступающие предлагают создать общую инфраструктуру вывода формы для улучшения оптимизации вывода формы, сокращения количества примитивных операторов, добавления эталонных реализаций для каждого оператора и более определенных тестовых случаев для обеспечения правильной реализации и тестирования ONNX. Группа планирует продолжить обсуждения в SIG оператора и на доске обсуждений GitHub для добавления нового оператора.
Обсуждение дорожной карты ONNX на 2020 год № 3 20200916
Обсуждение дорожной карты ONNX на 2020 год № 3 20200916
В этом видео обсуждаются различные темы, связанные с ONNX, включая улучшение обработки ошибок, добавление предопределенного поля схемы метаданных для обозначения создания модели, необходимость физической оптимизации квантования и возможность обновления моделей ONNX из Model Zoo в самые последние версии. Команда планирует расставить приоритеты по этим темам в зависимости от их влияния и стоимости и работать над ними после выпуска 1.8. Кроме того, группа рассматривает идею создания различных языковых привязок для набора инструментов ONNX с особым интересом к Java для поддержки различных платформ, таких как Spark. Спикеры также обсудили возможность создания Java-оболочки вокруг ONNX Runtime.
Обсуждение дорожной карты ONNX на 2020 год № 4 20200923
Обсуждение дорожной карты ONNX на 2020 год № 4 20200923
Четвертая часть обсуждения дорожной карты ONNX охватывает темы поддержки фреймов данных, предварительной обработки, стандартизации, сквозного конвейера машинного обучения и рекомендаций по инструментам. Поддержка фреймов данных оценивается как полезная для классических моделей машинного обучения и может устранить необходимость в предварительной обработке. Подчеркнута необходимость включения предварительной обработки в модель ONNX для повышения производительности с упором на стандартизацию высокоуровневых категорий, таких как обработка изображений. Сквозной конвейер оценивается как низкоприоритетный, но предлагается постепенное добавление компонентов в конвейер. Обсуждение завершается рекомендацией использовать инструмент для дальнейшего обсуждения и анализа пунктов повестки дня.
Обсуждение дорожной карты ONNX на 2020 год № 5 20201001
Обсуждение дорожной карты ONNX на 2020 год № 5 20201001
Во время обсуждения дорожной карты ONNX команда ONNX обсудила различные функции, которые были предложены членами сообщества и оценены разными людьми, включая руководящий комитет. В то время как некоторые функции были согласованы единогласно, другие разделили сообщество. Команда обсудила возможность замены ONNX IR на несколько IR и централизованные библиотеки оптимизации IR. Они также обсудили идею централизации библиотек оптимизации внутри ONNX и требование к операторам реализовать стандартный интерфейс и стиль кодирования. Команда также обсудила возможность использования простой среды выполнения для моделей ONNX и использования пользовательских операций Python для случаев, когда среда выполнения ONNX недоступна. Кроме того, команда исследовала взаимосвязь между операциями предварительной обработки и использованием фреймов данных, планируя превратить свои идеи в действенные предложения для будущей работы.
Обсуждение дорожной карты ONNX на 2021 год №1 20210908
Обсуждение дорожной карты ONNX на 2021 год №1 20210908
Во время обсуждения дорожной карты ONNX компания IBM Research представила свое предложение по новой платформе конвейера машинного обучения, которая преобразует типичные шаблоны предварительной обработки данных в Pandas Dataframe в формат ONNX. Платформа под названием Data Frame Pipeline имеет открытый исходный код на GitHub и может быть определена с помощью предоставленного API, который запускается на Python на этапе обучения. Выступавшие также обсудили необходимость сделать ONNX видимым на языках, отличных от Python, таких как Java, C# и C++, а также экспортировать модели ONNX и создавать их из других языков. Кроме того, они обсудили текущие функции преобразователей ONNX Python и C++, а также необходимость функций определения области, именования и исправления при написании моделей ONNX.
Обсуждение дорожной карты ONNX на 2021 год № 2 20210917
Обсуждение дорожной карты ONNX на 2021 год № 2 20210917
В обсуждении дорожной карты ONNX № 2 20210917 различные докладчики обсудили несколько ключевых областей, в которых ONNX нуждается в улучшении, включая удобство квантования и слияния, оптимизацию ядер для конкретных аппаратных платформ и добавление локальных функций модели в ONNX. Другие темы включали отзывы о сквозной поддержке конвейера, проблемы, с которыми сталкиваются клиенты на разных платформах, и проблемы с преобразованием графов GRU и LSTM. Некоторые предлагаемые решения включали предоставление серверной части дополнительной информации для выполнения предварительно квантованных графов, улучшение функциональной совместимости различных платформ и включение пространства имен, связанного с исходным графом, чтобы обеспечить как общее, так и оптимизированное решение. Кроме того, докладчики обсудили необходимость более эффективного развертывания пакетов для более широкого внедрения и возможность разработки дополнительных преобразователей для поддержки мультимодальных моделей.
Обсуждение дорожной карты ONNX на 2021 год № 3 20210922
Обсуждение дорожной карты ONNX на 2021 год № 3 20210922
Во время обсуждения дорожной карты ONNX докладчики говорили о необходимости исправить проблемы с инструментом преобразования смещения ONNX, чтобы улучшить внедрение ONNX с последним оптимизированным стеком для определенных случаев использования. Выступавшие предложили улучшить охват моделей для тестирования преобразования смещения и разрешения промежуточных шагов, которые в настоящее время отсутствуют в тестах операторов или слоев. Они также обсудили важность метаданных и инфраструктуры федеративного обучения, в том числе необходимость включения метаданных в спецификацию ONNX для передачи аннотаций обучения и концепцию федеративного обучения для обеспечения конфиденциальности, эффективности и использования вычислительных ресурсов. Выступавшие призвали сообщество к сотрудничеству и запросили отзывы для дальнейшего обсуждения и реализации этих идей. Следующее заседание запланировано на 1 октября.