00:05:00 ONNX ロードマップ ディスカッションのこのセクションでは、参加者は、ONNX IR を複数の IR および集中型 IR 最適化ライブラリに変更するというアイデアについて話し合います。最適化と IR は別の問題であるため、これら 2 つのアイデアをグループ化する必要があるかどうかについては、いくつかの議論があります。複数の IR を持つことの目標は、最適化ライブラリがコア ONNX を改善する一方で、より単純な操作を単純化および連結することです。 ONNX IR の意味についてはさらに議論があり、明確化が必要です。参加者は、これらの潜在的な変更が ONNX ロードマップの現在のスコアにどのように影響するかについても話し合います。
00:15:00 このセクションでは、スピーカーはモデル チェックのコア機能と、他の言語で公開されるとどのように役立つかについて説明します。彼らはそれを Java で実現したいと考えていますが、誰もが Java API を作成するわけではないことを理解しているため、ほとんどの言語が簡単にバインドできる C API の方が適しています。ただし、人々がバインドするための安定した適切なターゲットが必要であり、これらのツールのいずれかの C++ API がバインドの適切なターゲットと見なされるかどうかはすぐにはわかりません。講演者はこの取り組みに喜んで参加しますが、コミュニティからの関心がない限り、大規模な取り組みを促進しようとする価値はありません。
1. Takuya Nakaike (IBM) – New operators for data processing to cover ML pipeline (eg: StringConcatenator, StringSplitter, Date)2. Adam Pocock (Oracle Labs) –...
1. Martin Croome (Greenwaves) – Add meta information in tensors2. Andrew Sica (IBM) – E2E pipeline with ONNX operators (include Keras, TF, Scikit-learn/Spark...
00:00:00 ワークショップのこのセクションでは、主催者が概要を説明し、すべての参加者を歓迎します。彼らは、AI に利用できる膨大な数の製品について言及し、参加者にそれをチェックするよう促しています。ワークショップの全体的な目標は、ONNX、そのプロセス、ロードマップ、およびリリースに関する最新情報を入手し、ONNX がどのように使用されているかについてコミュニティの参加者から学ぶことです。彼らは、参加者がフィードバックを共有し、ONNX 運営委員会、SIG、およびワーキング グループにさらに関与することを奨励しています。彼らは議題の概要を提供します。これには、ONNX ワーキング グループのロジスティクス、Wenming Yi による State of the State プレゼンテーション、続いて Alex、およびコミュニティ プレゼンテーションが含まれます。最後に、彼らは ONNX の統計に関するエキサイティングな更新を提示します。これには、毎月のダウンロードがほぼ 400% 増加して毎月 160 万に達し、エコシステムの健全な成長が示されています。
Event: LF AI & Data Day - ONNX Community Meeting, October 21, 2021Talk Title: ONNX Steering Committee (SC) Update - Host Welcome, Progress, Governance, Roadm...
00:40:00 Operator SIG の Rama は、ONNX 仕様に対する最近の変更と更新の概要を説明しました。 Operator SIG の焦点は、ONNX 仕様を構成する一連のオペレーターを進化させ、新しいオペレーターを追加し、その仕様を明確にすることです。過去 2 つのリリースでは、グリッド サンプルやレイヤーの正規化などの新しい演算子が導入されました。 scatter op などの既存の演算子は重複インデックスをサポートするように更新されましたが、一部の op は b float 16 やオプションの型などの型をサポートするように拡張されました。 Rama はまた、新しいオペレーターの一部をまもなく関数に昇格させる計画についても言及しました。
01:00:00 Microsoft の Jackie が ONNX Model Zoo と ONNX チュートリアルを紹介します。 ONNX Model Zoo は、トレーニング済みの最先端の機械学習モデルのコレクションであり、主に ONNX コミュニティによって提供されています。現在、動物園には 168 のモデルがあり、その中には 40 の ONNX モデルと、画像分類と物体検出用の 35 の視覚ベースの ONNX モデルが含まれています。 ONNX チュートリアルでは、さまざまなシナリオやプラットフォームで ONNX を実際に使用する方法を説明するドキュメントとノートブックを提供しています。 Model Zoo は前回のワークショップ以降、Intel の新しい量子化モデル、定期的な CI テストによるテスト カバレッジの向上、壊れたテスト データセットの修正、Hugging Face チームと協力してモデルのデモ用の Web インターフェイスを作成するなど、いくつかの改善が見られました。
01:05:00 講演者は、ONNX を使用するためのチュートリアルとデモの可用性について説明します。これには、Python コードを数行書くだけで画像と ONNX モデルを簡単に処理できる Web サイトが含まれます。また、ONNX Model Zoo の将来のロードマップについても説明しています。ORT でより多くのモデルを実行できるようにし、量子化されたモデルやサンプル モデルのトレーニングなど、より多くの貢献を組み込む計画があります。さらに、ONNX モデルで使用するデータの前処理を容易にすることに重点を置いている ONNX Preprocessing Working Group の作業を強調しています。
02:20:00 このセクションでは、データとデジタル資産をアクセス可能、相互運用可能、再利用可能にするための指針となる一連の Furnace コントロール語彙について講演者が説明します。 Furnace の原則は、セマンティック Web コミュニティによって特定され、公平性、信頼性、および持続可能性が含まれます。 RDF でエンコードされたメタデータは、Furnace オントロジーを使用してクエリを実行し、NLP タスクに適したモデルを発見し、モデルの作成者とサイズを特定し、モデルの二酸化炭素排出量を追跡して分類およびソートできます。 RDF とそのクエリ言語である Sparkle の拡張性により、試験当局が選択した語彙を超えた無限の拡張性が可能になります。これにより、責任ある AI と混合精度電流の追跡が可能になります。
02:25:00 このセクションでは、プレゼンターが ONNX Community Day のクエリ機能とフィルタリング機能について説明します。これらは、メタデータ作成者が、メタデータ タグを使用して、プライベートまたは個人情報を含むデータセットでトレーニングされたモデルを識別する方法を示しています。また、プレゼンターは、拡張されたフィルタリング機能により、ユーザーが混合精度でモデルをクエリできるようにする方法も示します。モデル プロファイルの視覚化と、メタデータを効率的に表示するための説明可能な AI 手法が強調されています。プレゼンターは、ONNX で機械可読メタデータをサポートするハブ ワークフローからのメタデータの作成、クエリ、およびフィルタリング全体をカバーする、モデルの作成と使用に関する具体的な設計を検討するよう行動を呼びかけます。彼らは現在、ストローマンの実装を準備しており、メタデータ作成のためのテクノロジーを調査しています。
02:30:00 このセクションでは、Oracle Labs の Adam Pocock が、ONNX で Java 仮想マシン (JVM) をサポートすることの重要性について説明します。ほとんどの ML アプリケーションは Java などの Python 以外の言語で記述されていますが、これらの言語に機械学習を導入することは非常に重要です。 ONNX ランタイム Java API は、Oracle Labs によって開発され、機械学習を Java やその他の言語に組み込み、パフォーマンスへの影響を最小限に抑え、展開を容易にするなどの機能を備えています。 Adam は、Java API と他の API の類似点を示すコード例も提供しています。
This event is being hosted in-person at the brand-new Microsoft Silicon Valley Campus on Friday, June 24th. The event will cover ONNX Community updates, part...
03:40:00 このセクションでは、作成以来 ONNX ランタイムに取り組んでいるソフトウェア エンジニアである Ryan Hill が、ONNX ランタイムの機能と使用法について話します。 ONNX ランタイムは、ONNX モデルのランタイムであり、完全にクロスプラットフォームであり、多くのプログラミング言語の言語バインディングを備えています。 Microsoft は、Windows、Office、Azure などの主要な製品グループすべてでそれを使用していますが、ONNX ランタイムを使用した実稼働モデルは 160 を超えています。 Hill は、最近のリリースで注目すべき新機能を経験しています。これには、運用カーネルを数学ライブラリとして使用する機能や、外部イニシャライザを完全にメモリに供給する機能が含まれます。パフォーマンスの向上には、転置オプティマイザーの追加、ヒープ割り当ての最適化、およびレイアウト変換の必要性の削減が含まれます。
04:25:00 このセクションでは、Bazaar Voice の Matthew が、商取引のデジタル化と、ブランドや小売業者がインターネット上の無限の棚スペースに移行した方法について説明します。 e コマース企業が所有するデータの規模を考えると、AI を使用して影響力のある洞察を生み出すことは、ゲームチェンジャーになる可能性があります。 Matthew は、Bazaar Voice を例として使用してこれを説明します。Bazaar Voice は、月に 10 億人を超える買い物客のデータを管理および処理し、ブランドと小売業者に合計 80 億件を超えるレビューを提供します。カタログ全体で製品レビューを共有することに重点を置くことで、製品マッチングの概念が重要な役割を果たします。 Matthew は、固有の製品 ID を比較することによって製品マッチングを実行する機械学習モデルがどのように構築されているかを説明していますが、残りは手動で行われます。真のビジネス価値を生み出すソリューションを実装するための理想的なアプローチは、パフォーマンスを維持する軽量で費用対効果の高いソリューションです。
This event is being hosted in-person at the brand-new Microsoft Silicon Valley Campus on Friday, June 24th. The event will cover ONNX Community updates, part...
2020 ONNX ロードマップ ディスカッション #2 20200909
2020 ONNX ロードマップ ディスカッション #2 20200909
「ONNX ロードマップ ディスカッション」ビデオでは、スピーカーは、形状の推論、演算子の定義、参照実装、ONNX 仕様など、ONNX のロードマップに関連するさまざまなトピックについて説明します。講演者は、一般的な形状推論インフラストラクチャを構築して、形状推論の最適化を改善し、プリミティブ オペレーターの数を減らし、すべてのオペレーターに参照実装を追加し、より適切に定義されたテスト ケースを構築して、ONNX の適切な実装とテストを確実にすることを提案しています。このグループは、新しいオペレーターを追加するために、オペレーター SIG 内および GitHub ディスカッション ボードで議論を継続する予定です。
2020 ONNX ロードマップ ディスカッション #3 20200916
2020 ONNX ロードマップ ディスカッション #3 20200916
このビデオの議論は、エラー処理の改善、モデルの作成を示す事前定義されたメタデータ スキーマ フィールドの追加、量子化物理最適化の必要性、Model Zoo から最新バージョン。チームは、影響とコストに基づいてこれらのトピックに優先順位を付け、1.8 リリース後に取り組む予定です。さらに、このグループは、Spark などのさまざまなプラットフォームをサポートするために、Java に特に関心を持って、ONNX ツールセット用のさまざまな言語バインディングを作成するというアイデアを検討しています。スピーカーは、ONNX ランタイムの Java ラッパーを作成する可能性についても説明します。
2020 ONNX ロードマップ ディスカッション #4 20200923
2020 ONNX ロードマップ ディスカッション #4 20200923
ONNX ロードマップ ディスカッションの 4 番目の部分では、データ フレームのサポート、前処理、標準化、エンド ツー エンドの機械学習パイプライン、およびツールの推奨事項について説明します。データ フレームのサポートは、従来の機械学習モデルにとって価値があると評価されており、前処理の必要性をなくすことができます。画像処理などの高レベルのカテゴリの標準化に重点を置いて、パフォーマンスを向上させるために、ONNX モデル内で前処理をキャプチャする必要性が強調されています。エンド ツー エンドのパイプラインは優先度が低いと評価されていますが、パイプラインにコンポーネントを徐々に追加することをお勧めします。議論は、議題項目のさらなる議論と分析を支援するツールを使用することを推奨して終了します。
2020 ONNX ロードマップ ディスカッション #5 20201001
2020 ONNX ロードマップ ディスカッション #5 20201001
ONNX ロードマップ ディスカッション中に、ONNX チームは、コミュニティ メンバーによって提案され、運営委員会を含むさまざまな人々によって採点されたさまざまな機能について話し合いました。一部の機能は全会一致で合意されましたが、他の機能はコミュニティを分割しました.チームは、ONNX IR を複数の IR および集中型 IR 最適化ライブラリに変更する可能性について議論しました。また、ONNX 内で最適化ライブラリを一元化するというアイデアと、ops が標準インターフェイスとコーディング スタイルを実装するための要件についても説明しました。チームはまた、ONNX モデル用の単純なランタイムを持つ可能性と、ONNX ランタイムが利用できない場合に備えてカスタム Python ops を使用する可能性についても議論しました。さらに、チームは、前処理操作とデータ フレームの使用との関係を調査し、アイデアを将来の作業のための実用的な提案に変えることを計画しました。
2021 ONNX ロードマップ ディスカッション #1 20210908
2021 ONNX ロードマップ ディスカッション #1 20210908
ONNX ロードマップ ディスカッションで、IBM Research は、Pandas Dataframe の典型的なデータ前処理パターンを ONNX 形式に変換する新しい機械学習パイプライン フレームワークの提案を紹介しました。 Data Frame Pipeline と呼ばれるこのフレームワークは、GitHub でオープンソース化されており、提供された API を使用して定義できます。この API は、トレーニング フェーズ中に Python で実行されます。また、スピーカーは、Java、C#、C++ などの Python 以外の言語で ONNX を可視化する必要性、および ONNX モデルのエクスポートと他の言語からの発行についても議論しました。さらに、ONNX Python および C++ コンバーターの現在の機能と、ONNX モデルを作成する際のスコーピング、ネーミング、およびパッチ機能の必要性についても説明しました。
2021 ONNX ロードマップ ディスカッション #2 20210917
2021 ONNX ロードマップ ディスカッション #2 20210917
ONNX ロードマップ ディスカッション #2 20210917 では、さまざまなスピーカーが、量子化と融合の使いやすさ、特定のハードウェア プラットフォーム向けのカーネルの最適化、ONNX へのモデル ローカル関数の追加など、ONNX の改善が必要ないくつかの重要な領域について議論しました。その他のトピックには、エンド ツー エンドのパイプライン サポートに関するフィードバック、さまざまなプラットフォームでクライアントが直面する課題、GRU および LSTM グラフの変換に関する問題が含まれていました。いくつかの提案された解決策には、バックエンドが事前に量子化されたグラフを実行するためのより多くの情報を提供すること、さまざまなフレームワークの相互運用性を改善すること、および元のグラフに関連する名前空間を含めて、一般的な解決策と最適化された解決策の両方を可能にすることが含まれていました。さらに、スピーカーは、より幅広い採用のためにパッケージのより良い展開の必要性と、マルチモーダル モデルをサポートするために開発されるより多くのコンバーターの可能性について議論しました。
2021 ONNX ロードマップ ディスカッション #3 20210922
2021 ONNX ロードマップ ディスカッション #3 20210922
ONNX ロードマップ ディスカッションでは、スピーカーは、特定のユース ケース向けに最新の最適化されたスタックを使用して ONNX の採用を改善するために、ONNX のオフセット変換ツールの問題を修正する必要性について言及しました。スピーカーは、オフセット変換をテストするためのモデルのより良いカバレッジと、オペレーターまたはレイヤーのテストで現在欠落している中間ステップの解決を提案しました。また、メタデータとフェデレーテッド ラーニング インフラストラクチャの重要性についても説明しました。これには、転移学習アノテーション用の ONNX 仕様にメタデータを含める必要性や、プライバシー、効率、および計算リソースの使用を可能にするフェデレーテッド ラーニングの概念が含まれます。スピーカーは、コミュニティからのコラボレーションを奨励し、これらのアイデアをさらに議論して実装するためのフィードバックを求めました。次回は10月1日を予定しております。
ONNX コミュニティ バーチャル ミートアップ – 2021 年 3 月
000 ONNX 20211021 ONNX SC ウェルカム プログレス ロードマップのリリース
ONNX ワークショップは紹介から始まり、主催者は ONNX エコシステムの成長におけるコミュニティ参加の重要性を強調しました。彼らはまた、ONNX 統計の最新情報、コミュニティ プレゼンテーション、ONNX 運営委員会のロードマップ ディスカッションを含む議題の概要を提供しました。ロードマップの提案は、ONNX フレームワークのサポート、堅牢性、使いやすさを向上させることを目的としており、前処理演算子、C API、連合学習、データ処理と推論のより良い統合が含まれています。 ONNX 仕様のバージョン 1.10 の最近のリリースについても議論され、参加者は質問をしたり、ONNX Slack チャネルに参加して会話を続けることが奨励されました。
ONNX コミュニティデイ! 2022 年 6 月 24 日にライブ配信
このイベントは、6 月 24 日金曜日に真新しいマイクロソフト シリコン バレー キャンパスで直接開催されます。
このイベントでは、ONNX コミュニティの最新情報、パートナーとユーザーの事例、および多数のコミュニティ ネットワーキングが取り上げられます。
ONNX コミュニティデイ!
簡単な要約:
詳細なタイムラインの要約:
ONNX コミュニティデイ! 2022 年 6 月 24 日にライブ配信
このイベントは、6 月 24 日金曜日に真新しいマイクロソフト シリコン バレー キャンパスで直接開催されます。
このイベントでは、ONNX コミュニティの最新情報、パートナーとユーザーの事例、および多数のコミュニティ ネットワーキングが取り上げられます。
ONNX コミュニティデイ!
簡単な要約:
詳細なタイムラインの要約: