本論文では、ONNXPrunerと呼ばれる汎用的なモデル圧縮アダプターを提案している。
ONNXPrunerは、ONNX形式のモデルに対して、様々なモデル構造に自動的に適応できる。これにより、開発フレームワークに依存せずに、圧縮アルゴリズムを容易に適用できる。
ノード関連ツリーを構築することで、圧縮対象ノードと関連ノードの関係を明確に定義する。これにより、圧縮時の連鎖的な影響を効果的に管理できる。
ツリーレベルの評価手法を導入し、圧縮対象ノードと関連ノードの重要性を包括的に評価する。これにより、従来の単一ノードの評価手法よりも優れた圧縮性能を実現する。
様々なモデルとデータセットで実験を行い、ONNXPrunerの高い適応性と効果を確認した。特に、ImageNetデータセットのResNet50モデルでは、従来手法よりも高い精度を維持しつつ、高い圧縮率を達成した。
画像分類タスクだけでなく、セグメンテーションタスクのFCNとPSPNetモデルでも、ONNXPrunerの有効性を示した。
以上のように、ONNXPrunerは、深層学習モデルの実用的な圧縮を促進する重要な取り組みである。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Dongdong Ren... at arxiv.org 04-15-2024
https://arxiv.org/pdf/2404.08016.pdfDeeper Inquiries