日本語は機械翻訳による参考訳です。内容に矛盾や不一致があった場合には、英語の内容が優先されます。

テスト計画

09/10/2024 共同作成者

このドキュメントは MLPerf 推論 v0.7 に準拠しています "コード"、 MLPerf Inference v1.1 "コード"および "ルール"。次の表に示すように、エッジでの推論向けに設計された MLPerf ベンチマークを実行しました。

面積（ Area ）	タスク	モデル	データセット	QSL サイズ	品質	マルチストリーム遅延制約
ビジョン	画像分類	Resnet50v1.5	ImageNet (224x224)	1024	FP32 の 99%	50 ミリ秒
ビジョン	物体検出（大）	SSD リネット 34	ココ (1200x1200)	64	FP32 の 99%	66 ミリ秒
ビジョン	物体検出（小）	ssd - MobileNetsv1 を参照してください	ココ (300 x 300)	256	FP32 の 99%	50 ミリ秒
ビジョン	医療画像のセグメンテーション	3D UNET	2019 年 BRT （ 224x224x160 ）	16	FP32 の 99% および 99.9%	該当なし
スピーチ	音声テキスト	RNNT	ライブラリキーテック開発 - クリーン	2513	FP32 の 99%	該当なし
言語	言語処理	BERT	分隊 v1.1	10833	FP32 の 99%	該当なし

面積（ Area ）

タスク

モデル

データセット

QSL サイズ

品質

マルチストリーム遅延制約

ビジョン

画像分類

Resnet50v1.5

ImageNet (224x224)

1024

FP32 の 99%

50 ミリ秒

ビジョン

物体検出（大）

SSD リネット 34

ココ (1200x1200)

FP32 の 99%

66 ミリ秒

ビジョン

物体検出（小）

ssd - MobileNetsv1 を参照してください

ココ (300 x 300)

256

FP32 の 99%

50 ミリ秒

ビジョン

医療画像のセグメンテーション

3D UNET

2019 年 BRT （ 224x224x160 ）

FP32 の 99% および 99.9%

該当なし

スピーチ

音声テキスト

RNNT

ライブラリキーテック開発 - クリーン

2513

FP32 の 99%

該当なし

言語

言語処理

BERT

分隊 v1.1

10833

FP32 の 99%

該当なし

次の表に、 Edge ベンチマークのシナリオを示します。

面積（ Area ）	タスク	シナリオ
ビジョン	画像分類	シングルストリーム、オフライン、マルチストリーム
ビジョン	物体検出（大）	シングルストリーム、オフライン、マルチストリーム
ビジョン	物体検出（小）	シングルストリーム、オフライン、マルチストリーム
ビジョン	医療画像のセグメンテーション	単一ストリーム、オフライン
スピーチ	音声テキスト	単一ストリーム、オフライン
言語	言語処理	単一ストリーム、オフライン

面積（ Area ）

タスク

シナリオ

ビジョン

画像分類

シングルストリーム、オフライン、マルチストリーム

ビジョン

物体検出（大）

シングルストリーム、オフライン、マルチストリーム

ビジョン

物体検出（小）

シングルストリーム、オフライン、マルチストリーム

ビジョン

医療画像のセグメンテーション

単一ストリーム、オフライン

スピーチ

音声テキスト

単一ストリーム、オフライン

言語

言語処理

単一ストリーム、オフライン

この検証で開発されたネットワーク・ストレージ・アーキテクチャを使用してこれらのベンチマークを実行し、 MLPerf に送信されたエッジ・サーバ上のローカル実行の結果と比較しました。この比較は、共有ストレージが推論パフォーマンスに与える影響を判断するためのものです。

テスト計画

Creating your file...