ベンチマーク

ビジョンソフトウェアベンチマーク

Zebra Aurora™ Vision ソフトウェアのツールは、SSE/AVX テクノロジーを備えた最新のマルチコア プロセッサ向けに高度に最適化されています。 以下の表は、ビジョン ソフトウェアのパフォーマンス ベンチマークの結果を示しています。

Filter Zebra Aurora™ Vision Studio 4.12 Another product OpenCV 4.2
Image negation 0.030 ms 0.032 ms 0.025 ms
Add two images (pixel by pixel) 0.029 ms 0.047 ms 0.036 ms
Image difference (pixel by pixel) 0.036 ms 0.045 ms 0.030 ms
RGB to HSV conversion (3xUINT8) 0.127 ms 1.026 ms 0.129 ms
Gauss filter 3x3 0.031 ms 0.035 ms 0.037 ms
Gauss filter 5x5 0.033 ms 0.073 ms 0.052 ms
Gauss filter 21x21 (std-dev: 4.3) 0.311 ms 0.355 ms 0.240 ms
Mean filter 21x21 0.100 ms 0.102 ms 0.291 ms
Image erosion 3x3 0.030 ms 0.035 ms 0.050 ms
Image erosion 5x5 0.030 ms 0.036 ms 0.059 ms
Sobel gradient magnitude (sum) 0.032 ms 0.035 ms
Sobel gradient magnitude (hypot) 0.034 ms 0.040 ms
Threshold to region 0.043 ms 0.076 ms
Splitting region into blobs 0.119 ms 0.206 ms
Bilinear image resize 0.131 ms 0.108 ms 0.052 ms

上記の結果は、Intel Core i5 - 3.2 GHz マシン上の 640x480 解像度、1xUINT8 に対応します。 測定誤差の非ランダム成分を除去するために、各操作の繰り返し回数が 10 倍、30 倍に増加しました。 これにより、10、20、30、...、300 という繰り返しシーケンスが得られます。その後、取得した実行時間に対して直線が当てはめられました。 このアプローチでは、測定の開始と停止に関連する一定の誤差がライン シフトに反映され、実行時間はラインの傾きで表現されます。 測定の精度を高めるために、大きな画像がテストされ、結果が正規化されました。 また、異なるライブラリの関数が常にまったく同じ出力データを生成するとは限らないことにも注意してください。


SSE とマルチコアの最適化

Zebra Aurora™ Vision Studioのフィルターは、SSE/AVX/NEON テクノロジーおよびマルチコアプロセッサー用に最適化されています。ただし、これらの技術で達成できる高速化要因は、次の条件に大きく依存します。特定のオペレーター。SSE ベースの最適化がすでにメモリに到達した後の単純なピクセルごとの変換帯域幅の制限。 一方、ガウス平滑化などのより複雑なフィルタでは、C++最適化だけを使用した場合よりも実行時間が10分の1に短縮されます。


CPUベンチマーク

以下の表は、ソフトウェア ツールを実行する際のさまざまなプロセッサのパフォーマンスを示しています (高いほど優れています)。
アプリケーションに適したハードウェアを選択する際の参考として使用できます。

Benchmark category Overall result
Device description Executor Engine Image processing Image analysis Region processing Applications
Intel Atom D525
1.80GHz / 1MB cache / 2 cores / 4 GB RAM
54.9 32.7 41.1 61.7 53.1 48.7
Intel Core 2 Duo T6400
2.00GHz / 2MB cache / 2 cores / 3 GB RAM
54.9 79.4 87.1 108.2 105.4 87.0
Intel Atom E3845
1.91GHz / 2MB cache / 4 cores / 4 GB RAM
100.0 100.0 100.0 100.0 100.0 100.0
Intel Pentium N4200
1.10 GHz / 2MB cache / 4 cores/ 4 GB RAM
193.5 204.2 157.3 143.6 167.3 173.2
AMD FX-4100 Quad-Core
3.60 GHz / 8MB cache / 4 cores/ 8 GB RAM
112.3 213.4 164.8 218.7 174.6 176.7
AMD Athlon II X2 270
3.40 GHz / 2MB cache / 2 cores/ 8 GB RAM
311.6 136.8 171.6 210.0 212.0 208.4
Intel Core-i7 3612QM
2.10GHz / 6MB cache / 4 cores/ 4 GB RAM
427.8 534.6 303.6 295.9 352.6 382.9
Intel Core-i7 2600K
3.40GHz / 8MB cache / 4 cores/ 8 GB RAM
507.6 593.4 346.8 345.9 393.1 437.4
Intel Core-i5 3470
3.20GHz / 6MB cache / 4 cores/ 16 GB RAM
545.3 628.1 355.1 324.7 403.6 455.0
Intel Core-i5 3570K
3.40GHz / 6MB cache / 4 cores/ 8 GB RAM
554.6 645.5 359.0 360.4 416.5 467.2
Intel Core-i5 4460
3.20GHz / 6MB cache / 4 cores/ 16 GB RAM
611.6 667.6 366.6 356.9 421.3 484.8
Intel Core-i7 4800MQ
2.70GHz / 6MB cache / 4 cores/ 12 GB RAM
628.3 678.7 380.5 378.9 420.8 483.5
Intel Core-i7 6700HQ
2.60GHz / 6MB cache / 4 cores/ 16 GB RAM
641.8 710.0 365.9 366.8 416.3 500.2
Intel Core-i7 4800MQ
2.70GHz / 6MB cache / 4 cores/ 16 GB RAM
640.2 699.1 380.9 378.8 412.6 502.3
Intel Core-i5 6500
3.20GHz / 6MB cache / 4 cores/ 16 GB RAM
663.7 794.0 395.7 390.2 458.1 540.3
Intel Core-i5 7500
3.40GHz / 6MB cache / 4 cores/ 16 GB RAM
684.3 830.1 422.0 406.8 492.6 567.1
Intel Core-i7 4790K
4.00GHz / 8MB cache / 4 cores/ 16 GB RAM
798.2 887.5 474.7 461.1 550.1 634.3
AMD Ryzen 7 2700X
3.70GHz / 20MB cache / 8 cores/ 16 GB RAM
667.9 1407.1 535.9 439.0 419.6 693.9
Intel Core-i7 8700K
3.70GHz / 12MB cache / 6 cores/ 16 GB RAM
862.5 1364.7 587.8 491.3 594.3 780.1

値が大きいほどパフォーマンスが良いことを意味します。
テストでは、一定数の操作の実行時間を測定します。 結果は正規化されます。
Back to top


ディープラーニングのベンチマーク

以下の表は、ディープ ラーニングツールを実行する際に、さまざまなハードウェア構成がどの程度優れたパフォーマンスを発揮するかを示しています (数値が高いほど優れています)。
アプリケーションに適したハードウェアを選択する際の参考として使用できます。

Hardware configuration Deep Learning Network Overall result
CPU / RAM / GPU / Compute Capability/ NVIDIA Driver
Classify Object
(CO)
Detect Anomalies 2
(DA2)
Detect Anomalies 1
Global
(DA1G)
Detect Anomalies 1
Local
(DA1L)
Detect
Featuresbr
(DF)
Instance
Segmentation
(IS)
Locate Points
(LP)
Intel Core-i5 9400F 2,90GHz / 16 GB RAM
GeForce GT 730 2GB / 3.5 / 452.06
35.7 5.7 24.0 6.3 6.9 15.0 7.0 7.4
AMD Ryzen 7 2700X Eight-Core / 16 GB RAM 118.2 30.1 64.3 12.4 13.6 92.7 18.4 20.2
Intel Core-i5 7500 3,40GHz / 16 GB RAM 122.8 26.9 58.2 14.8 13.3 83.9 15.0 20.5
Intel Core-i7 9750H 2,60GHz / 16 GB RAM (Laptop) 58.9 26.6 59.1 18.8 13.6 88.3 16.3 22.6
Intel Core-i7 8700K 3,70GHz / 16 GB RAM 186.0 32.6 75.6 17.6 14.9 102.9 19.1 24.4
Intel Core-i5 9400F 2,90GHz / 16 GB RAM 164.3 34.9 82.6 22.2 18.9 105.3 21.6 29.1
Intel Core-i9 11900KF 3,50GHz / 32 GB RAM 245.5 43.9 70.5 40.3 43.2 172.7 68.6 53.1
Intel Core-i7 9750H 2,60GHz / 16 GB RAM
GeForce RTX 2060 6GB / 7.5 / 445.87 (Laptop)
68.5 135.1 108.5 94.8 85.4 96.5 69.2 96.5
AMD Ryzen 7 2700X Eight-Core / 16 GB RAM
GeForce GTX 1060 6GB / 6.1 / 452.06
102.2 99.1 92.8 102.8 99.5 97.8 100.0 99.6
AIntel Core-i5 7500 3,40GHz / 16 GB RAM
GeForce GTX 1060 6GB / 6.1 / 445.87
100.0 100.0 100.0 100.0 100.0 100.0 100.0 100.0
Intel Core-i7 8700K 3,70GHz / 16 GB RAM
GeForce GTX 1060 6GB / 6.1 / 452.06
101.6 103.9 90.0 101.0 100.5 96.0 105.8 100.5
Intel Core-i7 8700K 3,70GHz / 32 GB RAM
GeForce GTX 1070 8GB / 6.1 / 452.06
82.7 136.0 90.9 129.6 133.6 106.3 134.6 124.1
Intel Core-i5 7500 3,40GHz / 16 GB RAM
GeForce RTX 2060 6GB / 7.5 / 441.87
102.7 157.7 135.4 142.8 148.8 133.1 134.7 143.3
Intel Core-i5 7500 3,40GHz / 16 GB RAM
GeForce GTX 1080 8GB / 6.1 / 452.06
109.0 158.9 108.4 161.5 167.7 127.3 161.4 150.5
Intel Core-i5 9400F 2,90GHz / 16 GB RAM
GeForce RTX 2060 SUPER 8GB / 7.5 / 452.06
99.4 192.5 167.7 173.8 182.4 155.5 168.6 173.7
Intel Core-i5 9400F 2,90GHz / 16 GB RAM
GeForce RTX 3060Ti 8GB / 8.6 / 465.21
99.7 244.3 201.7 249.8 556.0 172.8 511.7 259.9
Intel Core-i9 11900KF 3,50GHz / 32 GB RAM
GeForce RTX 3070 8GB / 8.6 / 457.51
161.6 276.8 134.3 274.2 569.7 175.8 594.9 270.8

値が大きいほどパフォーマンスが良いことを意味します。
このテストでは、選択したディープ ラーニング ツールの実行時間を測定します。 結果は正規化されます。
Back to top