※ 이 글은 오가사와라 히로유키(小笠原博之) 씨가 블로그에 적은 글을 번역한 것입니다. 사정에 따라 예고없이 삭제될 수 있으므로 양해부탁드립니다.

Raspberry Pi 3의 속도비교, Cortex-A53의 속도

(원문 : Raspberry Pi 3 の速度比較, Cortex-A53 の速度)

Raspberry Pi 3를 입수했기에 간단하게 벤치마크를 해봤습니다.

비슷한 스펙의 DragonBoard 410c (Snapdragon 410)가 작년에 발매되었습니다. CPU는 Cortex-A53 1.2GHz quad로 거의 동등, 둘 다 온보드로 Wi-Fi/BT를 탑재했습니다. RAM은 Pi 3 쪽이 살짝 느리고 내장 스토리지도 없습니다만, 가격은 절반 이하입니다. 조금 아쉬운 건 Pi 3의 OS가 32bit라는 것입니다. DragonBoard 쪽은 64bit로 동작합니다.

평소 하던대로 컴파일 시간을 비교해봤습니다. (Time이 작을수록 고속)

DeviceTime
Raspberry Pi 3175 sec ( 2m55s)10.8x
DragonBaord 410c186 sec ( 3m06s)10.1x
Raspberry Pi 2402 sec ( 6m42s)4.7x
Raspberry Pi1893 sec (31m33s)1.0x

역시 DragonBaord 410c와 비슷한 수치가 나왔습니다. SD Card의 차이도 있기에 딱 잘라 말할수는 없습니다만, 초대와 비교하여 대충 10배, Pi 2과 비교해도 2배 이상 고속입니다.

스펙 포함&보다 많은 기기와 비교하면 다음과 같습니다.

DevicecoreclockC/T64RAMTime
Core i7-4790KHaswell4.0GHz4/8Y16GB15 sec ( 0m15s)
Celeron J1900Silvermont2.0GHz4/4Y8GB88 sec ( 1m28s)
Athlon 5350Jaguar2.0GHz4/4Y8GB88 sec ( 1m28s)
Celeron 2955UHaswell1.4GHz2/2Y4GB93 sec ( 1m33s)
Celeron N3150Airmont1.6GHz4/4Y16GB108 sec ( 1m48s)
Raspberry Pi 3Cortex-A531.2GHz4/4N1GB175 sec ( 2m55s)
DragonBaord 410cCortex-A531.2GHz4/4Y1GB186 sec ( 3m06s)
Raspberry Pi 2Cortex-A70.9GHz4/4N1GB402 sec ( 6m42s)
Atom Z540Bonnell1.8GHz1/2N2GB426 sec ( 7m06s)
Raspberry PiARM11760.7GHz1/1N0.5GB1893 sec (31m33s)
NetwalkerCortex-A80.8GHz1/1N0.5GB1902 sec (31m42s)
・C/T = Core 수/Thread 수

vfp benchmark의 비교는 이쪽 (단위는 GFLOPS, 수치가 클수록 빠름)

DevicearchSP-STDP-STSP-MTDP-MT
DragonBoard 410cARMv8A9.4984.74937.96518.603
Raspberry Pi 3ARMv7A9.4312.47737.4429.994
Raspberry Pi 2ARMv7A1.7910.8777.0873.472
Raspberry PiARMv60.6740.6740.6740.674
・SP=단정밀도, DP=배정밀도, ST=SingleThread, MT=MultiThread

어디까지다 최대치이므로 실제 소프트웨어에서는 이정도로 차이가 나지 않습니다만, 잠재력으로 보자면 Pi 2의 5배 이상의 차이가 납니다. (SIMD에서 4배 x clock 차이) 단정밀도에서는 초대 Pi와 비교하여 55배나 빠릅니다. 장래에 64bit에 대응하면 배정밀도 연산도 DragonBoard와 비슷할 정도의 속도로 상승할 것입니다.

Cortex-A53는 big.LITTLE의 LITTLE로 사용됩니다만, 부동소수점 연산에서는 A7에서 대폭으로 확장되어 big core에 가까운 구성이 되었습니다. 아래 슬라이드 사진에서도 「2 배정밀도 MAC / cycle」「4 단정밀도 MAC / cycle」이라는 것을 알 수 있습니다.

또한 하위 모델인 Cortex-A35가 등장예정이고, 이쪽이 본래 Cortex-A7에 상당하는 64bit 프로세서가 될 것이라 생각됩니다.

아래 페이지를 갱신했습니다.

관련글

※ 이 글은 오가사와라 히로유키(小笠原博之) 씨가 블로그에 적은 글을 번역한 것입니다. 사정에 따라 예고없이 삭제될 수 있으므로 양해부탁드립니다.

Raspberry Pi 2에서 빨라진 컴파일 시간 비교

(원문 : Raspberry Pi 2 で速くなったコンパイル時間の比較)

Raspberry Pi 2를 입수했기에 사용해보았습니다. ARM11인 Raspberry Pi와 비교하면 현격하게 빨라졌습니다.

VFP Benchmark의 비교

               CPU       clock       single fp      double fp
----------------------------------------------------------------
Raspberry Pi B ARM1176   0.7GHz x1   0.674 GFLOPS   0.674 GFLOPS
Raspberry Pi 2 Cortex-A7 0.9GHz x4   7.087 GFLOPS   3.472 GFLOPS

ARM11세대 VFP와 비교하면 core당 2.6배(단정밀도시, 클럭차 포함).

상세결과는 아래에 추가했습니다.

Cortex-A7은 big.LITTLE에서도 전력절약용 core로 사용되며, 개별 성능은 그다지 높지 않습니다.

그럼에도 엔트리 클래스의 스마트폰이나 태블릿에서는 같은 Cortex-A7 Quad core의 기기가 다수 나와있습니다. Snapdraogn 400 MSM8926/8226이나 MT8125/8389/6582 등, 나름대로 밸런스가 좋은 구성이라 생각합니다.

아래는 제가 작성한 라이브러리(flatlib3)의 빌드시간 비교입니다. 36분에서 5분 30초라는 현실적인 수치가 되었습니다. SD Card의 속도에 의존하므로 아주 정확하지는 않지만, 대충 6.6배가 나와 공식수치대로라고 할 수 있겠습니다.

                                Clock  core  ISA    RAM    gcc-4.8 clang-3.4
---------------------------------------------------------------------------
(1) Raspberry Pi B ARM1176JZF   0.7GHz x1    armv6l 0.5GB   36m18s
(2) Raspberry Pi 2 Cortex-A7    0.9GHz x4    armv7l   1GB    5m29s
(3) Nexus 7 2012   Cortex-A9    1.3GHz x4    armv7l   1GB    3m42s
(4) Atom Z540      Bonnell      1.8GHz x1+HT x86      2GB    6m23s   6m18s
(5) BayTrail-D J1900 Silvermont 2.0GHz x4    x86_64   8GB    1m30s   1m11s
(6) Athlon-5350    Jaguar       2.0GHz x4    x86_64   8GB    1m33s   1m10s
(7) Core i7-2720QM SandyBridge  2.2GHz x4+HT x86_64  16GB    0m31s   0m24s

・36m18s = 36분18초
・값은 실행시간(3회의 평균). 수치가 작을 수록 고속.

Raspberry Pi 2에서 그냥 빌드하면 ARMv6의 바이너리가 생성되므로, gcc-4.8 -march=armv7-a mfpu=neon-vfpv4의 옵션으로 컴파일했습니다.

아래는 각 기기의 상세 내용입니다.

(1) Raspberry Pi model B
BMC2835 ARM1176JZF 0.7GHz x1
RAM 512MB, SD 16GB
Debian wheezy armv6l (console)


(2) Raspberry Pi 2 model B
BMC2836 Cortex-A7 0.9GHz x4
RAM 1GB DDR2, SD 16GB
Debian wheezy armv7l (console)
gcc-4.8 (-march=armv7-a mfpu=neon-vfpv4)


(3) Nexus 7 (2012)
Tegra 3 T30L Cortex-A9 1.3GHz x4
RAM 1GB DDR3L, 8GB
Ubuntu 13.04 armv7l (console)


(4) VAIO Type P
Atom Z540 Bonnell 1.86GHz x1+HT
RAM 2GB, SSD 64GB
Ubuntu 14.04LTS x86 (console)


(5) Desktop PC
BayTrail-D Celeron J1900 Silvermont 2.0GHz x4
RAM 8GB, HDD
Ubuntu 14.04LTS x86_64


(6) Desktop PC
Athlon-5350 Jaguar 2.0GHz x4
RAM 8GB, HDD
Ubuntu 14.04LTS x86_64


(7) Desktop PC
Core i7-2720QM SandyBridge 2.2GHz x4+HT
RAM 16GB, HDD
Ubuntu 14.04LTS x86_64

GPU쪽은 변하지 않은 것 같습니다. 아래 페이지에 추가했습니다.

+ Recent posts