※ 이 글은 오가사와라 히로유키(小笠原博之) 씨가 블로그에 적은 글을 번역한 것입니다. 사정에 따라 예고없이 삭제될 수 있으므로 양해부탁드립니다.
Raspberry Pi 3의 속도비교, Cortex-A53의 속도
(원문 : Raspberry Pi 3 の速度比較, Cortex-A53 の速度)
Raspberry Pi 3를 입수했기에 간단하게 벤치마크를 해봤습니다.
비슷한 스펙의 DragonBoard 410c (Snapdragon 410)가 작년에 발매되었습니다. CPU는 Cortex-A53 1.2GHz quad로 거의 동등, 둘 다 온보드로 Wi-Fi/BT를 탑재했습니다. RAM은 Pi 3 쪽이 살짝 느리고 내장 스토리지도 없습니다만, 가격은 절반 이하입니다. 조금 아쉬운 건 Pi 3의 OS가 32bit라는 것입니다. DragonBoard 쪽은 64bit로 동작합니다.
평소 하던대로 컴파일 시간을 비교해봤습니다. (Time이 작을수록 고속)
Device | Time | |
---|---|---|
Raspberry Pi 3 | 175 sec ( 2m55s) | 10.8x |
DragonBaord 410c | 186 sec ( 3m06s) | 10.1x |
Raspberry Pi 2 | 402 sec ( 6m42s) | 4.7x |
Raspberry Pi | 1893 sec (31m33s) | 1.0x |
역시 DragonBaord 410c와 비슷한 수치가 나왔습니다. SD Card의 차이도 있기에 딱 잘라 말할수는 없습니다만, 초대와 비교하여 대충 10배, Pi 2과 비교해도 2배 이상 고속입니다.
스펙 포함&보다 많은 기기와 비교하면 다음과 같습니다.
Device | core | clock | C/T | 64 | RAM | Time |
---|---|---|---|---|---|---|
Core i7-4790K | Haswell | 4.0GHz | 4/8 | Y | 16GB | 15 sec ( 0m15s) |
Celeron J1900 | Silvermont | 2.0GHz | 4/4 | Y | 8GB | 88 sec ( 1m28s) |
Athlon 5350 | Jaguar | 2.0GHz | 4/4 | Y | 8GB | 88 sec ( 1m28s) |
Celeron 2955U | Haswell | 1.4GHz | 2/2 | Y | 4GB | 93 sec ( 1m33s) |
Celeron N3150 | Airmont | 1.6GHz | 4/4 | Y | 16GB | 108 sec ( 1m48s) |
Raspberry Pi 3 | Cortex-A53 | 1.2GHz | 4/4 | N | 1GB | 175 sec ( 2m55s) |
DragonBaord 410c | Cortex-A53 | 1.2GHz | 4/4 | Y | 1GB | 186 sec ( 3m06s) |
Raspberry Pi 2 | Cortex-A7 | 0.9GHz | 4/4 | N | 1GB | 402 sec ( 6m42s) |
Atom Z540 | Bonnell | 1.8GHz | 1/2 | N | 2GB | 426 sec ( 7m06s) |
Raspberry Pi | ARM1176 | 0.7GHz | 1/1 | N | 0.5GB | 1893 sec (31m33s) |
Netwalker | Cortex-A8 | 0.8GHz | 1/1 | N | 0.5GB | 1902 sec (31m42s) |
vfp benchmark의 비교는 이쪽 (단위는 GFLOPS, 수치가 클수록 빠름)
Device | arch | SP-ST | DP-ST | SP-MT | DP-MT |
---|---|---|---|---|---|
DragonBoard 410c | ARMv8A | 9.498 | 4.749 | 37.965 | 18.603 |
Raspberry Pi 3 | ARMv7A | 9.431 | 2.477 | 37.442 | 9.994 |
Raspberry Pi 2 | ARMv7A | 1.791 | 0.877 | 7.087 | 3.472 |
Raspberry Pi | ARMv6 | 0.674 | 0.674 | 0.674 | 0.674 |
어디까지다 최대치이므로 실제 소프트웨어에서는 이정도로 차이가 나지 않습니다만, 잠재력으로 보자면 Pi 2의 5배 이상의 차이가 납니다. (SIMD에서 4배 x clock 차이) 단정밀도에서는 초대 Pi와 비교하여 55배나 빠릅니다. 장래에 64bit에 대응하면 배정밀도 연산도 DragonBoard와 비슷할 정도의 속도로 상승할 것입니다.
Cortex-A53는 big.LITTLE의 LITTLE로 사용됩니다만, 부동소수점 연산에서는 A7에서 대폭으로 확장되어 big core에 가까운 구성이 되었습니다. 아래 슬라이드 사진에서도 「2 배정밀도 MAC / cycle」「4 단정밀도 MAC / cycle」이라는 것을 알 수 있습니다.
또한 하위 모델인 Cortex-A35가 등장예정이고, 이쪽이 본래 Cortex-A7에 상당하는 64bit 프로세서가 될 것이라 생각됩니다.
아래 페이지를 갱신했습니다.