※ 이 글은 오가사와라 히로유키(小笠原博之) 씨가 블로그에 적은 글을 번역한 것입니다. 사정에 따라 예고없이 삭제될 수 있으므로 양해부탁드립니다.

Android Qualcomm Snapdragon 800 MSM8974 Krait 400의 속도

(원문 : Android Qualcomm Snapdragon 800 MSM8974 Krait 400 の速度)

CPU 벤치에 Snapdragon 800 MSM8974 Krait 400의 결과를 추가했습니다.

부동소수점 연산명령별 실행속도

                (1)      (2)      (3)      (4)       (5)      (6)      (7)
               Nexus7   iPad4    HTL21   Nexus10  iPhone5s iPhone5s KindleHDX7
              Cortex-A9 Swift    Krait  Cortex-A15 Cyclone  Cyclone   Krait4
               Tegra3    A6X    APQ8064  Exynos5D   A7 32    A7 64   MSM8974
               1.2GHz   1.4GHz   1.5GHz   1.7GHz    1.3GHz   1.3GHz   2.2GHz
------------------------------------------------------------------------------
a:m44 vmla_AQ  3.959    1.204    1.337    0.619     0.700    -----    0.661
b:m44 vmla_BQ  2.002    1.266    0.931    0.569     0.670    -----    0.542
c:m44 vmla_AD  3.980    1.554    1.889    0.557     0.649    -----    0.888
d:m44 vmla_BD  2.003    1.238    1.532    0.568     0.745    -----    0.768
A:m44 vfma_AQ  -----    1.519    1.882    0.746     0.707    0.692    1.178
B:m44 vfma_BQ  -----    1.484    0.695    0.840     0.699    0.696    0.463
e:fadds     A  3.343    2.878    2.774    2.383     3.551    1.043    1.864
f:fmuls     A  3.337    2.953    2.747    2.369     3.475    1.548    1.867
g:fmacs     A  3.337    5.757    5.574    2.956     3.480    -----    2.052
h:vfma.f32  A  -----    5.756    2.747    2.957     3.480    3.185    1.864
i:vadd.f32 DA  3.426    2.877    2.762    1.183     1.031    1.031    1.866
j:vmul.f32 DA  3.421    2.950    2.746    1.478     1.545    1.545    1.864
k:vmla.f32 DA  3.792    2.951    5.604    1.480     1.567    -----    2.051
o:vfma.f32 DA  -----    2.494    2.833    1.479     1.574    1.753    1.871
l:vadd.f32 QA  6.688    2.878    2.801    2.365     1.031    1.039    1.872
m:vmul.f32 QA  6.681    2.952    2.761    2.364     1.548    1.548    1.879
n:vmla.f32 QA  6.681    2.950    5.606    2.367     1.574    -----    2.059
N:vfma.f32 QA  -----    -----    -----    -----     -----    1.696    -----
p:fadds     B  3.347    5.756    3.467    2.956     6.953    3.663    -----
q:fmuls     B  4.195    5.756    3.556    3.558     6.652    3.296    -----
r:fmacs     B  6.688   11.514    6.298    5.912     9.867    -----    -----
s:vfma.f32  B  -----   11.513    3.430    5.910     9.859    3.292    -----
t:vadd.f32 DB  3.421    2.881    3.529    2.958     3.663    3.643    1.865
u:vmul.f32 DB  3.422    2.949    3.447    2.364     3.114    3.289    2.339
v:vmla.f32 DB  7.561    5.755    6.293    4.728     6.185    -----    3.773
z:vfma.f32 DB  -----    5.755    3.437    4.730     6.188    6.237    2.340
w:vadd.f32 QB  6.705    2.879    3.457    2.961     3.659    3.641    1.875
x:vmul.f32 QB  6.683    2.950    3.428    2.363     3.101    3.276    2.340
y:vmla.f32 QB  7.532    5.759    6.372    4.729     6.199    -----    3.746
Y:vfma.f32 QB  -----    -----    -----    -----     -----    6.226    -----

・↑수치는 실행시간(초). 수치가 작을수록 고속. single thread
・모두 단정밀도 32bit float 연산입니다.

Krait 400은 동작 clock이 높은 것도 있고 해서 상당히 빠릅니다. 위 결과에서는 같은 ARMv7A VFPv4 세대인 Cortex-A15에 필적하며, 실행효율의 차를 동작 클럭이 충분히 보충해주고 있음을 알 수 있습니다.

또 여기서 Quad core는 Cortex-A9, Krait, Krait 400 뿐이므로, 종합적인 퍼포먼스로는 고클럭이자 Quad core인 Krait 400이 가장 점수가 높으리란 것을 예상할 수 있습니다.

NEON 명령은 64bit와 128bit의 차이가 없으며, Cortex-A15과 달리 128bit 단위입니다.

vfma (FMA)보다도 vmla가 2배 느렸던 그냥 Krait (3)과 비교하여, Krait 400 (7)에서는 vmla도 vfma에 가까운 속도를 내고 있습니다. 같은 Krait라도 다른 경향을 보여주며, 여러가지로 개량된 듯 합니다.

동시에 A7 Cyclone의 core 1개의 성능이 굉장히 높다는 것을 새삼 느끼게 됩니다. A7 Cyclone의 결과는 2개 있는데, (5)는 ARMv8 AArch32 (armv7) 32bit 모드의 결과고, (6)는 ARMv8 AArch64 (arm64) 64bit 모드에서의 결과입니다.

이하는 테스트 단말에 대한 자세한 사양입니다.

device                     OS   SoC      CPU core     clock  Arch        VFP
----------------------------------------------------------------------------
(1)ASUS Nexus 7 (2012)     A4.2 Tegra 3  Cortex-A9 x4 1.2GHz ARMv7A 32bit v3
(2)Apple iPad 4            i6.1 A6X      Swift     x2 1.4GHz ARMv7A 32bit v4
(3)HTC J butterfly HTL21   A4.1 APQ8064  Krait     x4 1.5GHz ARMv7A 32bit v4
(4)Samsung Nexus 10        A4.2 Exynos5D Cortex-A15x2 1.7GHz ARMv7A 32bit v4
(5)Apple iPhone 5s         i7.0 A7       Cyclone   x2 1.3GHz ARMv8A 32bit v4
(6)Apple iPhone 5s         i7.0 A7       Cyclone   x2 1.3GHz ARMv8A 64bit Ad
(7)Amazon Kindle Fire HDX7 A4.2 MSM8974  Krait 400 x4 2.2GHz ARMv7A 32bit v4

아래는 또 하나의 CPU 벤치 결과입니다.

  SoC CPU              clock  compiler  arch   time  MB/s   MBS/GHz
-------------------------------------------------------------------
1.A7 Cyclone + AES     1.3GHz clang 5.0 arm64  0.129 837.54  644.26
2.A7 Cyclone           1.3GHz clang 5.0 arm64  1.04  104.27   80.21
3.A7 Cyclone           1.3GHz clang 5.0 armv7  1.16   93.04   71.57
4.MSM8974 Krait 400    2.2GHz gcc 4.8   armv7  1.41   76.67   34.85
5.Exynos 5D Cortex-A15 1.7GHz gcc 4.6   armv7  1.49   72.61   42.71
6.A6X Swift            1.4GHz clang 4.2 armv7  1.75   61.82   44.16
7.APQ8064 Krait        1.5GHz gcc 4.6   armv7  2.28   47.64   31.82
8.Tegra3 Cortex-A9     1.3GHz gcc 4.4.3 armv7  3.00   36.15   25.82

・time 단위는 초
・MB/s 가 클수록 고속
・MBS/GHz = 1GHz당 처리속도

전용명령을 사용하는 1.이 자릿수가 하나 높을 정도로 빠른 것은 당연합니다만, 64bit 아키텍터의 A7도 충분히 빠릅니다. 신 core + 클럭수가 가장 빠른 Krait 400은 그 뒤를 잇습니다. 상세한 테스트 내용은 이쪽을 참조하시길.

테스트에 사용한 Kindle Fire HDX 7의 데이터는 아래에도 추가했습니다.

관련 글

※ 이 글은 impress watch 에 실린 컬럼을 번역한 것입니다. 사정에 따라 예고없이 삭제될 수 있으므로 양해부탁드립니다.

최근의 스마트폰/태블릿용 SoC 제2회 ~ Qualcomm, Samsung의 강함은 어디에서 오는가

(원문 : 今どきのタブレット/スマートフォン向けSoC 第2回 ~Qualcomm、Samsungの強さはどこにあるのか )

제 2회는 Android 탑재 스마트폰/태블릿용의 2대 SoC 벤더라고 할 수 있는 Qualcomm과 Samsung에 대해서 성장과 전략을 설명할까 한다.


LTE 모뎀 통합으로 우위성을 높인 Qualcomm

지난회에도 설명한대로, Qualcomm은 원래 CDMA 방식의 통신규격 성립과, 이것을 이용한 모뎀 사업으로 커진 벤더다. 「cdmaOne」으로 알려진 「IS-95」라는 통신규격도 원래는 Qualcomm의 사내 프로젝트의 성과에 기반한 것이다. 이런 점은 USB나 PCI/PCI Express같은 규격이 Intel 사내 프로젝트를 시작으로 퍼진 경위와 많이 닮았다.

물론 Qualcomm“만”으로 CDMA나 이에 이어지는 CDMA2000, 나아가서 LTE라는 통신규격이 만들어진 것은 아니고, 많은 벤더나 캐리어를 끼고 개발된 것이지만, 역시 표준화작업을 주도하는 입장을 잡으면 그 후의 제품개발에서 다소간이나마 경합 메이커를 리드할 수 있게 된다.

그 결과 동사는 CDMA용 모뎀칩을 개발하고, 이것은 CDMA 방식을 채용한 휴대기기 메이커에게 널리 받아들여지게 된다. 당시의 모뎀은 공정기술 문제로 1칩에 수납할 수는 없어 복수칩으로 구성되었지만, 당시 휴대폰 크기로는 그렇게 큰 문제는 되지 않았다.

그 후 동사는 이어서 성능 개선이나 신기술(CDMA→CDMA2000→WCDMA) 대응, 패키지의 소형화등에 힘쓰는 한편, 여러 요소기술을 가진 회사의 매수를 진행한다.

예를 들면 2004년에는 디스플레이 기술을 가진 Iridigm Display Corporation을 매수하거나, 2006년에 RF CMOS 기술을 가진 Berkana Wireless을 매수한다던가하는 상황이었다. 2009년에는 AMD에게서 Imageon의 자산을 개발부대째로 매수한다. 이렇게 차근차근 기술을 집적한 결과, 모뎀칩 「Gobi」가 등장. 그리고 Gobi를 내장한 SoC인 「Snapdragon S1」이 2007년에 투입되면서 이야기가 여러가지로 변하기 시작한다.

원래 Qualcomm은 모뎀 사업으로 주요 휴대폰 메이커와 찰싹 달라붙어 있었다. 이것은 지난회에도 살짝 설명했지만, 누가 뭐래도 CDMA 방식은 Qualcomm이 총본산이고, 그 이외에도 GPRS/EDGE/HSPA등의 방식에 대응한 모뎀을 라인업하고 있었으므로 (애플리케이션 프로세서는 둘째치고) 모뎀은 Qualcomm, 이라고 정해놓은 메이커가 적지 않았다. 거기에 Snapdragon으로 애플리케이션 프로세서와 모뎀까지 통합한 SoC를 내놓게 되면, 만약 애플리케이션 프로세서의 성능이 다른 곳이랑 차이가 없다면 실장면적이나 부품비용 관점에서 커다란 메리트가 된다. 특히 Qualcomm의 모뎀 통합 SoC의 부품 코스트가 타사의 애플리케이션 프로세서+Qualcomm을 밑도는 순간, 이건 커다란 어드밴티지가 된다.

Qualcomm은 Qualcomm대로 모뎀 단독으로 파는 것보다 매상이 높아지는지라, 과점화가 진행되는 것도 어찌 보면 당연한 일이다. Snapdragon S1의 초기제품은 CPU가 ARM11의 528MHz, GPU는 없이 2D의 프레임버퍼+α 정도의 기능밖에 갖고 있지 않았지만, 2008년에 투입된 「MSM7227/7627」은 CPU가 ARM11 800MHz으로 파워업되고, GPU도 AMD에서 Imageon의 라이선스를 받아 만들어진 Adreno 200이 되어, 타사제품에 뒤떨어지지 않게 된다. 이리하여 Snapdragon의 시장제패가 시작되게 되는 것이다.

그리고 여기서 손을 빼지 않는 것이 참으로 Qualcomm다웠다. 2005년에 ARM은 「Cortex-A8」을 발표하고, TI(Texus Instruments)나 Samsung 등 주요한 애플리케이션 프로세서 벤더(Qualcomm에게 있어서는 경합 벤더)는 일제히 Cortex-A8의 채용을 결정하고, 물리실장에 들어갔다.

하지만 Qualcomm은 Cortex-A8가 마음에 들지 않았던(?) 듯, 2007년의 ARM Developer Conference에서 Scorpion 코어를 발표한다.


Scorpion 코어의 개요. 20~25 FO4라는 고속동장을 상정하지 않은 타겟 사이클로 설계되어 있어, 확실하게 저전력용이라는 것을 알 수 있다.

파이프라인은 정수연산이 10~12스테이지, 로드/스토어가 13스테이지이므로 Cortex-A8와 그다지 다르지 않지만, 디코드 2명령/사이클, 명령발행이 사실상 3명령/사이클이라는 수퍼 스칼라/아웃 오브 오더 실장은 Cortex-A9과 비교할 수 있는 구조이다. 실제로 1GHz 동작에서 2,100 DMIPS(2.1 DMIPS/MHz)라는 설계목표는 Cortex-A8의 2 DMIPS/MHz를 웃돈다(Cortex-A9의 2.5 DMIPS/MHz정도는 아니지만).

2007년이라고 하면 ARM도 Cortex-A9을 발표한 해인데, 경합 메이커는 거기서 라이선스를 받아 실장에 들어간 것에 반해, 이미 Qualcomm은 이 시점에서 논리설계만이 아니라 물리설계도 거의 마치고 있었다. 그 결과, 다른 애플리케이션 프로세서 벤더는 2009년에 들어서고 나서야 Cortex-A9 탑재 SoC의 발표를 시작한 것에 반해, Qualcomm은 2008년중에 이 Scorpion 코어를 탑재한 「QSD82500/8650」의 출하를 개시한다. 결국, 여기서 한번 더 타사제품과의 차별화가 가능해져, 이것이 Snapdragon의 과점화에 한층 박차를 가하게 된 것이다.

이 구도는 LTE 세대에 다시 한번 반복되게 된다. Qualcomm은 제 4세대 Gobi에서 LTE 대응을 완료한다. 이 시점에서 제대로 된 LTE 대응 모뎀은 Qualcomm, NTT 도코모와 국내 메이커가 공동개발한 통칭 「사쿠라 칩」밖에 없었으며, 거기에 사쿠라칩은 대응주파수가 일본 대상이었기에 결국 전세계에서 대응할 수 있는 것은 사실상 Gobi 밖에 없었다. 이에 맞춰 Qualcomm은 새롭게 「Krait」코어를 개발, 이것을 탑재한 「Snapdragon S4」의 샘플 출하를 2011년 중순부터 개시한다.

Krait 코어 그 자체의 내부구조는 파이프라인이 11스테이지 정도로 단축되고 디코드가 3명령/사이클, 발행이 4명령/사이클이 되는, 역시 수퍼 스칼라/아웃 오브 오더 실장으로 구성면에서는 Cortex-A15에 가깝다. Krait도 몇개의 버전이 있어, 성능은 초대 Krait가3.3 DMIPS/MHz 정도, 최신 Krait 450가 3.51 DMIPS/MHz 정도가 나온다. Cortex-A15이 3.5 DMIPS/MHz니, 동등하다고 생각해도 될 것이다. 동등하지 않은 것은 투입시기로, Cortex-A15를 처음 실장한 Samsung의 「Exynos 5」의 샘플 출하가 2012년 후반임에 반해, 거의 그 1년 전에 Cortex-A15와 거의 동등한 코어를 집적한 SoC를 모뎀 포함으로 제공할 수 있었던 것이다. 이렇게 되면 Qualcomm을 쓰지 말아야할 이유를 찾는 쪽이 오히려 어려울 정도다.

결국 Qualcomm은,

  • 첨단 통신방식에 대응한 모뎀을 캐리어 인증을 취득한 형태로, 거기에 SoC 통합해서 제공할 수 있다.
  • CPU 코어나 GPU 코어는 경합제품과 비교해서 성능이 높지는 않다. 프로세스가 같고 한계소비전력이 같다면, 아키텍처를 연구했다고해서 그렇게 성능차가 나는 건 아니다. 하지만 경합제품보다 조기에 제공할 수 있다

라는 두 점에서 큰 가치를 가지고 있는 것이다.

갖고 있는 Nexus 4에서 규제정보를 표시하면, 유럽/아메리카/한국/오스트레일리아/뉴질랜드/필리핀/러시아/멕시코/카자흐스탄/인도/일본의 국가별 인증코드가 줄줄이 표시된다

일반적인 휴대폰의 경우, 우선은 일반적으로 통신규격이나 표준에 합치되는지 아닌지하는 인증을 그 국가의 기관에서 받을 필요가 있다. 일본을 예로 들면 총무성에서 기술기준적합증명등마크(통칭 적합마크)를 받지 않으면 애초에 그 나라 안에서 이용할 수 없다는 것은 주지의 사실이다.

이것을 취득하는 것도 고생이지만, 이건 시작일뿐이다. 어디까지나 발신하는 전파가 그 나라의 규제에 따르고 있는지를 나타내는 것뿐, 통신할 수 있는지를 보증하는 것은 아니다. 국내라면 NTT 도코모, au(KDDI), 소프트뱅크 모바일 등의 각 통신 캐리어별로 그 캐리어에서 문제없이 통신할 수 있는지를 개별적으로 확인할 필요가 있다. 귀찮은건 캐리어별로 기지국의 기재도 다르고, 통신방식(전파레벨, 그 위의 핸드쉐이크 레이어라던가, 더 위의 프로토콜 레이어같은 것도 포함하여)에 커스터마이즈가 가해진 경우도 있으므로, 그 모든 것에 입각하여 제대로 통신이 되는지 확인하여야 된다.

이것을 완료하고, 통신 캐리어에서 「이 휴대폰은 우리쪽이랑 제대로 통신할 수 있는 물건」이라는 딱지를 받는 것이 캐리어 인증이다. 이게 귀찮은 것은 나라별이 아니라, 통신 캐리어별이라는 점으로, LTE 정도되면 취득하기 위한 수고와 금액도 장난이 아니다.

여기서 Qualcomm의 강점이 드러난다. Qualcomm의 Gobi를 사용하면 이 캐리어 인증 처리가 굉장히 편해진다. 왜냐하면 Gobi 그 자체가 각 통신 캐리어에서 인증 취득을 마쳤으므로, 탑재 기기는 원칙적으로 캐리어 인증을 얻기 위한 테스트를 다시 하는 수고가 필요없기 때문이다. 현재 LTE 모뎀 대부분이 Qualcomm제인 가장 큰 요인이자 타사가 쫓아갈 수 없는 부분이기도 하다. 실제 어느 반도체 벤더는 「물론 기술적으로 LTE 모뎀을 제공하는 것은 가능하지만, 캐리어 인증에 필요한 수고와 비용을 생각하면, 후발주자들은 이미 비즈니스가 성립되지 않는다」고 이야기했다. 당연히 Qualcomm도 같은 수고와 비용을 치뤘지만, 이것은 Gobi가 시장을 거의 점유함으로써 충분히 상각되었다. 하지만 후발주자들은 같은 비용을 들여도 겨우 Gobi와 같은 위치에 서는 것이고, 거기서 비용을 상각할 수 있을 정도의 매상을 올리기 위한 무기는 되지 않는다…고 한다.

그럼, 이대로 Qualcomm이 시장을 계속 과점화할 것인가? 라는 의문에 대해서는 장기적으로는 불명료하다.

첫번째 문제는 모뎀이다. 확실히 현시점에서 LTE 모뎀을 제공할 수 있는 벤더는 많지 않지만 장기적으로는 일찌기 2G/3G/3.5G와 마찬가지로 LTE 기술 그 자체가 일반적으로 되어가면서 제공하는 벤더가 늘어날 것임을 상상할 수 있다. 그런 상황에서 Qualcomm의 히든카드는 통신에 관계된 많은 특허기술을 얻어두는 것이었지만, 앞으로는 그걸 회피할 수 있는 방식, 예를 들자면 Google은 Motorola Mobility를 매수하여 대항할 특허기술을 확보하였기에 「Android를 사용하는 한(Google이 보유한 특허로 받아치는 등) Qualcomm에서 라이선스를 받지 않아도 사용할 수 있다」같은 샛길이 생겨날 가능성이 크다. 애초에 LTE의 사양을 책정하고 있는 3GPP 스스로 "LTE의 보급을 위해서는 각사가 갖고 있는 특허가 병목이 된다"고 인식하여, 저가격의 특허로 이용할 수 있게 하는 기술개발을 추진하고 있는 상황이다.

이렇게 되면 앞으로도 Gobi로 시장을 점유할 수 있으리라고는 장담할 수 없다. Qualcomm도 이것을 알고 있기에, 올해 재빨리 차세대규격인 LTE Advanced 대응을 표명했지만, 그 후의 LTE-Advanced Evolution(LTE-B)이나 LTE-X에 관해서는 아직 동향을 확실히 하지 않았다. 만약 이런 신기술의 도입이 끊겨버린다면, Qualcomm의 우위성은 점차 옅어져가게 된다.

두번째 문제는 동사가 팹리스라는 점이다. 이로 인해 파운드리의 생산상황에 큰 영향을 받게 된다. 실제로 2012~2013년 초에 걸쳐 Snapdragon의 공급이 굉장히 핍박되어, 휴대기기 메이커가 어쩔 수 없이 Snapdragon 이외의 칩을 찾는 형태가 되었던 기억이 아직 새롭다. 이것은 당시 TSMC의 28nm 공정의 공급능력이 업계의 수요에 전혀 대응하지 못할 정도로 낮았던 것이 원인이었지만, 앞으로도 이런 일이 반복될 가능성은 낮지 않을 것이다.

세번째 문제는 제품이 고가격대로 치우쳐 있다는 점이다. Scorpion/Krait 둘다 ARM에서 아키텍처 라이선스를 취득하여 자사에서 구현한 것으로, 이에는 막대한 엔지니어링 비용이 들어갔다. 또, Gobi 모뎀의 개발비(그 절반은 거의 캐리어 인증이나 국가인증에 든 비용이지만)도 절대 싸지는 않다. 이런 개발비가 들어간 만큼 Snapdragon의 SoC 가격은 높은 편이다. 예를 들면 로우엔드인 Snapdragon 200을 사용해도 100달러 클래스의 스마트폰을 만드는 것은 매우 힘든 일(필자가 이야기를 들은 어느 메이커의 담당자 말로는 「무리」)로, 앞으로 이런 마켓을 어떻게 공략할 것인지에 관한 명확한 로드맵은 아직까지 동사에서 제시하고 있지 않다.

참고로 Krait 코어의 상미기한[각주:1]은 슬슬 끝이 가까워진 것 같다. 지난달 하이엔드인 2.5Ghz 구동의 Krait 450을 탑재한 Snapdragon 805을 발표했는데, 현행의 28nm 공정에서는 이게 거의 한계일 것이다. 이것의 후속으로 동사가 현재 64bit CPU로 이행하고 있는 건 틀림없는 듯 하다. 관계자는 명확하게 이야기하지 않았지만, ARM v8의 아키텍처 라이선스와 Cortex-A50 시리즈(아마도 A53)의 프로세서 라이선스를 이미 취득한 모양이다.

원래 Scorpion/Krait는 그 시점에서의 하이엔드 계열(Cortex-A9/A15)급의 성능을 가진 독자 코어가 목표였기에, 로우엔드용으로는 동작주파수를 줄여도 오버스펙이라는 느낌이 있다. 그렇기에 Snapdragon에서도 로우엔드 계열은 Cortex-A5(MSM7627A/MSM7227A등)이나 Cortex-A7(8926/8612등)을 탑재하고 있다. 이에 따라 로우엔드용으로는 Cortex-A53 코어, 하이엔드 용으로는 독자 코어(아마도 Cortex-A57와 동등 이상의 성능을 노린 것)을 투입할 방향이 될 것이라 생각된다.

……라는 원고를 편집부에 제출한 다음날인 12월 10일에 Qualcomm은 64bit에 대응하는 「Snapdragon 410」을 발표했다. 410라는 형번에서 알 수 있듯 이것은 미들레인지 아래쪽으로, 실질판매가격 150달러 전후의 스마트폰이 타겟이다. 릴리즈에서는 명기되지 않았지만, 기존의 Snapdragon 400 시리즈가 Krait를 탑재한 것과 Cortex-A7를 탑재한 것이 혼재되어 있는 사실을 생각하면 Snapdragon 410은 Cortex-A53을 탑재하고 있음을 상상할 수 있다. 당면은 이 Snapdragon 410을 64bit 이행의 발판으로 삼아, 본격적으로 64bit로 이행하는 것은 현재 개발중인 독자 64bit 코어의 투입 후가 될 것이다.

자사제품, 자사 파운드리가 강점인 Samsung

Qualcomm과는 또다른 전략으로 스마트폰/태블릿용 SoC 시장에서 큰 존재감을 유지하고 있는 것이 Samsung이다.

원래 Samsung은 옛날부터 ARM의 파트너 기업으로, ARM7TDMI나 ARM9 코어를 베이스로 임베디드 용도로 많은 제품을 출시했다. 또 애플리케이션 프로세서 시장에도 ARM 코어를 베이스로 한 제품을 일찍부터 내보냈다. 현재도 ARM9 베이스나 ARM11 베이스의 애플리케이션 프로세서를 라인업하고 있는 모습은 아니나 다를까 싶다.

실은 이 ARM11 베이스의 「S3C6410」의 전모델이었던 「S3C6400」은, 초대 iPhone의 애플리케이션 프로세서의 베이스가 된 물건이다. 이 S3C6400는 POP(Package On Package) 옵션이 준비되어 있어, 이것을 사용하여 동사의 Mobile DDR SDRAM을 실장한 것이 초대 iPhone의 프로세서로 채용되었다. 이 S3C6400 베이스의 독자 프로세서는 그 후 약간 사양을 바꿔 iPhone 3G에도 채용되기에 이른다.


S3C6400

Samsung은 이를 잇는 세대로 ARM에서 Cortex-A8 코어의 프로세서 라이선스를 얻어 이것을 탑재한 제품을 새롭게 「Exynos」라는 명칭으로 라인업한다.

초대는 동사의 45nm 공정을 사용한 Cortex-A8 싱글코어의 「Exynos 3」이지만, 이어서 45nm는 그대로 두고 Cortex-A9 MP(멀티코어)로 전환한 제품을 「Exynos 4」로 투입. 뒤이어 동사의 32nm HKMG 공정을 사용함과 동시에 쿼드코어의 제품도 투입한다. 2012년에는 업계에서 가장 먼저 Cortex-A15를 베이스로 한 「Exynos 5」를 먼저 투입, 뒤이어 28nm HKMG 공정으로 전환한 제품을 투입한다.

이 패턴, 어디서 본 기억이 없는가? 완전 Intel의 Tick-Tock 모델 그 자체다. 이것을 가능하게 하기 위해서는 첨단 공정을 이용할 수 있는 파운드리와 대량제조를 받치는 수요 두가지가 필요하고, Samsung은 그 양쪽을 모두 보유하고 있다. TSMC나 GLOBALFOUNDRIES와 비교하면 그다지 눈에 띄진 않지만, Samsung도 자사에서 파운드리 사업을 진행하고 있으며, 현재는 28nm의 HKMG 공정을 제공하고 있지만 동사는 Common Platform의 일원으로 앞으로 20nm 공정이나14nm FinFET 공정을 제공해갈 것임을 올해의 Common Platform Technology Forum에서 밝힌 바 있다. 이런 최신 공정을 항상 이용할 수 있다는 것이 동사의 커다란 강점이다.

또 하나의 요소인 수요면은 뭐 말이 필요없다. Samsung의 「Galaxy」시리즈의 막대한 라인업과 그 매상대수의 크기는 모든 독자들이 알고 있을 것이다. 이 Galaxy 시리즈의 태반에 Exynos가 탑재되어 있다는 시점에서 수요 역시 막대함을 쉽게 상상할 수 있다. Tick-Tock과 같은 복수의 공정 노드에 한발씩 걸치는 형태로 첨단 SoC를 만드는 작업은 그 높은 초기비용(설계비용이나 생산을 위한 마스크 비용 등) 때문에 팹리스 기업에서는 좀처럼 손댈 수 없는 방법이다. 하지만 Samsung의 경우에는 Galaxy 시리즈 덕에 이 허들을 뛰어넘을 수 있었던 것이다.


Galaxy Note 3

Galaxy S4

한편, “SoC의 내부”라는 관점에서 이야기하면 이렇다할 특징이 없다 할 수 있다. 예를 들어 최신 모델인 Exynos 5의 경우

CPU코어: Cortex-A15 Dual/Cortex-A15 Quad+Cortex-A7 Quad(big.LITTLE) GPU코어: Mali-T600 시리즈 또는 PowerVR SGX

로, 여기에 동영상 인코더/디코더나 카메라 용 ISP 등을 끼워넣은 것 뿐이다. ARM의 IP 샘플같은 만듬새라고 해도 지장이 없다. 실은 이게 바로 Samsung의 가치라고 해도 될 것이다.

오해를 두려워하지말고 이야기하자면, Samsung에는 자사에서 CPU나 GPU를 설계할 능력이 없다. 여기서 말하는 "설계"라 함은 ASIC 등의 설계로 이야기하면 상류설계, 즉 논리 레벨의 디자인 능력을 가리킨다. 실제로 Samsung은 독자 아키텍처의 CPU를 전혀 갖고 있지 않다. 굳이 말하자면 올해 IXYS Corporation에 매각한 4/8bit MCU인 「S3」시리즈가 있지만, 원래는 「Z8」아키텍처 베이스의 「SAM8/SAM88」코어를 이용한 것으로, 주변회로는 둘째치고 코어 아키텍처를 제로부터 만든 건 아니다. 또 Samsung이 구 DEC과 공동으로 일으킨 API Networks(옛 이름은 API:Alpha Processor Inc.)도 그다지 성과를 낳지 못한채 해산되었고, 거기에 해산된 후 대부분의 엔지니어는 AMD로 이적하여 HyperTransport Link의 개발에 종사하게 된 결과, Samsung 측에(Alpha의 라이선스는 취득했지만) 그다지 설계 자원은 남지 않았다고 한다.

반면, 물리설계에 관해서는 풍부한 자원과 디자이너를 갖추고 있다. 그렇지 않다면 Apple의 역대 프로세서를 제조하는 것과 같은 일은 무리였을 것이다. 아니 애초에 앞서 후쿠다씨의 리포트에도 적혀있듯 GLOBALFOUNDRIES와 거의 동규모의 매상(2012년에는 세계 3위인 43억 3천만달러)을 올린 이상, 물리설계 능력이 없다는 건 말이 안된다. 앞서 ARM의 샘플이 Samsung의 가치라고 설명한 것은 이런 부분이다.

동사는 파운드리이면서 논리 IP 그 자체의 라인업 능력은 좀 떨어진다. 하지만 이것은 ARM 생태계에 들어가 있으면 손쉽게 얻을 수 있다. 그런 한편 물리설계에는 일가견이 있으니 IP만 있으면 그것을 칩으로 만들어내는 것은 쉬운 일이다. Samsung이 Exynos 5에서 타사에 앞서 Cortex-A15을 실장하여 출하를 개시할 수 있었던 것은, 가치있는 일이라 말하지 않을 수 없을 것이다.

한가지 더 이야기하자면, 이런 방법은 유저(여기서는 SoC를 사용하여 스마트폰/태블릿 등을 만드는 벤더)에게 굉장한 메리트가 있다. 메이커가 독자적으로 논리설계를 하는 케이스에서는 그 메이커가 문서나 SDK, 드라이버등을 준비해줄때까지 사실상 자기 설계를 개시할 수 없다. 또 시뮬레이션 용의 모델등도 그러하여, 단순히 SoC 칩만을 제공받아봐야 곤란해질 뿐이다. 이런 점에서 기존의 IP를 그대로 사용한 케이스에서는 이런 것의 태반은 IP 공급자에게서 공급받는다. Samsung이 자사에서 준비할 필요가 없는 건 아니지만, 적어도 Qualcomm과 비교하면 훨씬 적을 것이다. 이것은 최종적으로는 개발기간단축으로 이어지게 되므로, 이것을 가치라고 볼 수도 있을 것이다.


Exynos 4 Quad

탑재단말의 차별화라는 관점에서 보면, 특징없는 ARM 베이스라 SoC에서의 차별화는 어렵지만, 애초에 최종제품의 차별화를 SoC로 하려고 생각하는 것이 넌센스다. Exynos든 Snapdragon이든 이것을 채용한 최종제품은 세상에 산더미처럼 많아 차별화는 SoC 이외의 부분에서 할 수 밖에 없다. 그렇다면 SoC 그 자체는 곧바르고 만들기 쉬운 편이 오히려 고마운 편이다. 여러가지 독자기능등이 들어있으면 오히려 다루는데 고생하게 되리라 짐작할 수 있다.

굳이 말하자면, 이 외에도 자사의 파운드리에서 제조하고 있기에 생산의 우위도가 높다는 것도 부차적인 메리트가 될 것이다. TSMC 등 외부 파운드리에 제조를 위탁하는 경우에는 타사의 SoC등과 혼재되어 좀처럼 제품을 입수하지 못하는 케이스도 생각할 수 있다. 실제로 2012년에는 그런 상황이었다.

한편, Samsung은 메리트와 표리일체의 문제도 안고 있다. 우선 Tick-Tock을 성립시키고 있는 원동력은 자사의 Galaxy 시리즈에 의한 대량구매로, 동제품의 판매속도가 떨어지면 이 구도 역시 무너지게 된다. 실제로 그런 징조가 보이기 시작한 만큼 앞으로 주의가 필요하다.

또, 파운드리측의 첨단 공정이 예정대로 미세화되어 가면 괜찮지만, 어떤 이유로 미세화가 정체되면 Samsung의 강점이 크게 손실되게 된다. 이것은 같은 Tick-Tock 모델을 갖고 있는 Intel에도 공통되는 이야기다. 따라서 Samsung은 첨단 공정에 투자를 계속해야만 한다. 이것은 결과적으로 비용을 상승시키게 되고, 그 결과 아무래도 SoC의 가격이 높아지게 된다는 문제는 Qualcomm과 같다.

참고로, Samsung 역시 64bit로의 이행을 진행하고 있다. 다음 「Exynos 6」시리즈는 Cortex-A57 Quad와 Cortex-A53 Quad에 의한 big.LITTLE 구성이 되는 것이 거의 확정사항이고, 나머지는 언제 나올것인지하는 것만이 주목점이다. Samsung으로서 자존심때문에라도 가장 먼저 내놓는 것을 목표로 하고 있을 거라 생각하지만, 과연 무사히 샘플 출하를 개시할 수 있을지 주시하고 있다.

  1. 식품등에서 맛이 떨어지지 않는 기한. 일본에서는 주로 유통기한 대신 이것을 표기함 [본문으로]

※ 이 글은 impress watch 에 실린 컬럼을 번역한 것입니다. 사정에 따라 예고없이 삭제될 수 있으므로 양해부탁드립니다.

최근의 스마트폰/태블릿용 SoC 제1회

원문 : 今どきのタブレット/スマートフォン向けSoC 第1回

이번회부터 시작되는 「1개월 집중강좌」는, 매월 정해진 테마에 대해서 1개월(4회 정도)에 걸쳐 파고들면서 깊게 이해하는 코너입니다.

첫회가 되는 이번달은 「태블릿/스마트폰용 SoC」에 대해서 오하라 유스케(大原雄介)씨가 해설해주시겠습니다. 요즘은 스마트폰, 태블릿에 SoC가 널리 사용되어 아주 가까운 존재가 되었습니다. 따라서 여러 SoC의 자리매김이나 각 벤더의 방향성 등 SoC 전반의 현재 동향을 4회에 걸쳐 보내드리겠습니다. (편집부)


애초에 왜 ARM 아키텍처인가

최근의 스마트폰/태블릿 대상 프로세서의 태반은 ARM 베이스다. 실제로 태블릿은 넘어가더라도, 스마트폰에 관해서는 국내를 보아도 전세계를 보아도 ARM 이외의 아키텍처를 채용한 케이스는 매우 적다. 왜 이런 상황이 되었는가, 그 이유는 역사적 경위라고 보는 견해가 강하다. 단적으로 이야기하자면 Nokia의 「Symbian OS」가 ARM 베이스였으니까라고 할 수 있는데, 좀 더 제대로 설명할까 한다.

초기…라고는 해도 1990년대 중반까지의 이야기지만, 당시의 휴대폰 내부를 대충 이야기하면 그림 1처럼 되어있었다. 아직 아날로그 방식이었던 시대였기에 간단해도 상관없었다고 할 수 있겠다. UI용 프로세서라는 것은 극히 간단한 액정표시나 키패드, 전화번호부 정도를 처리하는 것이었다. 32bit 프로세서가 아니라도 충분히 커버할 수 있었고, 실제로 16bit의 마이크로컴퓨터을 사용하던 제품도 있다(국내의 제품은 대체로 32bit 프로세서였던듯 하지만, 모두 그랬는지까지는 필자가 파악하지 못했다).

그림 1. 초기의 휴대폰 구성

하지만 디지털 통신으로 바뀌면서, 모뎀측에 통신처리를 담당하는 프로세서가 필요하게 되었다. 그래서 모뎀과 조합한 「베이스밴드 프로세서」라고 불리는 것이 등장한다. 이것은 ARM9 클래스의 CPU 코어에, 경우에 따라서는 DSP 등을 조합하여 실장된 것이 많았다. 이런 케이스에서는 화면의 표시나 키패드 제어는 베이스밴드 프로세서가 담당했다.

그림 2. 디지털 통신으로 전환된 무렵의 휴대폰 구성

하지만, 점차 휴대폰 위에서의 애플리케이션 성능이 요구되면서, 이것만으로는 따라갈 수 없게 되었다. NTT 도코모의 i모드가 그 대표적 예다. 또 카메라 기능이 널리 탑재되게 된 것도 이 무렵이라고 기억하고 있는데, 이런 기능들의 처리는 베이스밴드 프로세서에만 맡겨놓을 수 없게 되어 「애플리케이션 프로세서」라는 것이 새로 탑재되게 된다.

그림 3. 더 많은 성능이 요구된 결과 애플리케이션 프로세서가 등장

당초에는 여러 메이커가 이 애플리케이션 프로세서에 손을 댔다. 국내만 봐도 히다치(현 르네사스 일렉트로닉스)의 「SH」시리즈나, 마츠시타전기산업(현 파나소닉)의 「UniPhier」(유니피에)가 있다. 국외로 눈을 돌리면 여기에 MIPS 베이스의 프로세서가 탑재된 케이스도 있다.

하지만, 최종적으로는 이것들이 모두 ARM으로 통일되게 된다. 가장 큰 이유는 이런 휴대폰 OS가 개발기간등의 관계로 Symbian OS로 집약되어 갔기 때문이다. Nokia는 자사의 휴대폰만이 아니라 다른 회사의 휴대폰용으로도 Symbian OS를 적극적으로 OEM 공급하였는데, 이것을 이용하기 위해 필연적으로 CPU 아키텍처가 ARM으로 좁혀지게 된 것이다.

한번 마켓 쉐어를 잡으면, 여기에 진 아키텍처는 점점 쇠퇴해간다. 반면, 쉐어를 잡은 아키텍처가 점점 시장을 과점화하는 모습은 휴대폰에서도 현저하게 나타났으며, 그 결과 (초대 iPhone이 등장하기 직전인) 2006년에 Symbian OS(와 ARM)의 마켓 쉐어는 압도적이었다. 지역에 따라 다르지만, 2006년 당시의 휴대폰용 OS는 "북미 이외는" Symbian 계열이 6할 이상, 특히 동남아시아 등에서는 90%를 훨씬 넘었으며, 일본이나 중국에서도 6할이라는 수치였다.

북미가 특별했던 것은, Windows CE 베이스의 휴대폰에 더해 RIM(Research In Motion)의「BlackBerry」라는 유력한 제품이 있었기 때문이다. 하지만 BlackBerry나 Windows CE 베이스의 제품도 대부분 ARM 베이스의 프로세서를 채용하고 있었기에, 이미 휴대폰용으로는 승부가 결정난 것이나 마찬가지였다.

이후에는, Apple에 의한 iPhone의 투입과 Google에 의한 Android의 투입 등을 거쳐 현재에 이르게 되는데, 어느 것이나 ARM 베이스의 SoC라는 것은 이미 알고 있을 것이다. 실제로 SoC를 만드는 쪽에서도, SoC를 사용한 스마트폰을 만드는 쪽에서도 어지간한 이유가 아니면 아키텍처를 변경할 이유가 없다. 또, 아키텍처가 같은 쪽이 개발환경이나 소프트웨어 자산을 살리기 쉽다. 물론 ARM 측도 트렌드에 맞춰 유연하게 아키텍처를 진화시켜왔기에, "아키텍처를 변경할 어지간한 이유"가 생겨나지 않은 것도 사실이다.

ARM 아키텍처의 변천

그럼, 그 ARM 아키텍처가 얼마나 대단한가…하면 솔직히 말해 명령셋이 딱히 대단하거나 하진 않다. ARM v8의 64bit 명령에서는 상당히 깔끔한 명령체계가 되었지만, 32bit 명령은 립서비스라도 깔끔하다고는 하기 힘들다.

이에는 이유가 있는데, 원래 ARM v1(초대 ARM1 코어)가 명령수나 성능이나 아슬아슬했던 탓에 약간 변칙적인 구조를 채용했기 때문이다. 그것이 그대로 현재까지 이어져 내려오게 된 것이다. 이런 점은 「8080」의 명령체계를 그대로 이어받은 현재의 x86이나 x64에도 할 수 있는 이야기이다. 명령체계가 깔끔하다 운운하는 것은 취향이라고 해야할지 주관이 들어가는 부분이지만, 설계시점에 명령셋에 유연함이 있던 「MIPS」나 「SPARC」쪽이 명령체계가 깔끔하다고 생각한다.

무엇보다 깔끔하면 성능이 좋은가하면 그런것도 아니다. 애초에 요즘과 같이 명령을 내부변환함으로써 복수의 RISC 명령으로 분해하여 처리하는 방식이 주류가 되면, 명령셋 그 자체는 그다지 성능에 영향을 미치지 않는다고 해도 된다. 오랫동안 휴대기기나 소비전력이 낮은 임베디드 기기가 타겟이었기도 하고, 절대적인 파워 버짓(Power Budget)을 낮게 억누르고 그 안에서 성능개선을 꾀하는 것에 노력해온 것이 ARM의 강점이었으며, 이것을 회로기술에 살렸다. 단, 다른 아키텍처와 비교해서 크게 성능면에서 차이가 나면 앞서 이야기한 "어지간한 이유"가 되어버리므로, 트렌드를 파악하면서 이에 착실히 따라왔다.

그 ARM 아키텍처와 대표적인 코어를 묶은 것이 그림 4이다. 아무래도 ARM v5 이전의 아키텍처는 현재에는 거의 사용되지 않으며, ARM9를 포함한 ARM v6이 최저 레벨이 되었다.

그림 4. ARM 아키텍처와 대표적 코어

이에 기반하여 개발된 ARM11은 초대 iPhone에 채용되기도 하며, 최근에는 마이크로컴퓨터보드 「Raspberry Pi」에도 ARM11이 내장되는 등 아직도 널리 이용되고 있다. 기본적인 명령셋은 그 이전의 ARM v5까지와 크게 다르지 않지만, 「Thumb-2」라고 불리는 축소명령셋(명령 그 자체는 32비트지만, 물리적인 명령포맷을 축소하여 사이즈를 32bit 미만으로 만든 것)을 탑재한 것이 큰 차이다. 또 뒤따라 멀티프로세서 대응명령 등이 추가되었는데, 이것은 ARM과 NEC 일렉트로닉스(현 르네사스 일렉트로닉스)와의 공동개발로, ARM11을 베이스로 한 멀티프로세서 구성이 가능해진 것과 관계가 있다.

ARM v6과 ARM11 코어는 널리 사용되었지만, ARM v6 그 자체는 둘째치고 ARM11코어는 기본적으로 싱글 이슈의 인 오더 형(로드/스토어 쪽에서는 일부 아웃 오브 오더 형도 실장)으로, 동작주파수도 수백 Mhz 정도(초대 iPhone에 탑재된 것도 620Mhz 구동)이었기에, 2004년 경이 되면 아무래도 성능면에서 부족함이 보였다. 이때 투입된 것이 ARM v7A 아키텍처와 Cortex-A8 코어다.

이 세대에서 ARM은 아키텍처를 애플리케이션용(ARM v7A), 실시간용(ARM v7R), 마이크로컨트롤러용(ARM v7M) 3개로 나누었다. 이 머릿글자를 모으면 「ARM」이 되는 것을 노렸다는 걸 ARM은 "공식적으로는" 인정하고 있지 않지만, 뭐 아마 그렇지 않을까. 그건 그거고, 이 ARM v7A에서는 멀티코어 대응에 더해 본격적인 OS(주로 Linux)에 대응한 프로세서 리소스의 가상화, 「NEON」이라고 불리는 SIMD 연산 엔진등도 추가되었다. 또, Java 동작에 맞춰 「Jazelle」라는 Java의 바이트코드를 네이티브 실행할 수 있는 모드가 ARM v6부터 추가되었는데, ARM v7에서는 이것을 확장한 Jazelle RCT(Runtime Compilation Target)이 새롭게 실장되었다.

이 ARM v7A에 처음으로 대응한 것이 2005년의 Cortex-A8로, 인 오더 형이면서도 2명령의 수퍼 스칼라 구성이다. 2007년에는 이것을 아웃 오브 오더화한 Cortex-A9도 투입된다. 또, 당초부터 멀티프로세서를 고려하였으며, 현재에는 Cortex-A9 MP가 널리 이용되고 있음은 주지의 사실이다. 2009년에는 오히려 성능이 낮아도 좋으니 저소비전력/적은 다이사이즈의 제품이 필요하다는 요구에 맞춰 1명령에 인 오더 구성인 Cortex-A5도 투입되고 있다.

이 ARM v7은 실은 2010년에 약간 변경이 있었다. 2010년 8월의 Hot Chips 22에서 처음 발표되었는데, 하드웨어 레벨의 가상화 지원과 LPAE(Large Physical Address Extension)이라는 주소확장이 이루어졌다. 이 LPAE는 x86에서 말하는 PAE와 거의 같은 것으로, 개별 프로세스의 가상 주소 그 자체는 32bit(4GB)로 제한되어 있지만, 시스템 전체에서는 40bit(1TB)로 확장되어 있다. 사양적인 차이는 그 정도지만, ARM 자신은 이 변경 전의 아키텍처와 변경 후의 아키텍처를 나누어 취급하고 있으며, 이 이후에 투입된 코어는 모두 새로운 ARM v7에 준거하게 되어있다.

그 2010년에 발표된 것이 Cortex-A15과 Cortex-A7이다. Cortex-A15는 Cortex-A9의 상위에 해당하는, 3명령의 수퍼 스칼라/아웃 오브 오더 구성이다. Cortex-A7은 Cortex-A5의 후계가 되는 코어이지만, 큰 차이는 여기서 big.LITTLE이라는 구성을 취할 수 있다는 것이다. 2013년에는 Cortex-A7과 A15의 중간정도의 성능이 되는 Cortex-A12도 개발되게 된다.

이것과는 별도로, ARM은 2012년에 ARM v8 아키텍처를 발표, 64bit 로 이행함과 동시에, 이에 대응한 Cortex-A57/Cortex-A53의 양 코어를 발표하여 현재에 이르게 된다.

ARM 기반 SoC의 동향

그럼, 이것을 사용하는 SoC 벤더의 상황은 어떻게 되었을까. 앞서 적은대로, 1990년대는 Nokia가 가장 큰 쉐어를 쥐고 있었지만, 이에 과감하게 뛰어든 것이 Qualcomm이다. CDMA 방식의 총괄자라고 하면 알기 쉬우려나. 일본을 예로 들면 au가 전면적으로 채용한 것으로 유명하다.

이에 이어 2000년 전반에 여러 반도체 메이커가 휴대폰/스마트폰용으로 SoC를 투입했다. 예를 들어 TI(Texas Instruments)는「OMAP」패밀리를 팔았으며, Freescale은「MXC」라 불리는 SoC(정확히는 MCM:Multi Chip Module)을 개발했다. Intel도 「Manitoba」라 불리는 XScale 베이스의 SoC를 개발한다. 이 외에 Ericsson도 휴대폰용 칩을 제공했지만, STMicroelectronics과 함께 ST-Ericsson이라는 합자기업을 만들어 이곳으로 제품이나 개발을 이관한다.

국내에서도 주요 휴대폰 벤더는 자사에서 SoC를 개발했다. Android 등장 이전에는 iOS를 제외하면 사실상 Symbian OS밖에 없었으므로 ARM 베이스의 SoC를 만들어, 여기에 Symbian OS를 이식한 것이다. 물론 자사에서 OS까지 손대는 곳도 있었지만 괜찮은 결과가 나오지 않았다는 것은 모두가 아는 대로.

자, 이런 움직임은 아까 보여준 그림 3의 구조가 성립되는 한 문제가 없었다. 하지만 실제로는 그림 5를 거쳐 그림 6과 같이 변화해간다. 그 과정에서 점점 벤더가 떨어져나갔다.

그림 5. 베이스밴드와 애플리케이션 프로세서의 통합 그림 6. 베이스밴드, 애플리케이션 프로세서, 모뎀의 통합

우선 소형화와 저가격화가 진행된 결과, 베이스밴드 프로세서와 애플리케이션 프로세서를 따로 두는 것은 실장면적이나 부품원가의 관점에서 경제적이지 못하다는 이야기가 당연히 나오게 된다. 특히 모뎀의 규격이 2.5G에서 3G를 거쳐 3.5G(HSUPA/HSDPA), 3.9G/4G(LTE)로 진화해가면서, 이것을 제대로 따라가는 모뎀이나 베이스밴드 프로세서를 내놓을 수 있는 메이커가 줄어들어 갔다. 가장 확연한 예시가 TI로, 동사의 OMAP 그 자체는 널리 쓰여졌지만 모뎀 그 자체를 갖고 있지 않아 타사(딱잘라 말하면 Qualcomm)에서 모뎀칩을 구입해야만 했다. 그렇게 되면 휴대기기 벤더는 OMAP 프로세서와는 별도로 Qualcomm의 모뎀을 구입해야할 필요가 있으며, 부품값도 더 들고 실장면적도 늘어난다. Qualcomm의 Snapdragon 시리즈를 사용하면 모뎀 내장 타입도 있고, 모뎀을 빼놓는 경우에도 가격은 싼 편이다. 그렇다는 것은, TI가 Snapdragon에 대항하려면 모뎀분만큼 가격을 내리지 않으면 대항할 수 없다는 소리가 된다. 당연히 이에 따라 수익성은 맹렬히 내려간다.

이런 수익성의 악화에 따라 Intel이나 Freescale은 이른 타이밍에 휴대폰용 SoC의 개발을 포기해버렸고, TI도 마찬가지다. ST-Ericsson의 경우 모뎀의 개발비용을 흡수하지 못하고 2013년에 회사를 청산하고 만다. Nokia에게 모뎀부문을 매수하면서 Broadcom에 매각되어 버린 르네사스 일렉트로닉스도 마찬가지다.

그렇다고 해서 「Qualcomm의 단독승리인가」하면 당연히 거기서 기회를 엿보는 메이커도 있기 마련, 다음회부터 그런 사정을 개별적으로 소개해갈까 한다.

+ Recent posts