Google Tensor

주요 ARM SoC 브랜드
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -6px -1.5px -13px"			Application Processor

MediaTek	Qualcomm Snapdragon	Apple Silicon	UNISOC	Samsung Exynos	HiSilicon Kirin

Allwinner	Amlogic	Ampere Computing	Broadcom	Marvell ARMADA	NXP i.MX AP

Realtek	Rockchip	NVIDIA Tegra	Google Tensor	Telechips
Micro Controller Unit

STMicroelectronics STM32	NXP i.MX MCU	Atmel SAM	Renesas RA series

}}}}}}}}} ||

1. 개요2. 상세3. 모바일 AP

3.1. Google Tensor3.2. Google Tensor G23.3. Google Tensor G33.4. Google Tensor G4

4. 오디오 SoC

4.1. Google Tensor A1

1. 개요

Google Tensor는 구글 픽셀 제품에 들어가는 프로세서이다.

2. 상세

처음에는 삼성과 협업을 통해 개발했다. 삼성 엑시노스 기반 구글 AP칩이였다.[1] 픽셀 6와 픽셀 6 프로와 함께 공개되었다.

엑시노스 기반이긴 하나 다른 점이 많다. 첫 번째로는 채용한 아키텍처 구성에 차이가 있으며 두 번째로는 NPU부분을 자체 개발한 edge TPU를 사용한다는 점이다.

구글 데이터에 의하면 Tensor 칩의 발열이[2] 픽셀 제품 반품의 주 원인이라 전성비 개선을 목표로 하고 있으며 배터리 지속시간에 대한 개선도 있을 것이라 한다. #

Tensor G5부터는 삼성하고 결별하고 TSMC에 제조를 맡긴다. #

Tensor라는 이름 때문에 TPU제품인가 착각할 수 있지만 TPU와의 접점은 내부에 탑재된 NPU가 edge TPU기반이라는것 말곤 없다.

3. 모바일 AP

3.1. Google Tensor

<colbgcolor=#cdcdcd,#373a3c> 파트넘버	GS101-S5P9845
CPU	2 × ARM Cortex-X1 2.80 GHz 2 × ARM Cortex-A76 2.25 GHz 4 × ARM Cortex-A55 1.80 GHz
CPU	{{{#363A3D,#DDDDDD {{{#!wiki style="margin: -1px -11px" {{{#!folding [ 캐시 구성 정보 ]	X1 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / 1 MB L2 캐시 A76 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / 256 KB L2 캐시 A55 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / 128 KB L2 캐시 4 MB L3 공유 캐시 8 MB 시스템 캐시	}}}}}}}}}
GPU	ARM Mali-G78 MP20 848 MHz(996 MHz)[G1/G2클럭]
NPU	1세대 Edge TPU (Abrolhos) 1066 MHz
명령어셋	ARMv8.2-A
메모리	16-Bit 쿼드채널 LPDDR5 3200 MHz 메모리 대역폭 : 51.2 GB/s
생산 공정	삼성 파운드리 SF5E
내장 모뎀	없음
주요 사용 기기	Google Pixel 6, Google Pixel 6 Pro, Google Pixel 6a

2021년 10월 20일 공개된 구글의 첫번째 자체 개발한 모바일 AP로, 코드네임은 잭 더 리퍼의 활동지로 유명한 화이트채플(Whitechapel)이다. 엑시노스 990 [4]과 엑시노스 2100 [5]의 특성이 섞여있다.

CPU는 ARM Cortex-X1을 듀얼코어 구성으로 빅 클러스터를 이루고, ARM Cortex-A76를 듀얼코어 구성으로 미들 클러스터를 이루고, ARM Cortex-A55를 쿼드코어 구성으로 리틀 클러스터로 이뤄서 ARM big.LITTLE 솔루션을 적용한 DynamIQ 방식 HMP 모드 지원 옥타코어 CPU를 탑재했다.

GPU는 ARM Mali-G78을 20코어 구성으로 탑재했다.

외장 모뎀은 삼성 엑시노스 모뎀 5123, Sub-6GHz 대역 무선기로 삼성 샤넌 5511, mmWave 대역 무선기로 삼성 샤넌 5710을 사용한다. 단, 미국에 출시된 구글 픽셀 6 시리즈의 경우 삼성 샤넌 5710이 빠져 있다.

3.2. Google Tensor G2

<colbgcolor=#cdcdcd,#373a3c> 파트넘버	GS201-S5P9855
CPU	2 × ARM Cortex-X1 2.85 GHz 2 × ARM Cortex-A78 2.35 GHz 4 × ARM Cortex-A55 1.80 GHz
CPU	{{{#363A3D,#DDDDDD {{{#!wiki style="margin: -1px -11px" {{{#!folding [ 캐시 구성 정보 ]	X1 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / 1 MB L2 캐시 A78 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / 256 KB L2 캐시 A55 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / 128 KB L2 캐시 4 MB L3 공유 캐시 8 MB 시스템 캐시	}}}}}}}}}
GPU	ARM Mali-G710 MP7 848 MHz(996 MHz)[G1/G2클럭]
NPU	2세대 Edge TPU (Janeiro) 1066 MHz
DSP	1세대 GXP (Amalthea) MP4 975 MHz
명령어셋	ARMv8.2-A
메모리	16-Bit 쿼드채널 LPDDR5 3200 MHz 메모리 대역폭 : 51.2 GB/s
생산 공정	삼성 파운드리 SF5E
내장 모뎀	없음
주요 사용 기기	Google Pixel 7, Google Pixel 7 Pro, Google Pixel 7a, Google Pixel Fold, Google Pixel Tablet

모뎀은 삼성 엑시노스 모뎀 5300을 사용한다. 전체적으로 구글 텐서 1세대의 리비전 AP이다. 대신 GPU는 1세대 텐서 AP가 Mali-G78을 무려 20코어 탑재한 데 비해 Mali-G710 7코어로 거의 1/3 토막이 났다[7]. 또한, 구글이 자체 개발한 DSP인 'GXP'를 도입하는 등 구글의 설계 비중이 전 세대 대비 좀 더 커졌다.

6월 20일, 트위터(kamila)의 게시된 내용에 따르면 Pixel 7a에 탑재된 텐서 G2는 기존 Pixel 7, 7 Pro에 적용된 삼성의 최신 FOPLP-PoP 패키징 기술이 아닌 더 저렴한 iPoP 패키징 기술이 사용된 파생 버전으로 확인 되었다.[8] 그 결과 파생된 G2 AP는 더 두껍고, 크고, 높은 발열을 발생 시킬 수 있다고 하지만 Pixel 7, 7a, 두 기기 모두 다른 방열 설계, 스로틀링 특성을 가지고 있어 패키징 기술에 따른 성능 차이를 정확히 비교하기 어려울 것이다.

한편, 물류정보 추적 결과 G2 뿐만 아니라, 후속 G3에서도 후공정 패키징에 차등을 두는것으로 보인다.

코드네임은 클라우드리퍼(Cloudripper) 또는 화이트채플 프로(Whitechapel Pro)이다.

3.3. Google Tensor G3

<colbgcolor=#cdcdcd,#373a3c> 파트넘버	GS301-S5P9865
CPU	1 × ARM Cortex-X3 2.91 GHz 4 × ARM Cortex-A715 2.37 GHz 4 × ARM Cortex-A510R 1.70 GHz
CPU	{{{#363A3D,#DDDDDD {{{#!wiki style="margin: -1px -11px" {{{#!folding [ 캐시 구성 정보 ]	X3 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / 1 MB L2 캐시 A715 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / 256 KB L2 캐시 A510R : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / 128 KB L2 캐시[9] 8 MB L3 공유 캐시 16 MB 시스템 캐시	}}}}}}}}}
GPU	ARM Mali-G715 MP7 890 MHz (900 MHz)[G3클럭]
NPU	3세대 Edge TPU (Rio) 1119 MHz
DSP	2세대 GXP (Callisto) MP4 1065 MHz
명령어셋	ARMv9-A
메모리	16-Bit 쿼드채널 LPDDR5X 4266 MHz 메모리 대역폭 : 68.26 GB/s
생산 공정	삼성 파운드리 SF4
내장 모뎀	없음
주요 사용 기기	Google Pixel 8, Google Pixel 8 Pro, Google Pixel 8a

미국 동부 시간으로 2023년 10월 4일 오전 10시에 공개된 구글의 세 번째 자체 개발 AP이다. 코드네임은 주마(Zuma)로, 미국 캘리포니아 주 로스엔젤레스 카운티 말리부 시티에 있는 캘리포니아 주에서 매우 인기 있는 해수욕장의 이름이다.[11]

픽셀 6 시리즈에 탑재된 텐서와 비교했을 때 인공지능 성능이 2배로 올랐으며, Made By Google 2023 키노트에서 인공지능 관련 성능을 강조했다.

CPU는 ARMv9-A 명령어셋을 기반으로 Cortex-X3 싱글코어로 빅 클러스터를 이루고, Cortex-A715 쿼드코어로 미들 클러스터를 이루고, Cortex-A510R 쿼드코어로 리틀 클러스터를 구성한다. ARM big.LITTLE 솔루션을 적용한 DynamIQ 방식 HMP 모드 지원 노나코어 구성이다.

GPU는 ARM Mali-G715를 7코어로 탑재한다. 실제 디바이스에서 돌린 GFXBench 5.0 Aztec Ruin Vulkan 벤치마크 결과, 1440p 해상도 기준 37 FPS에 소비전력 4.7 W를 기록하였다. 비슷한 소비전력대에서 스냅드래곤 8+ Gen 1급 전성비를 보인다. 다만 최대성능은 더 낮은 편.

외부 모뎀은 삼성 엑시노스 모뎀 5300을 사용한다.

제조 공정은 삼성 파운드리 SF4이며,[12] Tensor G2처럼 모델별로 패키징을 달리 적용한다. Pixel 8a는 iPoP, Pixel 8 및 Pixel 8 Pro는 FOPLP-PoP 패키징을 적용한다.

긱벤치6 성능 대 소비전력 경향을 살펴보면 굉장히 좋지 않은 전성비를 보이고 있는데, 캐시 메모리 칼질과 구글의 부족한 설계 능력이 겹쳐 삼성 파운드리 SF4P로 제조된 엑시노스 2400과 비교해도 매우 심한 격차를 보이고 있다. 긱벤치5 기준으로 보면 구글 텐서 G3의 전성비는 스냅드래곤 888과 비슷하다. #

3.4. Google Tensor G4

<colbgcolor=#cdcdcd,#373a3c> 파트넘버	GS401-S5P9875
CPU	1 × ARM Cortex-X4 3.1 GHz 3 × ARM Cortex-A720 2.60 GHz 4 × ARM Cortex-A520 1.95 GHz
CPU	{{{#363A3D,#DDDDDD {{{#!wiki style="margin: -1px -11px" {{{#!folding [ 캐시 구성 정보 ]	X4 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / ? MB L2 캐시 A720 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / ? KB L2 캐시 A520 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / ? KB L2 캐시[13] ? MB L3 공유 캐시 ? MB 시스템 캐시	}}}}}}}}}
GPU	ARM Mali-G715 MP7 940 MHz
NPU	3세대 Edge TPU (Rio) 1119 MHz
DSP	2세대 GXP (Callisto) MP4 1065 MHz
명령어셋	ARMv9.2-A
메모리	16-Bit 쿼드채널 LPDDR5X 4266 MHz 메모리 대역폭 : 68.26 GB/s
생산 공정	삼성 파운드리 SF4P
내장 모뎀	없음
주요 사용 기기	Google Pixel 9, Google Pixel 9 Pro, Google Pixel 9 Pro XL, Google Pixel 9 Pro Fold

구글이 2023년 8월 13일 공개한 네 번째 자체 개발 AP로 코드네임은 주마 프로(Zuma Pro)이다.

사실 이 AP는 원래 구글이 TSMC에 생산을 맡기려고 했던 코드네임 리돈도(Redondo)라고 임시로 불렀던 자체 개발 AP가 구글이 2024년 TSMC 주문 시한을 놓쳐버리면서 붕 떠버리자 급하게 그 공백을 메우기 위해 땜빵으로 개발한 거에 가깝다. 그래서 GPU, TPU, DSP가 전부 구글 텐서 G3에서 썼던 것을 재탕한 것이다.

SPEC2006 벤치마크에서는 Cortex-X3를 사용한 이전 세대 AP들에게도 IPC 열위를 보이고 같은 공정과 CPU아키텍처가 사용된 엑시노스 2400과 비교해도 심히 떨어지는 성능과 전성비를 보이면서 구글이 TSMC에 주문하지 못해 땜빵으로 개발한거라는걸 여실히 보여줬다. #

이에 대한 구글의 입장은 다음과 같다. #

"칩을 설계할 때, 우리는 스피드와 기능(feats)을 위해 설계하지 않습니다. 우리는 현재 나와 있는 특정 벤치마크를 이기기 위해 설계하지 않습니다. 우리는 우리의 사용 사례에 맞게 설계합니다. 우리는 앱을 여는 데 어려움이 있다는 것을 알고 있었습니다. 그래서 G4를 만들 때, 우리는 사용자에게 더 나은 경험을 제공하기 위해 무엇을 해야 할지에 집중했습니다."
"우리는 TPU(Tensor Processing Unit)에도 같은 접근 방식을 취합니다. 우리는 딥마인드 팀과 협력하여 모델이 어디로 향하고 어떤 종류의 모델을 기기에서 실행하고 싶은지에 대한 장기적인 예측을 살펴봅니다. 크기는 얼마입니까? 얼마나 큰가요? 얼마나 빨리 처리해야 합니까? 이러한 제미나이 온디바이스 모델을 사용하는 사용 사례를 위해 설계할 때 메모리 대역폭과 같이 칩의 다른 어떤 요소가 더 빨리 실행되는 것을 방해할까요? 그래서 우리는 칩을 만들고 설계할 때 이 모든 것을 고려합니다."
- 소니야 조반푸트라, 픽셀 제품 관리자, 2024년 8월

===# Google Tensor G5 (가칭,미공개) #===

<colbgcolor=#cdcdcd,#373a3c> 파트넘버	GS401-S5P9875
CPU	1 × ARM Cortex-X4 3.40 GHz 5 × ARM Cortex-A725 2.86 GHz 2 × ARM Cortex-A520 2.24 GHz
CPU	{{{#363A3D,#DDDDDD {{{#!wiki style="margin: -1px -11px" {{{#!folding [ 캐시 구성 정보 ]	X4 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / ? MB L2 캐시 A725 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / ? KB L2 캐시 A520 : ?? KB L1 명령 캐시 + ?? KB L1 데이터 캐시 / ? KB L2 캐시[14] ? MB L3 공유 캐시 ? MB 시스템 캐시	}}}}}}}}}
GPU	IT PowerVR DXT-48-1536 1100 MHz
NPU	Google TPU (18 TOPS INT8 / 9 TOPS FP16)
DSP	???
명령어셋	ARMv9.2-A
메모리	16-Bit 쿼드채널 LPDDR5X 4266 MHz 메모리 대역폭 : 68.26 GB/s
생산 공정	TSMC N3E
내장 모뎀	없음
주요 사용 기기	-

구글이 개발 중인 아직 공개되지 않은 자체 개발 AP로 코드네임은 라구나(Laguna)이다. 삼성으로부터 벗어난 첫 Tensor G시리즈 AP이며, 설계도 완전히 구글이 전담하고 생산 역시 TSMC에서 이루어진다. 또한 ARM Mali GPU가 아닌 Imagination Technologies의 PowerVR을 쓰는 것도 특징이다.

워낙에 저열한 설계능력을 보였던 구글이라[15] Tensor G5에서 이를 반전시킬 수 있을지가 관건이다.

4. 오디오 SoC

4.1. Google Tensor A1

구글이 픽셀 버즈 Pro 2와 더불어 공개한 자체 개발 오디오 프로세서이다.

[1] 엑시노스 NPU 강화판에 가깝다. [2] 삼성 엑시노스 기반이라 그런지 엑시노스의 낮은 전성비, 발열, 짧은 배터리 수명 등의 문제점을 그대로 답습하고 있다. [G1/G2클럭] 셰이더 코어에서는 848 MHz로, 타일러(Tiler) 및 GPU L2 캐시 단에서는 996 MHz로 구동한다. [4] 미들 클러스터를 이루는 코어가 Cortex-A76이다. [5] 빅 클러스터를 Cortex-X1이 구성하며, GPU는 Mali-G78이다. [G1/G2클럭] [7] 코어가 하나라도 비활성화된다면, Arm 네이밍 법칙에 따라 G610으로 격하되는 사양이다 [8] 출처 [9] 2개의 Cortex-A510R 코어가 128 KB의 L2 캐시를 공유한다. 따라서 코어 하나당 L2 캐시는 64 KB이다. [G3클럭] 셰이더 코어에서는 890 MHz, 타일러 및 L2 캐시 단에서는 900 MHz로 구동한다. [11] 무려 14개의 인명구조원 주재 감시탑이 있는 대규모의 해수욕장. [12] 구명칭 4LPP [13] 2개의 Cortex-A520 코어가 ? KB의 L2 캐시를 공유한다. 따라서 코어 하나당 L2 캐시는 ? KB이다. [14] 2개의 Cortex-A520 코어가 ? KB의 L2 캐시를 공유한다. 따라서 코어 하나당 L2 캐시는 ? KB이다. [15] 텐서 G4의 경우 엑시노스 2400과 비교했을 때 같은 아키텍처, 같은 공정, 거의 같은 클럭인 상황에서 성능과 전성비가 뒤떨어지며 처참한 설계능력을 여실히 드러냈다.

Google Tensor

1. 개요

2. 상세

3. 모바일 AP

3.1. Google Tensor

3.2. Google Tensor G2

3.3. Google Tensor G3

3.4. Google Tensor G4

4. 오디오 SoC

4.1. Google Tensor A1

분류