mir.pe (일반/밝은 화면)
최근 수정 시각 : 2024-12-01 01:43:01

인텔 코어 Ultra 시리즈/2세대


파일:상위 문서 아이콘.svg   상위 문서: 인텔 코어 Ultra 시리즈
Intel® Core™ Ultra 시리즈 및 마이크로아키텍처
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1px -11px"
Optimization
최적화
Process · Optimization
공정 미세화 · 최적화
Process · Architecture
공정 미세화 · 마이크로아키텍처 변경
Intel 7
Intel 4 + TSMC N5 · N6
TSMC N3B · N6
인텔 코어 i 시리즈 참조 1세대[L]
Meteor Lake 메테오 레이크 (2023)
( Redwood Cove 레드우드 코브 + Crestmont 크레스트몬트)
2세대
Lunar Lake 루나 레이크 (2024)[L]
( Lion Cove 라이언 코브 + Skymont 스카이몬트)
Process · Architecture
공정 미세화 · 마이크로아키텍처 변경
TSMC N3B · N5 · N6
Intel 18A[A] + TSMC[A]
2세대
Arrow Lake 애로우 레이크 (2024)
( Lion Cove 라이언 코브 + Skymont 스카이몬트)
3세대
Panther Lake 팬서 레이크 (2025)
(Panther Cove 팬서 코브(가칭) + Darkmont 다크몬트(가칭))
사용 모델은 ●으로 표시
[ 각주 펼치기 · 접기 ]

[L] 노트북 모델 한정 [L] [A] 미확정 [A]
}}}}}}}}}||



1. 개요2. 공통3. 모바일 저전력용: 루나 레이크
3.1. 제품3.2. 성능 및 전성비 분석
3.2.1. CPU3.2.2. GPU3.2.3. 전력 소모 및 배터리 효율
3.3. 평가
3.3.1. 긍정적 평가3.3.2. 부정적 평가3.3.3. 복합적 평가
4. 데스크탑 및 모바일 중·고전력용: 애로우 레이크
4.1. 제품4.2. 상세
4.2.1. 작업 및 AI4.2.2. 게임4.2.3. 오버클럭 마진, 온도 및 전력
4.3. 평가(애로우 레이크-S)
4.3.1. 긍정적 평가4.3.2. 부정적 평가4.3.3. 복합적 평가4.3.4. 긍정적 평가4.3.5. 부정적 평가4.3.6. 복합적 평가
4.4. 기타

1. 개요

인텔 코어 Ultra 시리즈의 2세대 CPU 버전이다.

코어 i 시리즈 네이밍의 연장선으로 인텔 15세대라고도 불린다.

코어 Ultra 시리즈 최초로 데스크탑 제품군 CPU 모델 출시된다.[1]

2. 공통

코어 울트라 2세대는 대상 플랫폼에 따라 루나 레이크 애로우 레이크로 나뉜다. 공통적으로 이 두 제품군은 같은 CPU 아키텍처인 라이언 코브 스카이몬트 아키텍처가 들어가게 된다.

P-코어로 활용이 되는 라이언 코브 아키텍처는 명령어 디코더가 6-Wide 에서 8-Wide로 확장이 되며, 그 외에도 백엔드에 위치한 정수, 부동소숫점 등의 유닛이 확장이 되어 메테오 레이크에 탑재된 레드우드 코브에 비해 IPC +14%의 성능 향상폭을 가진다. 해당 아키텍처에 관한 자세한 설명은 다음 항목으로.

E-코어로 활용이 되는 스카이몬트 아키텍처는 명령어 디코더가 6-Wide에서 무려 9(3×3)-Wide로 확장되었으며[2] 비순차 처리 규모의 대폭 확장, 2배 가량의 백엔드 연산유닛 확장으로 인해 (기존 LP-E 코어와 비교 시) 정수 IPC +38%, 부동소숫점 IPC +68%라는 성능 향상을 이뤄냈다. 이는 13세대 인텔 CPU의 빅코어로 들어가던 랩터 코브와 비교시 정수, 부동소숫점 모두 +2% 향상된 수준의 IPC라고 한다. 해당 아키텍처에 관한 자세한 설명은 다음 항목으로.

하이퍼스레딩이 빠졌고, 스케줄러의 변경으로 E-코어 우선적인 작업 배분이 이뤄진다. 사실 SMT는 10% 이상의 면적을 잡아먹으며 각종 Hazard와 보안 문제를 일으키기 때문에 차라리 SMT를 빼고 여분의 공간에 추가적인 디코더, ROB와 캐시를 넣어서 높은 IPC를 구현하는 것이 현대의 CPU 설계 기조라서[3] 얼핏 보면 인텔이 최신 트렌드를 충실히 따라가는 것으로 보일지 모르나 이는 표면적인 현상일 뿐, 실제로는 기획 단계에서부터 의도하고 뺀 것이 아니라 개발 과정에서 문제가 생겨 뺀 것이라는 루머가 파다하다.

3. 모바일 저전력용: 루나 레이크

===# 출시 전 정보 #===
루나 레이크는 저전력 모바일용으로 설계된 제품군이다. 정격전력 8~17W[4]로, 메테오 레이크-U 라인업을 대체하는 것에 골자를 두고 있다.

3.1. 제품

파일:상세 내용 아이콘.svg   자세한 내용은 인텔 코브 마이크로아키텍처/사용 모델 문서
번 문단을
루나 레이크 부분을
참고하십시오.
파일:루나레이크_SKU.png

3.2. 성능 및 전성비 분석

루나 레이크의 CPU 성능 및 전성비는 어떤 벤치마크로 분석을 했는가? 어떤 웹진에서 측정했는가? 싱글코어인가 아니면 멀티코어인가? 실사용에서의 전력 효율은 어떠한가? 에 따라서 평가가 크게 갈리는 상황이다.

Arc V140 GPU의 성능 또한 벤치마크 기준인가 아니면 게임 기준인가? 게임 성능은 누가 측정했는가? 에 따라서 구도가 판이하게 나뉘어진다. 본 문단에는 신뢰할 수 있는 다양한 자료를 첨부했으며, 판단은 독자의 몫이다.

3.2.1. CPU

싱글코어 성능 및 전성비 [ 펼치기 · 접기 ]
||<width=50%> 파일:루나레이크_노트북체크_01.png || 파일:루나레이크_노트북체크_02.png ||
파일:루나레이크_노트북체크_03.png 파일:루나레이크_노트북체크_04.png
루나 레이크 CPU 성능 지표
Core Ultra 7 258V의 시네벤치 2024 싱글코어 점수는 120점으로, 102점인 Core Ultra 7 155H와 113.6점인 Ryzen AI 9 370 HX를 모두 앞지르는 결과를 보여준다. Geekbench 6에서는 Core Ultra 9 185H 대비 우위, HX 370대비 열위로 조금 다른 양상을 보인다.

시네벤치 2024 멀티코어는 절전 모드 406점, 표준 모드 497점, 최대 성능 모드에서 602점의 성능을 보여주며 529점인 Ultra 7 165U 보다는 앞서지만 882점, 912점의 점수를 내는 Ultra 7 155H와 8840HS에 비해서는 더 낮다. Geekbench 6에서 역시 메테오레이크-U 대비는 우위, 메테오 레이크-H나 AMD의 8코어 라인업과 비교해서는 열세이다.

파일:루나레이크_노트북체크_05.png 파일:루나레이크_노트북체크_06.png
시네벤치 2024 기준 루나 레이크 CPU 전력 대비 효율
시네벤치 2024 싱글코어 기준 루나 레이크 P코어의 라이언 코브는 x86-64 계열 내에서는 최고의 전성비를 발휘한다. 시네벤치의 특성상 부동소숫점 연산을 주로 사용하며, 본 데이터는 단일 코어 피크치 전력을 기준으로 전성비를 산출했기 때문에 퀄컴 ARM 기반 Oryon 에는 미치지 못한다. 아키텍처적인 발전과 TSMC N3B 공정이 효율 개선의 쌍두마차가 되었다.

파일:lioncove_spec_total.webp 파일:루나레이크_CPU_22.png 파일:루나레이크_CPU_23.png
파일:geekerwan_05_spec_ipc.png 파일:geekerwan_06_spec_ipc.png
SPEC 2017 기준 루나 레이크 CPU 성능 및 IPC
SPEC 2017 기준 라이언 코브의 IPC 칩스 앤 치즈의 첫 번째 자료에 따르면 전작 레드우드 코브 대비 정수 연산 IPC 및 성능[12] +23.2%, 부동 소숫점 +15.8% 상승했으며, 두 번째 자료에 따르면 정수 연산 IPC는 12%, 부동 소숫점 IPC는 16% 향상되었다. SPEC 수치는 OS 환경, 메모리 구성에 따라 측정치가 달라질 수 있으며, 칩스 앤 치즈 측에 따르면 GCC 컴파일러의 최적화 옵션을 어떻게 설정하는가에 따라서 성능이 달라진다고 밝혔다.

칩스 앤 치즈 측의 자료에 따르면 Zen 5와 비교시 IPC는 우세, 클럭을 감안한 총 성능은 동등하며, 두 번째의 자료에 다르면 Zen 5와 비교시 IPC는 동등, 클럭을 감안하면 소폭 열세이다. 특이사항이라면 E 코어인 스카이몬트 아키텍처의 정수 연산 IPC가 Zen 4와 거의 비슷하며, 부동 소숫점 연산 IPC는 이전 세대의 P코어인 레드우드 코브와 거의 비슷하다는 점이다.

Geekerwan 측의 측정 자료에 제시된 IPC의 향상폭은 이전의 데이터와 비교하면 다소 보수적이다. Geekerwan 측에 따르면 라이언 코브의 IPC 향상 폭은 정수 +15.3%, 부동소숫점은 +4.6%에 불과하다. 그리고 스카이몬트의 IPC는 인텔의 공식 자료에 제시되었던 것 처럼 급격한 상승이 보여지지 않으며, Zen 4 보다도 더 낮은 IPC를 보인다고 한다.

Geekerwan의 영상에 따르면 원인은 루나 레이크의 E 코어가 L3에 직접적으로 접근할 수 없는 LPE 코어나 다름없기 때문이라고 설명하고 있다. 루나 레이크의 E 코어인 스카이몬트는 4개의 코어가 합해져 하나의 클러스터를 이루는데, 이 쿼드 코어 클러스터가 공유하는 L2 캐시의 용량이 4MB이다. 따라서 메모리 액세스 지연시간을 측정하면 4MB 까지는 P 코어와 E 코어간의 액세스 시간 차이가 얼마 나지 않으나, 4MB를 넘어가게 되면 L3에 접근하지 못해 SLC 캐시에 접근해야 하는 스카이몬트의 지연 시간이 최소 3배 이상으로 벌어진다. 이로 인해 스카이몬트의 성능이 제한되었다고 한다.

파일:루나레이크_단일코어.png 파일:50ce4cef8ccf395163c898841a4e5f9d.jpg
파일:geekerwan_01_specint.png 파일:geekerwan_02_specint.png
파일:geekerwan_03_specint.png 파일:geekerwan_04_specfp.png
루나 레이크 CPU 단일 코어 전성비
3, 4번째 자료는 SoC을 통한 전력 측정이 기준이며 5, 6번째 자료는 리눅스 기반 마더보드 전력 측정이 기준이다.
SPEC 2017 기준 코어 전성비는 P코어와 E코어 모두 메테오레이크 대비 대폭 향상되었다. 첫 번째로 제시된 데이터에 따르면 Zen 5와 비교하더라도 라이언 코브가 소폭 높으며, 전성비 격차가 점점 벌어진다. Zen 5c와 스카이몬트의 격차도 매우 큰 수준으로, E-코어 간의 전력효율 격차로 인해 인텔이 초저부하 및 Idle 환경에서의 우위를 가져가는 그림이다.

두 번째로 제시된 데이터는 퀄컴 측이 발표한 단일 코어 전성비 곡선이다. 퀄컴 측의 발표에 따르면 Oryon이 가장 전성비가 좋고 그 뒤로 라이언 코브, Zen 5, Zen 4, 레드우드 코브 순서로 전성비가 좋다고 발표했다.

3, 4번째로 제시된 데이터는 Geekerwan이 측정한 전성비 곡선인데, Geekerwan 측에 따르면 SPEC 2017 기준 정수, 부동소숫점 모두 라이언 코브가 자신이 동작하는 모든 전력 범위 내에서 Zen 5에 비해 큰 폭의 우위를 점한다. 3, 4번째 자료는 SoC을 통한 전력 측정이 기준이기 때문에 리눅스 기반 마더보드 전력 측정으로 데이터를 얻어낸 5, 6번째 자료에 비해 정확하지만 Oryon과의 비교 자료는 결여되어 있다는 점을 참고하자.

5, 6번째의 데이터는 리눅스 상에서 측정된 데이터이다. 퀄컴 스냅드래곤 X Elite에 내장된 Oryon과의 비교를 위해 4, 5번째의 데이터를 참고해야 하는데, 윈도우 상에서는 0.62W의 유휴전력을 보이는 루나 레이크는 리눅스 커널 상에는 완전한 최적화가 이뤄지지 않아서 3W를 소모한다. 이를 감안하고 보더라도 정수 연산의 경우 퀄컴의 Oryon과 비교시 모든 전력 범위 내에서 우위를 점하며, 부동 소숫점에 한해 7W를 넘어가는 고전력에서는 Oryon에게 추월을 허용한다. 리눅스에서의 전력 관리 문제가 조정된다면, 부동 소숫점에서 라이언 코브와 Oryon이 교차하는 지점이 뒤로 더 밀릴 수도 있다.[13]

멀티코어 성능 및 전성비 [ 펼치기 · 접기 ]
|||| 파일:루나레이크_03_멀티코어전성비.png ||
파일:루나레이크_06_시네벤치23.png 파일:루나레이크_07_시네벤치2024.png
멀티코어에서는 낮은 코어 수[14]와 하이퍼스레딩 부재로 인해 라이젠 AI 300 시리즈 대비 전성비가 떨어진다. Notebookcheck의 벤치마크 결과에 따르면 라이젠 대비 전 구간에서 밀리고, 루나레이크의 주력 전력대인 30W 미만에서 전 세대의 상위 체급인 Ultra 7 155H보다는 앞선다. 출처에 따라 전성비가 상이한 상황인데, 같은 시네벤치 2024도 결과가 출처별로 달라 추가적인 검증이 필요하다.

파일:루나레이크_04_멀티코어전성비.png 파일:루나레이크_CPU_21.png
파일:루나레이크_전성비.png 파일:95b4719cfa0fc24a8c803ecd5d24f76f.jpg
시네벤치 R23 기준 루나 레이크 CPU 전력 대비 효율
한 중화권 유튜버의 자료에 따르면 시네벤치 R23에서는 10W 이하 구간에서는 258V의 전성비가 가장 앞서나, 10W 초과 구간에서는 라이젠에게, 18W 초과 구간에서는 185H에 역전을 허용한다. 허나 또 다른 자료에서는 155H가 258V를 역전하는 시점이 24W 근처로 결과가 상이하다. 마지막으로 퀄컴 측의 자료에 따르면 10W 아래에서도 Zen 5가 들어간 스트릭스 포인트에 비해 밀리며, 155H가 258V를 역전하는 시점은 30W 근처인 것으로 측정이 되고 있다.

출처별 편차가 있긴 하지만 이상의 결과를 종합할 경우, 루나레이크는 10W 미만 구간에서 타 제품 대비 전성비 우위를 보이며, 10W 초과 구간에서는 라이젠에게, 18 ~ 30W 구간 사이 어딘가에서는 메테오레이크-H에게 역전을 허용한다고 볼 수 있다. 물론 루나레이크가 28W가 아닌 15W급의 대체제라는 것을 감안하면 중전력 구간에서 메테오레이크-H 대비 열위를 보이는 것은 그다지 의미를 부여하긴 힘들다.

CPU 실사용 성능 및 전성비 [ 펼치기 · 접기 ]
|||||| 파일:루나레이크_05_PCMARK.jpg |||||| 파일:루나레이크_오피스.png ||
파일:루나레이크_08.png 파일:루나레이크_09.png
파일:루나레이크_10.png 파일:루나레이크_11.png 파일:루나레이크_12.png
PCMark 기준 루나 레이크 CPU 전력소모
좌측 이미지의 PCMark 테스트 상에는 x86-64 계열 CPU 중 가장 전력효율이 뛰어난 모습을 보인다. AMD의 스트릭스 포인트 HX370, 그리고 이전 세대의 H 라인업 CPU인 Ultra 7 155H가 각각 평균 14W, 16W를 소모할 때 루나 레이크는 8.782W만을 소모했다. 오피스 환경에서의 전력효율이 우수하다는 사실은 우측 자료로 교차검증이 가능한데, 메테오 레이크가 12.5W를 소모할 때 루나 레이크는 3.6W를 소모하며 비슷한 성능을 낸다.

그리고 그 외에도 동일한 30W로 전력제한을 걸어두고 Office, 어도비, 다빈치 리졸브와 같은 작업 프로그램을 구동할 때에 루나 레이크가 Apple M3 11W에 버금가는 성능을 보여주었다.

실사용 시의 전력 효율이 높아진 이유는 고성능, 저전력의 E코어 덕택이다. 루나 레이크는 별도의 LP-E코어가 존재하지 않고 P코어와 E코어가 붙은 CPU타일만 있어 표면상으로는 LP-E코어가 포기된 것처럼 보이지만, 인텔에 따르면 둘이 합쳐진 것에 가깝다고 한다. 하나의 다이에 실장되어 있지만 각각의 전력공급 계통(파워레일)을 가지고 있어 P코어에는 전력이 차단된 상태로 E코어만 구동이 가능한 구조를 가지고 있다고. 하지만 P코어와 E코어가 CPU 타일에 하나로 붙어있기 때문에 코어간 버스를 통한 통신 레이턴시 스트릭스 포인트처럼 그리 느리지는 않다.

3.2.2. GPU

3DMark 벤치마크 결과 [ 펼치기 · 접기 ]
||<width=50%> (3DMark Fire Strike(그래픽 스코어)) ||<width=50%> 파일:루나레이크_노트북체크_07.png ||
파일:루나레이크_GPU_톰스하드웨어_01.webp 파일:루나레이크_GPU1.webp
루나 레이크 GPU API별 벤치마크 성능
3DMark Time Spy 기준 종합점수 4300점대, 그래픽 점수 4118점이라는 점수를 보여주며 GTX 1060에 준하는 수준으로 성능이 향상되었다. 동급의 x86 노트북용 내장그래픽 중 가장 높은 성능이다.

게임 성능 측정 결과 [ 펼치기 · 접기 ]
||<width=50%> 파일:루나레이크_GPU2.webp ||<width=50%> 파일:루나레이크_GPU3.webp ||
루나 레이크 GPU 실제 게임 성능
실사용환경에서는 각 게임과 자료출처에 따라 성능 우열 관계가 판이하게 다르다. 위의 자료에서는 루나 레이크의 Arc 140V가 스트릭스 포인트의 890M을 앞지르는 결과를 보여준다. Adreno X1과 비교시 2배의 격차를 벌린다.

파일:루나레이크_GPU_톰스하드웨어_02.webp 파일:루나레이크_GPU_톰스하드웨어_05.webp
파일:루나레이크_GPU_톰스하드웨어_08.webp 파일:루나레이크_GPU_톰스하드웨어_10.webp
네이티브 해상도 측정 결과.
FSR 및 FG 적용 결과는 출처 링크 참고
톰스 하드웨어의 측정 결과는 윗 문단의 측정 결과와 비교하면 상대적으로 비관적이다. Black Myth: Wukong 720p 기준 Arc 140V는 메테오 레이크-H 의 Arc 8코어보다 11% 앞서지만, 라이젠의 890M에 비해서는 10% 뒤쳐진다. FSR3 + FG 적용시에는 Arc 140V가 오히려 가장 낮은 성능을 보이는데, 아직 Frame Generation 사용에 있어서 문제가 있는 것으로 보인다.

Cyberpunk 2077도 마찬가지로 Arc 140V는 메테오레이크-H 대비 32% 우위를 점하지만, 890M과 비교시에는 18% 쳐진다. FSR3/ XeSS를 켜면 Arc 140V가 890M을 거의 따라 잡지만, FSR3 프레임 생성 기능을 키면 140V가 가장 저열한 것을 또다시 확인 가능하다.

Shadow of the Tomb Raider 720p에서 Arc 140V는 메테오레이크-H 대비 25%, 890M 대비 6% 우위를 점한다. 1080p에서도 메테오레이크-H 대비 21%, 890M대비 13% 앞선다. XeSS 품질 모드가 활성화된 상태에서는 25% 성능 우위를 점한다.

톰스하드웨어의 게임 벤치마크를 요약하면, 네이티브로 게임을 했을 때의 성능 기준에는 Arc 140V가 HX370의 890M에 비해 소폭 뒤쳐지고, FSR3나 XeSS를 켜면 Arc 140V이 890M과 거의 동일하지만, 프레임 생성 기능에서는 프레임 생성으로 인한 이점을 하나도 보지 못하는 상황이 보여진다는 것으로 요약할 수 있다.

파일:258vgpu01.png 파일:258vgpu02.png
파일:258vgpu03.png 파일:258vgpu04.png
네이티브 해상도 측정 결과.
27종 평균 성능, 각 게임의 성능은 출처 링크 참고
그러나 톰스하드웨어의 후속 벤치마크에 따르면 네이티브 해상도(720p, 1080p)에서 이전의 벤치마크보다 훨씬 많은 27종의 게임을 바탕으로 테스트한 결과 720p에서는 루나 레이크의 Arc 140V가 7% 앞서며, 1080p 해상도에서도 5% 앞서는 결과를 보여주었다.

해당 벤치마크는 AMD Radeon 890M, Arc 140V와 메테오 레이크의 Arc 1세대 8-Core GPU를 테스트한 결과이며 28W의 전력 제한이 걸린 결과이다. 전력 제한으로 인하여 AMD Radeon 890M 측의 클럭이 2032 MHz로 제한이 걸려 있다는 점을 감안해야 하지만, 적어도 30W대의 동일 전력에서는 890M보다 140V가 더 좋은 성능을 보여준다는게 확실해졌다. 물론 192 GB/s의 전용 메모리 대역폭을 가지고 더 많은 전력을 소모하는 RTX 3050Ti가 40~60% 더 앞서는 성능을 보여주지만, 인텔의 내장그래픽도 충분히 본궤도에 올랐다는 것을 의미한다.

파일:258vgpu05.png 파일:258vgpu06.png
AMD에서 공식적으로 발표한 벤치마크도 오히려 Arc 140V가 본궤도에 올랐음을 간접적으로 증명한다. FSR 및 프레임 생성을 통한 보간 기술을 활용하면 AMD Radeon 890M이 게임 성능 면에서 75% 우위를 가진다고 홍보하고 있지만, 네이티브 해상도 측정 결과를 보면 오히려 열세일 것이라고 예측되었던 Arc 140V가 AMD Radeon 890M와 백중세를 보이고 있다. 다만 앞선 벤치마크처럼 프레임 생성 기능에서는 프레임 생성으로 인한 이점을 하나도 보지 못하는 상황이 보여진다는 점은 보완이 필요할 것이다.

파일:루나레이크_게이밍_11.png 파일:루나레이크_게이밍_12.png
파일:루나레이크_게이밍_13.png 파일:루나레이크_게이밍_14.png
파일:루나레이크_게이밍_15.png 파일:루나레이크_게이밍_16.png 파일:루나레이크_게이밍_17.png
한편 또다른 게임 테스트에서는 Arc 140V가 30W 기준 Ryzen 9 AI 365의 880M에 비해 앞선다. 물론 880M은 30W를 넘어서는 전력을 인가받으면 성능이 계속 오르기 때문에 가용한 TDP를 모두 사용한다면 성능 우열은 다시 880M 측으로 역전될 것이다. 메테오레이크의 내장그래픽보다는 확실히 더 낫고, 스냅드래곤 X Elite의 Adreno X1과 비교시 X1보다 소모전력은 25%(10W) 나 더 낮으면서도 도타 2를 제외한 다른 게임에서는 2배 더 나은 성능을 보인다.[15]

파일:루나레이크_게이밍_18.png 파일:루나레이크_노트북체크_08.png
파일:루나레이크_게이밍_19.png 파일:루나레이크_게이밍_20.png
그 외에도 Notebookcheck 측정 자료와 같이 Arc 140V가 8종 게임 종합성능, 게임 전력효율 면에서 큰 향상을 이뤄내 890M을 앞지른다는 벤치마크도 존재하며, 반대로 3, 4번째 자료처럼 루나 레이크의 Arc 140V가 HX370은 물론이고 이전 세대인 메테오 레이크-H 보다도 게임 성능이 뒤쳐진다고 평가하는 벤치마크 결과 또한 상존한다.

파일:jarrod_gaming.png 파일:geekerwan_10_gpu_15w_load.png 파일:geekerwan_09_gpu_15w_load.png
파일:geekerwan_08_gpu_30w_load.png 파일:geekerwan_07_gpu_full_load.png
Jarrod, Geekerwan의 15W, 30W, 전력제한 해제 순
Jarrod's Tech의 측정 결과에 따르면 HX370 내의 Radeon 890M이 루나 레이크의 Arc 140V에 비해 게임 성능 측면에서 11.14%의 우위를 가진다. Core Ultra 7 258V보다 GPU의 클럭이 약 5% 높은 Core Ultra 9 288V를 들고 온다고 가정하더라도 열세 구도는 변하지 않는다.

그리고 Geekerwan의 자료에 따르면 15W, 30W로 전력 제한이 걸리는 상황에는 Arc 140V가 메테오 레이크 Core Ultra 9 185H, AI 9 HX370에 비해 큰 폭의 우위를 가져가지만, 전력 제한이 아예 해제하여 Core Ultra 9 185H의 GPU가 90W, AI 9 HX370의 GPU가 80W까지 인가하는 상황에는 기하평균 기준으로 루나 레이크가 55.3fps의 성능을 낼 때, 54.3fps의 성능을 내는 메테오 레이크한테 거의 따라잡히며, 61.1fps의 성능을 내는 스트릭스 포인트에는 추월을 허용한다.

GPU 전성비 측정 결과 [ 펼치기 · 접기 ]
|| 파일:루나레이크_타임스파이_01.png || 파일:루나레이크_GPU_Power.png ||
파일:루나레이크_타임스파이_02.png 파일:루나레이크_타임스파이_03.png
루나 레이크 GPU 전력 대비 효율 그래프
전성비 관점에서 루나 레이크의 GPU인 Arc 140V는 비슷한 제품군에 속하는 다른 모든 iGPU를 앞지른다. 첫 번째 사진과 세 번째 사진은 각각 다른 출처에서 측정이 된 3DMark Time Spy 전성비 그래프이며, 네 번째 사진은 표기는 Time Spy라고 적혀있지만 이는 오타이며, 사이버펑크 2077 게임을 구동 했을 때의 GPU 전성비 그래프이다.

루나레이크의 내장그래픽은 TSMC N3B의 수혜를 받아 거대한 전성비 향상폭을 달성했으며, 17W급으로 기존 28W급의 성능을 능가한다는 개발목표를 충실히 달성했다.[16] 전력 대비 효율 그래프를 참고하면 3DMark와 같은 벤치마크 상에서는 무조건 HX370의 890M을 앞지르며, 게임 구동시에도 20W 극후반대 이하에서는 HX370의 890M를 소폭 상회하며 엎치락뒤치락 하는 성능을 보인다. 스냅드래곤을 상대로는 더블 스코어로 격차를 벌리며 2배 이상의 전성비 우위를 점한다.

가장 인상적인 점은 바로 드라이버로, 드라이버의 한계로 인해 벤치마크상에서 나타나던 성능 포텐을 실사용환경에 이끌어내지 못하는 문제에 큰 진전을 보였다는 것이다. 벤치점수와 실성능간의 괴리는 HD 내장그래픽 시절부터 인텔 GPU들을 고질적으로 괴롭히던 문제였는데, 루나레이크의 성능 지표는 인텔이 소위 말하는 '드라이버 리스크'를 극복해내기 시작했다는 신호로 볼 수 있다.

결과적으로 루나 레이크의 내장그래픽은 대성공이라고 볼 수 있으며, 향후 행보에 따라 인텔 GPU에 대한 이미지가 바뀌는 신호탄이 될 수도 있다.

3.2.3. 전력 소모 및 배터리 효율

기존 U, H 라인업과의 비교 [ 펼치기 · 접기 ]
||||||<width=50%> 파일:루나레이크_CPU_Power2.png ||||||<width=50%> 파일:루나레이크_CPU_Power.png ||
파일:루나레이크_CPU_Power5.png 파일:루나레이크_CPU_Power6.png 파일:루나레이크_CPU_Power3.png
U 라인업 CPU 전력 소모 지표
루나 레이크는 SKU 상으로 메테오 레이크-U 라인업을 계승한다. 이는 표기 상의 TDP와 전력 소모 지표를 보면 알 수 있다. 표기 상의 TDP를 보면 루나 레이크는 9 라인업을 제외하면 17W의 TDP를 가지는데 U 라인업의 TDP가 15W, H 라인업의 TDP가 28W라는 사실과, 2W 추가된 TDP가 같은 인터포저 상에 올라가 하나의 패키징으로 묶인 LPDDR DRAM 두 개를 포함한다는 사실을 감안하면 루나 레이크가 실질적으로 메테오 레이크-U를 계승했음을 알 수 있다. 그 이상의 라인업은 아랫 문단에 서술될 애로우 레이크가 담당할 것이다.

실제 노트북에 적용된 루나 레이크의 CPU 전력 제한은 최대 40W, 평균 30W에 걸려있다. 스펙시트 상으로 루나 레이크의 최대 전력 소모 한계인 PL2가 37W임을 감안하면, 스펙 시트 상의 전력 제한 한도를 따라가는 셈이다. 자료에 따라 상이하지만 독일 사이트인 Computerbase에 따르면 루나 레이크의 CPU 전력은 평균 30W, Notebookcheck에 따르면 53W를 소모한다. 전작인 메테오 레이크-U 라인업의 PL2가 57W로 걸려있고, 7840U도 비슷한 전력을 소모하는 것을 보면 루나 레이크의 CPU 전력 소모는 U 라인업에 훨씬 가까움을 알 수 있다.
파일:루나레이크_CPU_Power7.png 파일:루나레이크_CPU_Power4.png
H 라인업 CPU 전력 소모 지표
한편 인텔 및 AMD의 H 라인업이 소비하는 CPU 전력은 그 이상이다. 특히 인텔 메테오 레이크-H는 PL1이 최대 64W, PL2가 115W에 달하기 때문에 노트북 기종에 따라 다르지만, 쿨링 솔루션 및 자체적으로 걸어놓은 전력 제한 수치에 따라서 60W 근처 혹은 110W 근처에 수렴하는 경향성을 보이고 있다.
파일:루나레이크_타임스파이_02.png 파일:루나레이크_GPU_Power.png 파일:루나레이크_GPU_Power5.png
파일:루나레이크_GPU_Power2.png 파일:루나레이크_GPU_Power3.png 파일:루나레이크_GPU_Power4.png
루나 레이크 GPU 전력 소모 지표(상단)
U 라인업 및 H 라인업 GPU 전력 소모 지표(하단)
GPU에서도 마찬가지의 경향성이 보여진다. 루나 레이크의 Arc 140V는 30W에 제한이 걸려있으며, 실질적으로 그 이상의 전력을 인가한다고 성능이 증가하지도 않는다. 이는 U 라인업의 GPU 전력 소모와 일치한다. U 라인업의 GPU로 활용되었던 인텔 Arc 1세대 4코어 GPU는 루나 레이크의 Arc 140V와 마찬가지로 30W를 소모한다. 반면 H 라인업의 GPU로 활용되었던 인텔 Arc 1세대 8코어 GPU, Radeon 780M은 50W 혹은 그 이상을 소모했다. 이를 토대로 루나 레이크가 실질적으로 U 라인업 SKU에 속한다는 것을 알 수 있다.

배터리 사용시간 지표 [ 펼치기 · 접기 ]
||<width=50%> 파일:루나레이크_배터리01.png ||<width=50%> 파일:루나레이크_배터리02.png ||
파일:루나레이크_배터리03.png 파일:루나레이크_배터리04.png
파일:루나레이크_노트북체크_09.png 파일:루나레이크_노트북체크_10.png
루나 레이크 배터리 효율 지표
상대적으로 떨어지는 멀티코어 전성비로 인해 고부하 환경에서는 배터리타임이 별로이지만 실사용환경에서 더 자주 있는 저부하 ~ 극저부하 구간에서는 퀄컴 스냅드래곤 X Elite와 맞먹는 수준의 배터리타임을 보인다. 다만 맥북에어 13인치의 배터리가 53Wh이기 때문에 Apple M3에는 미치지 못한다. 한편 Notebookcheck의 측정 자료를 보면 Wi-Fi 환경에서의 웹 서핑 배터리 테스트 결과에서는 AMD의 HX370보다도 밀리는 면이 존재한다.

결과적으로 기존 인텔 노트북들에 비하면 배터리타임에서 장족을 이루었으며, 실사용환경에서는 퀄컴의 스냅드래곤과 비등한 수준의 배터리타임을 확보하는데 성공했다. 따라서 윈도우 환경에서 굳이 x86을 포기하고 ARM으로 넘어갈 필요가 없다는 사실을 보여주었다. 비슷한 배터리 사용시간이라면 가격은 비슷하면서 호환성은 떨어지는 퀄컴 스냅드래곤을 쓸 동기가 없기 때문이다.

3.3. 평가

3.3.1. 긍정적 평가

벤치마크에 따라 성능 우열 관계가 판이하게 나뉘긴 하지만 큰 틀에서 루나 레이크에 대해 요약해보면 대체로 긍정적이다.
파일:258vgpu01.png 파일:258vgpu02.png
네이티브 해상도 측정 결과.
27종 평균 성능, 28W 전력 제한
파일:258vgpu05.png 파일:258vgpu06.png
AMD 측의 게임 성능 측정 결과.
업스케일링 및 보간 기술 적용
내장그래픽 역시 전성비와 드라이버가 대폭 개선되었다. 자료에 따라 우열 관계가 다르지만 이상의 자료를 최대한으로 취합해 보면 루나 레이크의 Arc 140V는 전작인 메테오 레이크에 비하면 거의 항상 우세인 구도를 차지한다.
게임 성능을 기준으로 구체적인 비교를 한 결과를 취합하면 다음과 같다. 루나 레이크의 Arc 140V는 30W로 제한이 걸려 있는데, 메테오 레이크의 Arc 1세대 GPU가 루나 레이크의 Arc 140V와 유사한 게임 성능을 내기 위해서는 90W까지 전력 제한을 해제해야 한다.[18] 그리고 퀄컴의 스냅드래곤 X 시리즈와 비교하면 모든 전력 구간에서 최대 2배 가량의 격차를 벌리며 압도적인 우위를 점한다.[19] 마지막으로 루나 레이크의 Arc 140V와 HX370의 Radeon 890M을 비교하면 두 GPU 모두 30W, 혹은 그 이하로 동일한 전력 제한을 걸어둔 상황에는 140V의 우위[20], Arc 140V에 30W를 인가한 채로 890M에 80W의 전력을 인가하면 Arc 측이 10% 가량 뒤쳐지는 열세 구도를 보인다고 정리할 수 있다.
따라서 그래픽 감속기로 대변되는 인텔 GPU의 기존 이미지에 대한 종말을 고했다. 다만 AMD측의 발표치에서 볼 수 있듯이 업스케일링과 프레임 생성을 통한 보간 기술을 쓰려면 890M측이 아직 우위를 점하고 있다. FSR3 + FG 환경에서의 나쁜 특성과 1% Low로 측정이 되는 스터터링 지표, 그리고 AAA급 게임이 아닌 마이너한 분야의 게임에서 최적화가 훨씬 나빠진다는 점은 앞으로 개선해야 할 과제이다.

3.3.2. 부정적 평가

다만 기술적인 관점에서 보자면 좋게만은 보기 어렵다.

3.3.3. 복합적 평가

4. 데스크탑 및 모바일 중·고전력용: 애로우 레이크

===# 출시 전 정보 #===
정격 전력 최대 125W로, 메테오 레이크-H, 랩터레이크-HX, 랩터레이크-S를 대체하는 것에 골자를 두고 있다.
파일:gamma0.png 파일:15thgen2.png
인텔 코어 200 라인업 정리
파일:화면 캡처 2024-10-29 023640.png 파일:73362a92d5289ff9124363cf52cd07ea.png
애로우 레이크-S용 GPU / 애로우 레이크-H용 GPU
파일:npu3.jpg 파일:a438babcf3a406ca8f5069b924340fca.png

4.1. 제품

파일:상세 내용 아이콘.svg   자세한 내용은 인텔 코브 마이크로아키텍처/사용 모델 문서
번 문단을
애로우 레이크 부분을
참고하십시오.

4.2. 상세

4.2.1. 작업 및 AI

애로우 레이크-S CPU 벤치 성능 [ 펼치기 · 접기 ]
* 퀘이사존 벤치마크
파일:톰즈_5.png 파일:톰즈_6.png
파일:톰즈_3.png 파일:톰즈_4.png
Cinebench, Geekbench 기준 애로우 레이크-S CPU 성능
IPC의 큰 상승이 있을 것이라는 예측도 있었으나, 인텔 발표에서도 IPC 상승은 9%에 불과한데다가 클럭이 내려갔기 때문에 시네벤치 싱글 점수에서는 인텔 14세대 대비 +4~7%의 향상폭을 보이며 드라마틱한 상승은 보이지 않았다. 오히려 하이퍼 스레딩을 빼서 약할 것이라던 멀티 성능에서 10~13% 상승이 있었는데, 이는 하이퍼 스레딩으로 얻을 수 있는 성능이 그리 큰 편은 아닌데다가, E-코어로 탑재된 스카이몬트 아키텍쳐가 루나 레이크와는 다르게 L3 캐시가 탑재된 덕분에 DRAM까지 접근해야 하는 Cache Miss 발생확률이 감소하여 IPC가 예상보다 크게 향상되었기 때문이다.
파일:英特尔酷睿Ultra 200S评测:无药可救!_20241118_040921.691.jpg
E-코어로 탑재된 스카이몬트 아키텍쳐의 성능은 인상적이다. 물론 인텔의 발표치처럼 정수 IPC +32%, 부동 소숫점 IPC +72%를 달성하지는 못했으나, L3 캐시가 탑재된 스카이몬트의 IPC는 정수 기준으로 +21.6%, 부동 소숫점 기준으로는 +42.1%의 향상을 보이며 인텔이 목표로 제시했던 인텔 14세대의 P-코어인 랩터 코브에 필적하는 IPC를 가졌다는 사실을 증명하였다.

애로우 레이크-S CPU 작업 성능 [ 펼치기 · 접기 ]
* 탐스하드웨어 작업 벤치
파일:톰즈_1.png 파일:톰즈_2.png
파일:테크파워업_1.png 파일:테크파워업_2.png
작업 기준 애로우 레이크-S CPU 성능
그러나 Cinebench, Geekbench 기준으로 늘어난 멀티코어 성능이 무색하게도 여러 요인들로 인하여 몇몇 작업에서의 성능의 발목을 잡고 있다는 점이 아쉬운 부분이다. 여러 가지의 제약이 걸리기 때문에 작업 성능이 뛰어난 부분도 그 영역이 좁다. #

첫 번째 제약은 L3 캐시 내에서 주고받는 데이터의 레이턴시가 늘어났다는 점이다. # David Huang의 주장에 따르면 Cinebench와 Geekbench는 대부분 L2 캐시 내에서 실행되지만, SPEC으로 측정할 수 있는 성능은 전반적으로 캐시와 메모리에 훨씬 더 민감하기 때문에 치명적이라고 한다. 실제로 루나 레이크와 랩터 레이크의 L3 캐쉬 간 데이터 주고 받는 레이턴시는 약 55 사이클인 반면, 애로우 레이크(265K)는 약 73 사이클, 메테오 레이크(155H)는 80 사이클이라고 한다. 이는 성능에 큰 걸림돌이 된다. 이전 세대에 비해 링 클럭이 후퇴한 것이 L3 캐시 레이턴시 사이클 증가의 원인이라고 한다. 코어 클럭과 링 클럭 사이의 차이가 이전 세대보다 훨씬 더 크게 벌어졌으며, 이 문제점은 비교적 일반적인 코어 배치 레이아웃을 가지는 메테오 레이크 또한 공유하고 있다고 한다. 이 약점은 추후에 바이오스나 마이크로코드 수정으로도 개선할 수 없는 하드웨어적인 약점이라는 성격이 있다. 이러한 제약으로 인하여 Task 방식으로, 코어 하나가 자기 일만 하고, 메모리도 자기것만 쓰고 끝마친 다음, 다른 Task가 생기는 형태여야 제 성능을 발휘할 수 있다.

두 번째 제약은 AVX512의 부재라는 점이다. 연산이 많더라도 AVX2, FMA3(256bit 레지스터) 수준의 연산이어야 하고, 512비트 레지스터까지 풀로 쓰는 작업이면 Zen 5 계열보다 앞서기는 쉽지 않다.
파일:英特尔酷睿Ultra 200S评测:无药可救!_20241118_041304.907.jpg
세 번째 제약은 메모리 읽기 쓰기가 너무 많이 이뤄지면 안된다는 점이다. 이는 게임 성능 측면에서도 공통적으로 공유하는 단점이다. 메모리 컨트롤러를 별도의 SoC 타일로 옮겼는데 이로 인하여 CPU가 DRAM에 데이터를 받아오기 위해서는 물리적으로 SoC 타일을 무조건 경유해야 한다. 따라서 랩터 레이크와 비교하여 DRAM으로 접근하는 레이턴시가 크게 늘어났다고 한다. Geekerwan 측의 영상에 따르면 칩렛 구조 자체가 상대적으로 별로여서 CPU 클럭을 오버클럭 하거나 램 클럭을 오버클럭하고 램 타이밍을 조절하는 것보다는 캐시 버스의 클럭을 높이고 타일 모듈간의 통신을 담당하는 NGU와 D2D 클럭을 오버클럭 하는 것이 더 큰 효과를 본다고 한다. 그러나 그렇게 클럭을 높여도 인텔 14세대보다 레이턴시가 늘어지며 이 문제를 완전히 극복하기는 쉽지 않다.

이로 인하여 코어 자체의 성능과는 별개로 언코어 부분에서 걸리는 여러 제약들로 인해 테크파워업의 작업성능 그래프에 나타난 것처럼 작업에 따라 애로우 레이크-S의 성능 편차가 심하게 나뉜다. 특히 멀티코어를 활용하면서 L3 캐시를 통해 코어간의 데이터를 주고받거나 혹은 DRAM까지 데이터를 찾아 불러와야 할 때 불리해진다. 구체적으로는 영상 인코딩과 시네벤치로 대표되는 렌더링 관련이나 퀵싱크를 활용한 작업은 높은 성능을 내지만, 그 외에는 동률이거나 낮은 성능을 내는 추세를 보이고 있다. 가장 의외로 받아 들여지는 점은 인텔의 텃밭이던 어도비 포토샵에서조차 라이젠 9000 시리즈에 크게 밀리는 결과를 보여준 점이다.

인텔은 모바일 라인업에서 메테오 레이크에서 같은 문제를 범하고 나서 그 문제를 인지하고 루나 레이크에서는 수정했지만, 데스크탑 라인업에서는 루나 레이크보다 나중에 나온 애로우 레이크에서 그 점을 수정하지 않고 강행해서 출시했다. 이는 원래의 로드맵을 보면 알 수 있는데, 원래는 애로우 레이크-S보다 루나 레이크가 더 나중의 세대였으며, 인텔 18A 공정을 통해 생산될 인텔 16세대로 분류되어 있었다. 따라서 루나레이크는 더 새로운 버전의 라이언 코브 코어를 탑재하고 있으며, SoC의 많은 IP 블록도 업데이트 되었다고 한다.

4.2.2. 게임

애로우 레이크-S 외장 그래픽 성능 [ 펼치기 · 접기 ]
* 퀘이사존 벤치마크
외장 그래픽을 사용한 게이밍 측면에서는 전작을 한참 상회하던 경쟁사의 게임 특화 모델 X3D시리즈의 전세대 라인업인 7800X3D에게 285K는 아예 논외가 되어 비교 대상에서부터 제외되고 있으며, 이젠 2세대 전의 라인업인 5800X3D에도 열위를 보이는 부분이 있다는 점[26][27]에서 게이밍 분야에선 추락할 대로 끝까지 추락했다.
파일:화면 캡처 2024-10-30 034025.png 파일:화면 캡처 2024-10-30 034046.png
CPU / GPU 병목 테스트
Notebookcheck 측의 리뷰는 훨씬 극단적이다. 물론 이쪽은 더 극단적인 조건을 걸고 진행된 벤치마크이다. 전자는 CPU 병목 상태에서의 성능을 알아보기 위해 720p 최하옵으로 구동한 결과이고, 후자는 GPU를 한계까지 활용하기 위해 2160p 해상도에 최고 옵션을 걸어놓고 게임을 구동한 결과이다. 물론 극단적인 환경을 가정했다고 하지만 전자에서 Core Ultra 5 245K에 비해 Core i5-14600K는 20% 앞서며, 7800X3D는 아예 50%의 게임 성능 격차를 벌린다. 가성비 픽, 전성비 픽이 되었어야 할 Ultra 5가 실제로는 3세대 이전 i7-12700 non-K와 비교가 되는 셈이다. 후자의 환경에서는 CPU 성능 격차로 인한 차이점이 다소 희석되었으나, 그럼에도 불구하고 최대 12%의 성능 격차가 관측된다.

급감한 게임 성능 또한 코어 간 레이턴시 증가가 원인으로 지목이 되고 있다. P코어나 E코어를 비활성화 시키고 사용하는게 더 나을 수준이라는 벤치마크 결과로 인해 P코어 - E코어 - P 코어 - E코어 순으로 배치된 CPU 코어 타일 배치가 그 원인이라는 가설 또한 제시되었다. 이는 열을 많이 뿜어내는 P코어 주변에 열을 덜 뿜는 E코어라는 열 배출이 쉬운 공간을 둘수 있어서 발열 관리가 좋아진다는 설계 의도로 보인다. 실제로 애로우 레이크는 온도 관련으로는 역대급이라는 긍정적인 평가를 받고 있다. 그러나, 이런 설계로 인해 코어들 끼리 링버스로 데이터를 주고 받는데, 이 P코어 E코어 배치에 띄엄띄엄 걸려버리는 바람에 큰 지장이 생기고, 이는 곧 레이턴시 증가를 초래했다는 주장이다. # 그 레이턴시 증가가 게임 프레임 같은데서 상당한 문제를 일으킨 것이다.

이 부분에 대해 증명하기 위해 아예 코어들을 비활성화 해서 P코어끼리, 또는 E코어만 활성화 해서 사용하거나, 아니면 최대한 P-E 코어를 번갈아서 데이터가 이동하는 경계를 최소화 하는 방향으로 지그재그로 비활성화 한다는 여러 시나리오로 테스트를 시행한 영상이 공개되었다. # 그 결과는 다음과 같다.

일단 첫 번째로, P코어 E코어 상관없이 게임에서 활용하는 스레드는 최대한 확보해야 성능이 제대로 발휘된다. 영상 내의 사이버 펑크 2077의 경우는 14 스레드까지 활용하는 것으로 추정되며, 12코어 이하가 활성화 되면 상당한 성능 하락이 관측된다.

두 번째로, P코어와 E코어의 경계를 통과하는 횟수를 최대한 줄여야 성능이 그나마 개선된다.

마지막으로, 상부 기점에서 물리적으로 최대한 가까운 코어들을 켜야 한다는 점이다. 중간에 E코어가 있든 없든 SoC 타일로부터 멀리 있는 코어를 끄는 것이 약간이라도 성능 개선에 도움이 된다.

이런 방식으로 대조 실험을 한 결과 최적의 조합을 맞추어 보니 최대 6%에 가까운 프레임 개선이 있었다는 결론이었다. 물론 이 정도의 개선 가지고는 전세대나 경쟁사에 비해서 어림도 없는 수준이다. 게다가 각자가 하는 게임마다 스레드 활용 갯수를 다 미리 파악해서 일일이 바이오스에서 최적의 코어 파킹을 해주고, 게임을 종료하면 리부팅해서 다시 되돌리는 작업을 해야 하는 등등 매우 번거로운 일들이 수반되기 때문에, 일반 게임 유저들에게 선뜻 권할 만한 방식도 아니다.

한편으로는 비교적 일반적인 코어 배치 레이아웃을 가지는 메테오 레이크 또한 이 문제를 공유하고 있기 때문에 L3 레이턴시 증가의 원인은 코어 배치 레이아웃이 아니라는 David Huang의 주장 또한 공존하는 상태이다. Geekerwan 측의 영상에 따르면 그냥 복합적으로 총체적인 난국이라고 한다. 어느 쪽이 맞든 이 약점은 추후에 바이오스나 마이크로코드 수정으로도 개선할 수 없는 물리적인 약점이라는 성격이 있다.

애로우 레이크-S 내장 그래픽 성능 [ 펼치기 · 접기 ]
* 내장 그래픽 벤치마크
파일:화면 캡처 2024-10-29 023640.png 파일:73362a92d5289ff9124363cf52cd07ea.png
애로우 레이크-S용 GPU / 애로우 레이크-H용 GPU
한편 내장 그래픽 측면에서는 발전이 있었다고 한다. Techpowerup의 내장 그래픽 벤치마크에 따르면 이전 세대인 인텔 14세대와 RDNA2 2CU 구성인 라이젠 9000 시리즈와 비교했을 때 약 2배의 성능 격차를 보이며, 경우에 따라서는 RDNA 3 4CU으로 구성되어 8500G에 탑재된 AMD Radeon™ 740M을 넘기는 성능을 보여주기도 했다.

이는 전 세대인 메테오레이크-U의 GPU 타일을 공정만 N5에서 N5P로 바꾼 채로 재활용한 덕분이다. 보통 같은 세대의 CPU라면 데스크탑용 내장 그래픽은 타임 스파이 최대 900점 수준의 화면 표시기를 넣어주지만 노트북용에 들어가는 내장 그래픽의 구성은 더 크게 챙겨주기 때문이다. 이 때문에 내장 그래픽 설계를 그대로 우렸음에도 불구하고 전작인 인텔 14세대나 RDNA 2 정도나 넣는 라이젠 9000 시리즈의 내장 그래픽에 비해 2배 이상의 우위를 가지는 것이다.

요약하자면 DX12 게임 성능을 기준으로 Radeon 780M, 메테오 레이크-H 및 애로우 레이크-H에 탑재되는 Arc 1세대 8코어 GPU는 GTX 1050Ti ~ GTX 1650 사이의 성능을 내며, Time Spy 기준으로는 약 3천점대의 점수를 낸다. 게임 성능을 기준으로 삼으면 Arc 1세대 8코어 GPU 측이 소폭 열세이다.

8500G에 탑재되는 Radeon 740M과 메테오 레이크-U 및 애로우 레이크-S에 탑재되는 Arc 1세대 4코어 GPU는 780M의 60% 정도의 수준의 게임 성능을 내며 Time Spy 기준으로는 2천점을 넘길듯 말듯한 점수를 낸다. 게임을 기준으로 삼았을 때는 대략 GTX 1630보다 한 티어 낮은 성능을 낸다고 보면 된다.[28]

마지막으로 데스크탑용 인텔 14세대에 내장되었던 UHD Graphics 770과 그 경쟁자인 RDNA2 2CU GPU는 Radeon 740M이나 Arc 4코어 GPU 대비 절반 이하의 성능을 낸다. Time Spy 기준으로는 900점 가량의 점수를 낸다.

4.2.3. 오버클럭 마진, 온도 및 전력

애로우 레이크-S 전력 [ 펼치기 · 접기 ]
* 퀘이사존 벤치마크
애로우 레이크-S의 전성비는 이전 세대인 인텔 14세대에 비하면 크게 늘어났다. 그러나 인텔 14세대는 6GHz를 넘기는 차력쇼를 하며 전성비가 극히 악화된 제품이기 때문에 경쟁사의 제품들과 비교해야 전성비가 어느 정도 레벨인지 가늠해 볼 수 있다.

문제는 AMD의 ZEN 5와 비교했을 때는 아직 떨어지는 편이라는 점이다. 테크파워업 전성비 그래프 링크 탐스하드웨어 전성비 그래프 링크 ZEN 4의 Non-X나 X3D 라인업보다도 떨어지는데 ZEN 5도 이쪽에는 한참 못미치므로 논외.[29] 국내에서도 신성조가 방송으로 그 점을 피력했다. 영상 링크 스샷 링크
파일:bd4049cc51972bad5d3229ce8fba125d.png
David Huang의 측정 결과에 따르면 #, 애로우 레이크-S의 최후의 보루라고 여겨져 왔던 단일코어 전성비 곡선마저 Zen 5는 물론이고 Zen 4보다도 저열한 전력 효율을 보인다. 측정 결과는 SPECint 2017 버전으로 진행되었으며, 코어 + 캐시 + 링 전력을 측정한 결과이다. 다른 출처에 따르면, 루나 레이크의 라이언 코브는 실질적으로는 LNC+에 해당이 되며 세부 사항은 불명이나 애로우 레이크의 LNC와는 다른 링 구조를 가지고 있다고 한다. # 이 말이 사실이라면 애로우 레이크의 단일코어 전성비가 부진한 원인은 LNC+ 보다 저열한 LNC의 언코어 설계라고도 볼 수 있다. 윗 문단에 언급된 원래는 애로우 레이크-S보다 루나 레이크가 더 나중의 세대였다는 사실 또한 이를 간접적으로 드러낸다.
파일:英特尔酷睿Ultra 200S评测:无药可救!_20241118_041038.307.jpg
Geekerwan 측의 측정 결과에 따르면 멀티코어 전성비 곡선은 200W 이하에서 절대적인 우위를 가지며, 200W를 초과하는 구간에는 Ryzen 9950X보다 밀리는 전성비를 보여준다고 한다. 이러한 특성때문에 Geekerwan 측에서는 애로우 레이크-S 보다는 애로우 레이크-H가 더 기대할 만 하다고 한다. 전성비도 더 우수할 것이며, 코어간의 레이턴시가 높다는 단점도 스트릭스 포인트가 그보다도 더 높은 레이턴시를 보이기 때문에 문제가 상쇄되는 셈이다.

애로우 레이크-S 오버클럭 특성 [ 펼치기 · 접기 ]
* 애로우 레이크-S의 전압/클럭 특성
파일:c594e861db5b0d0ac61d6b17710d649d.jpg
애로우 레이크-S의 오버클럭 특성은 좋지 못하다. 55배수까진 클럭/전압비가 완만하게 늘어나는데, 그 이상으로 넘어가면 전압이 급증하기 때문이다. 현대의 CMOS는 기생 Capacitance가 존재하며 이로 인하여 RC delay가 존재한다. RC delay를 극복하고 CMOS에 더 빠른 동작을 시키기 위해서는 전압을 높일 필요성이 있지만, 이로 인하여 전력의 소모 또한 전압의 제곱 × 늘어난 클럭에 비례하여 증가하게 된다. 따라서 실질적으로 250W의 전력 한도 내에 사용할 수 있는 선택지는 57배수가 되며, 55배수 이상부터는 소위 말하는 차력쇼 구간에 접어들게 된다는 것이다. 인텔이 60배수까지 클럭을 높이지 않았던 이유는 이와 같았던 것으로 보인다. 전압 특성을 보면 60배수를 하려고 해도 못했을 수치를 보여주고 있다.

이러한 실패의 원인으로는 변화한 CPU 아키텍처와 제조공정 모두가 원인으로 지목되고 있다. CPU 아키텍처는 타사의 기조에 따라 비대화 되었는데, 이는 고클럭을 달성하는데 장애물이 된다. CMOS 배치를 조밀하게 설계해야 그만큼 기생 Capacitance도 적고, 클럭을 올리기 용이한데 인텔의 라이언 코브는 정 반대의 사상을 가지고 설계되었다. 물론 오버클럭이나 60배수 이상의 환경을 상정하지 않는다면 바뀐 방향성이 더 낫긴 하지만 오버클럭의 면으로만 봤을때는 악영향을 끼쳤다는 것이 중론.

공정 역시 상당한 하자가 있다. TSMC 3nm는 비록 전성비는 우수하지만, FinFET 기반 3nm라는 점 때문에 클럭 측면에서는 한계가 명확한 공정이다. 특히 N3B는 PPA 3요소 중 Area(면적)에 지나치게 올인했다가 수율이 저조해지는 바람에 Performance(성능)와 Power(전력)의 향상분을 상당 부분 토해내게 되었고, 따라서 N4P 대비 향상폭도 신통치 못하게 되어버렸다. 결과적으로 웨이퍼 단가만 폭증하고 성과물은 저조해 실패한 공정이라는 평가를 받고 있다.

저전력에서의 전성비는 상대적으로 낮은 클럭으로 동작하는 루나 레이크의 싱글코어 전성비 곡선에서 볼 수 있듯이 기존 인텔 7 공정보다 훨씬 양호한 모습을 보여주었으나, 클럭쇼로 대변되는 인텔, 나아가 철저히 고클럭 제품에 기반해 돌아가는 소비자 데스크탑 CPU 자체에는 특히나 부적합하다.[30] 물론 다르게 말하면 인텔은 이러한 부적합성과 단가의 불리함을 알면서도 N3B 사용을 강행해야 했을만큼 아키텍처의 상태가 불량해 경쟁사 AMD 대비 어떠한 방식으로라도 공정상 전성비 우위를 확보하는 것이 절실했다고 볼 수 있다. 따라서 공정 문제 역시 그 근본을 파고들면 인텔이 아키텍처 설계능력 및 공정 경쟁력을 모두 잃어버린 것에서 시작했다는 결론에 도달한다.

4.3. 평가(애로우 레이크-S)

실질적으로 U 라인업을 대체하며 울트라북을 타겟으로 좋은 성과를 거두며 호평을 받은 루나 레이크와는 다르게 애로우 레이크는 겨우 인텔 12세대 라이젠 5000 시리즈를 힘겹게 이기는 수준에 불과한 처참한 게이밍 성능으로 인해 혹평을 받고있다. 절대적인 성능은 퀘존 벤치상으로 DDR4 플랫폼인 라이젠 5800X3D와 엎치락 뒤치락 하는 형국이다. 그토록 강조했던 게이밍 전성비 포인트도 사이버펑크 2077에서 전세대 i5-14600K와 코어 울트라 9 285K가 같은 전력을 먹는데 성능은 i5-14600K가 낫다는 벤치마크도 나올 지경이니 사실상 의미를 상실했다.

무엇보다 가장 뼈아픈 점은, "바로 전 세대까지 인텔은 자사의 공정에 발이 묶여 있어서 제 힘을 못 낸 것 뿐이지, 공정만 정상화되면, 전통의 세계 탑급의 반도체 설계 능력을 발휘해서 압도적인 능력을 뽐낼 것"이라는 기대를 처참하게 무너뜨렸다는 점이다. 현 세대 반도체 상용 최고의 공정 중 하나인 TSMC의 3nm 공정을 동원해서 나온 결과가 이렇기 때문에 이제는 공정 탓을 할 수 없게 되었으며, 인텔의 설계 능력이 오히려 타사 대비 저열하다는 사실이 만천하에 드러났다. 바로 몇 주 전에 경쟁사의 ZEN 5가 출시 당시 너무 큰 기대를 모았다가 소소한 개선에 불과한 제품임이 드러나자 집중 포화를 받았는데, 이 제품은 아예 퇴보했다는 점에서 더 큰 실망감을 주고 있다.

어떤 용도에서 파고 들어봐도 적합한 용도 포인트가 보이지 않는다는 점이 이 CPU의 시장 반응을 어둡게 만들고 있다.
이런저런 상황을 고려했을 때, 작업용 퀵싱크 기능 사용자, 그 중에서도 오직 인텔 제품만 쓰는 12세대 이전 제품 사용자가 신제품만을 기다리면서 버티다가 이번에 새 시스템을 갖추는 경우를 상정하는 식으로 경우의 수를 좁히고 좁혀야 가까스로 이 제품을 합리적으로 선택할 경우의 수가 생긴다.

이 신제품을 평가하는 하드웨어 마니아들 사이에서 '모래낭비'라는 오명을 얻었던 인텔 11세대인 로켓레이크가 유사한 사례로 소환되는 중이다. 심지어 안 그래도 회사가 큰 위기에 빠진 상황에서 나온 신작의 성능이 전작에 비해 퇴보했다는 설계 측면의 문제로 인해 AMD FX 시리즈마저 떠올리게 하는 측면이 있다.

4.3.1. 긍정적 평가

4.3.2. 부정적 평가

4.3.3. 복합적 평가


===# 평가(애로우 레이크-H/HX) #===

4.3.4. 긍정적 평가

4.3.5. 부정적 평가

4.3.6. 복합적 평가

4.4. 기타


[1] 기존의 메테오 레이크는 인텔 4 공정 문제로 데스크탑이 취소되어 노트북 제품군 한정으로 출시되었다. 때문에 급하게 땜빵으로 투입된 물건이 인텔 14세대다. [2] 최대 3개의 마이크로옵을 발행할 수 있는 3개의 Complex Decoder [3] 물론 이로 인해 TR 갯수와 면적이 늘어나게 되는데 TSMC 2nm 이후부터는 실질적인 PPA 향상이 없다. 마케팅용 공정 노드 상으로는 A16, A14까지 붙지만, 실제로는 CMOS의 물리적인 Gate Length는 10nm대에서 더 줄어들지 못하고 있었던 상황이었다. 지금까지는 이를 해소하기 위해 FinFET, GAAFET과 같은 기술을 도입하고 PMOS의 전하 이동도를 개선하여 PMOS가 NMOS의 2배 수준의 Width를 가지지 않아도 되게 함으로써 M2 Track 수를 줄여 Standard Cell의 세로 축 길이를 줄였으며, Gate를 Contact에 맞닿게 함으로써 CPP를 줄여 Standard Cell의 면적을 줄여나가는 식으로 공정을 발전시켜서 "스탠다드 셀 면적이 줄어들었으니 nm가 개선된걸로 치자" 라는 식의 홍보를 했다. 그러나 2nm 이후 세대의 공정 부터는 BSPDN의 도입 이외에는 적어도 CFET 소자가 도입되기 이전까지는 면적 축소의 여지가 거의 없어진 상황이다. 면적 축소는 PMOS와 NMOS를 아예 둘 다 수직으로 적층하는 CFET 소자가 도입되어야 본격적인 축소가 가능할 것으로 전망이 되는 상황. 그렇기 때문에 단가 문제를 해소하기 위해 각 반도체 회사에서는 인터포저 위에 여러 다이들을 적층하거나, 칩렛 구조 등을 도입하면서 차세대 패키징에 관심을 가지는 중이다. [4] 기존 U 라인업 SKU에 비해 2W 늘어났는데, 22FFL 인터포저 위에 함께 탑재되어 같은 패키징으로 포함이 된 LPDDR5 램으로 인한 영향이다. [5] 코어 구성에 따른 성능 차이는 매우 크다. 스냅드래곤 8 Gen이 1세대에서는 1+3+4 구조였으나, 같은 8코어 구성을 유지하더라도 1+4+3, 1+5+2, 2+6+0 구성으로 성능 향상을 하는 것을 보면 알 수 있다. [6] 그 이전까지의 인텔 E-코어는 스카이레이크와 유사한 수준의 IPC를 가졌다. [7] 사실 인텔의 말은 이론적으로 보면 딱히 틀릴 것도 없는 것이 RISC가 CISC보다 태생적으로 성능·효율이 더 좋은 것은 사실이지만 이는 어디까지나 여러 요소 중 하나일 뿐, 반도체의 성능과 전성비를 결정하는 가장 큰 요소는 ISA가 아닌 개발주체의 설계(아키텍처)와 제조(팹) 기술력이다. [8] P 코어 - LP E 코어 간 레이턴시: 약 55 ns, E코어 클러스트 내 레이턴시: 20 ns대 중반 (P코어 간 레이턴시와 비슷한 수준) [9] EU 64개, SP(FP32) 1024개 [10] Core Ultra 5 계열은 벤치마크 유출을 통해 1.85GHz의 클럭으로 GPU가 작동한다는 것이 드러났다. [11] 54W 이상의 전력을 소모하는 메테오 레이크-H의 최대 GPU 성능을 잡지는 못하더라도 28W 메테오 레이크-H GPU 성능이 17W 루나 레이크-V GPU 성능이랑 동급이기 때문에, 동일 17W 상에서 기존 메테오 레이크-H의 128EU GPU의 1.5배 성능을 낸다면 틀린 말은 안한 셈이 된다. [12] 155H와 258V는 최대 클럭이 4.8GHz로 서로 동일하다. [13] 번역 출처 [14] P 코어 4개 + E 코어 4개 [15] 물론 스냅드래곤에서 게임을 구동하면 에뮬레이션으로 돌아가는 것은 감안해야 하지만, 어차피 게임들이 ARM 네이티브를 지원할 리 없으니 현실에서는 오버헤드 패널티를 받지 않는 상황은 없다. [16] 세 번째의 자료를 보면 3DMark 구동시 루나 레이크의 Arc 140V가 17W를 소모할 때의 성능과 메테오 레이크의 1세대 Arc가 28W를 소모할 때의 성능이 정확히 일치한다. [17] 포토샵은 최대 6스레드까지 원활하게 활용한다. [18] 이 경우 90W를 소모하는 메테오 레이크의 Arc 1세대 GPU가 Bilibili 기준으로 0.9%의 우위, Geekerwan 기준 -2%의 열세 구도를 가지며 종합적으로 오차범위 내의 게임 성능을 낼 수 있다. [19] 물론 이는 호환성 문제가 크다. [20] Geekerwan, Tom's Hardware, Notebookcheck 3곳에서 교차 검증. [21] 출시 시점 기준 인텔 샌디브릿지 마이크로아키텍처(2012), AMD는 Zen 1(2017), 퀄컴의 오라이온(2024), 애플의 M1(2020). [22] 장점 부문에 서술된 싱글코어 전성비와는 다른 이야기이다. [23] 일반 소비자용 제품으로 출시되지는 않았지만 인텔 3 공정은 Xeon과 같은 B2B 라인업을 통하여 어느정도 검증이 이뤄진 공정이다. 물론 3나노라는 명칭과는 다르게 인텔 4의 하프노드에 해당하는 공정으로 타사의 3나노와 같은 집적도를 가지고 있지는 않다. [24] Phoronix의 분석에 따르면, 인텔 3 공정과 마이너 업데이트된 아키텍쳐가 적용이 된 Granite Rapids는 코어당 3.9W를 소모하며 3.2Ghz의 클럭을 유지한다. 인텔 7 공정으로 생산된 이전 세대는 6.01W/Core의 전력 소모를 보이는데, 6% 더 높은 클럭을 유지하며 전력 소모를 35% 낮춘 것이다. [25] 파일:화면 캡처 2024-10-29 023135.png
출처 :
[26] 여러 커뮤니티의 실기 게임 프레임 테스트를 기준으로, QHD에서 5800X3D에게 확실하게 패배하며 UHD 이상이 되어서야 285K가 경합 또는 근소 우위를 보이는 것으로 나타났다. [27] 5800X3D는 DDR4 기반 285K는 DDR5 기반 시스템인데도 불구하고 인텔의 열위가 발생한다는 점에 의해 애로우 레이크의 문제가 더욱 심각하다고 할 수 있다. [28] RDNA3 12CU인 780M과 RDNA3 4CU인 740M 간의 성능 차이가 1.7~1.8배 정도라는 점이 의아할수도 있지만 AMD APU에 내장그래픽은 램 대역폭에 제약을 받기 때문에 그렇다. 실제로 780M 12CU와 8CU간의 차이는 CU 수 차이에 비하면 훨씬 좁고, 스트릭스 포인트 또한 RDNA 3.5 16CU를 사용하는 890M과 12CU인 880M 간의 차이가 좁다. [29] ZEN 4의 Non-X나 X3D 라인업의 전성비가 높게 나오는 것은 TDP가 낮게 설정되어 전력 소모는 적지만 실제 성능 하락은 전력 제한에 비례하지 않기 때문에 나오는 일종의 착시일 가능성이 크다. 역으로 전력 제한을 풀었을 때 전력 소모량에 정비례하게 성능이 오르지 않는 것을 생각하면 된다. [30] N3E 공정을 사용하면 이렇게까지 되지는 않았겠지만 CAPA 부족으로 인해 N3E를 사용하는 것은 어렵고 인텔에게 사용 가능한 3nm 선택지는 N3B가 유일했을 가능성이 높다. [31] 오직 CPU만으로 AI를 돌리는 조건을 상정하면 NPU 성능이 메리트 있어 보이지만, 사실상 AI를 돌린다고 하면 NPU 따위는 비교도 안되는 퍼포먼스를 보여주는 GPU의 성능을 끌어다가 쓰는 것이 훨씬 낫기 때문에 현실성 없는 메리트라 할 수 있다. [32] 애로우 레이크 리프레시가 취소되었다는 소식 때문에 차세대에서는 소켓 규격이 바뀔 것이라는 관측이 지배적이기 때문이다. 물론 이 예측이 아직 확정된 건 아니다. [33] 단, 이 CPU가 그나마 강점을 보일 것으로 보이는 작업 용도로 사용할 때 온도가 뜨겁기로 유명한 14세대와 거의 비슷한 수준까지 치솟는다는 점이 매우 아쉬운 점이다. [34] ZEN 5는 AMD의 과장된 발표로 인해 출시 전 기대가 너무 높았기 때문에 출시 후 기대에 못 미친 성능에 실망한 유저들이 더더욱 과소평가한 경향이 있었다. [35] 개그맨으로 유명한 사람이지만, 은퇴 후에 의외로 하드웨어 유튜브 활동도 하고 있고, 그동안 쌓은 재력을 통해서 나름 유저들이 하기 힘든 시도들을 영상으로 만들어 채널에 올려주곤 한다.