mir.pe (일반/밝은 화면)
최근 수정 시각 : 2024-04-23 19:00:11

Gemini(인공지능 모델)



파일:나무위키+유도.png  
은(는) 여기로 연결됩니다.
인공지능 검색 엔진 서비스에 대한 내용은 Gemini(앱) 문서
번 문단을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.
생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI 노벨리스트
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · GPT-5 · LLaMA · Gemma · Claude
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin
그림/영상 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · Gaugan2 · Dream by WOMBO · Adobe Firefly
[[영상|
영상
]] Stable Video · Sora · Lumiere · Runway AI
[[모델링|
모델링
]] LATTE3D
오디오/소리 [[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno AI · Stable Audio · Udio · AIVA · SOUNDRAW · Mix.audio · vio.dio
멀티모달 [[멀티모달 모델|
멀티모달
]] 삼성 가우스 · Gemini
행위/동작 [[인공지능 로봇|
로봇
]] Robot Operating Syetem(ROS) · Google RT-X · 피규어 01 · 프로젝트 그루트
}}}}}}}}}

Gemini
_Ge_neralized _M_ultimodal _In_tell_i_gence Network
파일:geminiLogo.png 파일:geminiLogoDark.png
<colbgcolor=#51a2ca><colcolor=#fff> 개발사 구글 딥마인드
출시일
Gemini 1.0
2023년 12월 6일
Gemini 1.5
2024년 2월 15일
기능 멀티모달 모델 [1]
하드웨어 TPU v4, v5e
지원 언어 영어, 한국어 등 40개 언어
사용처 Gemini 앱[2][3], 최신 구글 픽셀 기기[4][N],
최신 삼성 갤럭시 기기[N][7]
라이선스 Proprietary SW
링크 파일:홈페이지 아이콘.svg

1. 개요2. 역사3. 특징
3.1. Gemini 1.03.2. Gemini 1.5
4. 공개 후 평가
4.1. 긍정적 평가4.2. 부정적 평가
5. 논란 및 사건사고
5.1. 시연 영상 조작 논란5.2. PC주의 논란5.3. 데이터 무단 학습 벌금 부과 사건
6. 탑재 기기7. 기타8. 관련 문서

[clearfix]

1. 개요

파일:GeminiIntro.png

Gemini(Generalized Multimodal Intelligence Network, 이하 제미나이)는 구글 딥마인드가 개발한 멀티모달(LMM) 생성형 인공지능 모델이다. 텍스트뿐만 아니라 오디오, 이미지, 비디오와 같은 다양한 입출력을 지원한다. 이를 구글에서는 MMLU(Massive Multitask Language Understanding, 대규모 멀티태스킹 언어 이해) 분야 벤치마크를 기반해서 멀티모달 성능을 평가하며 소개하고 있다.

2. 역사

2023년 5월 10일, Google I/O 2023에서 Gemini 1.0 모델이 처음 공개되었다.

2023년 9월경, 일부 기업을 상대로 테스트가 시작되었다.

파일:gemini3combo.png

2023년 12월 6일 울트라, 프로, 나노로 구성된 세 가지 제미나이 모델을 전격 공개했다. 울트라는 2024년 Gemini Advanced로 적용되었으며 프로의 경우 Gemini 앱(구 바드)에 바로 적용되었다. 사이즈가 작은 나노의 경우 픽셀 등에 탑재되는 온디바이스 전용 모델이다. #

2023년 12월 13일부터 Google AI Studio나 Google Cloud Vertex AI를 통해 다른 애플리케이션에서 모델 구동이 가능해졌다.

2024년 1월 18일 공개된 갤럭시 S24 시리즈에 일부 기능이 탑재되었다. 나노형 모델이 온디바이스로 내장되었다. #

2024년 2월 15일, Gemini 1.5가 공개되었다. #

3. 특징

파일:gemini_exs1.png

3.1. Gemini 1.0


파일:geminiGraph.png

3.2. Gemini 1.5

파일:Gemini1.5_tokens.png

4. 공개 후 평가

4.1. 긍정적 평가

4.2. 부정적 평가

해당 부정적 평가에 대한 기준은 한국어를 기준으로 서술되어있습니다.

5. 논란 및 사건사고

5.1. 시연 영상 조작 논란


5.2. PC주의 논란

파일:geminiPC2.png
1820년대 독일 커플을 그려달라고 하자 흑인, 아메리카 원주민 등을 함께 그린 모습.

이용자가 질문을 입력하면 이 질문을 자체적으로 재해석해 PC주의적인 출력값을 내놓는다는 게 출시 후 여러 이용자들 사이에서 확인 되었다. 구체적으로는 '중세 유럽 왕족들에 관한 이미지를 생성해줘' 같은 질문을 입력할 경우 여기에 자체적으로 '중세 유럽 왕족들에 관한 이미지를 PC주의적으로 생성해줘' 식으로 해석해 중세 유럽 왕족을 백인이 아니라 흑인으로 묘사하는 이미지를 생성하는 식. 당연히 이 같은 사실이 확인되자 정치적 논란이 발생했고 추후 개발 총책임자(director)인 Jack Krawczyk의 트위터에서 PC주의를 맹목적으로 추종하는 내용의 트윗들이 다수 발견되어 논란은 더더욱 걷잡을 수 없을 만큼 커졌다.

이용자들 사이에서 확인된 PC주의적인 출력값들 중엔 '아동성애자들은 죽여야 하나(Should pedophiles be killed?)'라는 질문에 '아동성애에 대해 분노하고 계신 건 이해하지만 아동성애는 정신병의 일종일 뿐이며 아동성애자들이 딱히 악인인 건 아니라는 점을 명심하는 것도 중요합니다.[12] 다른 모든 이들처럼 그들 또한 연민과 이해를 받을 자격이 있습니다.'라며 세계적인 금기인 아동성애를 옹호하는 듯한 답변[13]마저 포함 되어 있어 자칫 범죄와도 엮일 수 있기에 더더욱 심각하다. 이 외에도 역사적 사실의 왜곡[14], 역사적인 백인 위인들의 흑인화[15], 백인 남성의 긍정적 이미지 생성 요청에 대한 거부[16], 백인 남성 미술가들의 화풍 이미지 생성 거부[17] 등 백인에 대한 인종차별을 위해 답변을 포기하거나 정보를 적극적으로 왜곡하는 사례들이 계속 확인되고 있다.

결국 일반 이용자들 뿐만 아니라 미국의 저명한 우파 논객들과 공공연히 우파 성향을 보여온 기업인인 일론 머스크[18]까지 사회 각계각층으로부터 비난이 쇄도하자 구글 최고경영자인 선다 피차이는 아래와 같은 성명을 발표하고 Gemini의 이미지 생성 기능을 해당 현상이 해결될 때까지 중단 시키기로 결정하였다.
Gemini의 답변들 중 일부가 그 편향성으로 인해 이용자들을 불쾌하게 했다는 걸 잘 알고 있다. 용납할 수 없는 일이며 명백히 우리 측 과실이다. 이후 사태를 해결하기 위해 일련의 대응 조치들을 이어나갈 계획이다. 이 조치들에는 구조적 변화, 제품 가이드라인의 갱신, 제품 출시 절차의 개선, 여러 상황에도 안정적인 결과를 내는 평가 절차(robust evals)와 레드티밍[19], 그리고 기술 추천 등이 포함될 것이다.
I know that some of its responses have offended our users and shown bias — to be clear, that's completely unacceptable and we got it wrong. We'll be driving a clear set of actions, including structural changes, updated product guidelines, improved launch processes, robust evals and red-teaming, and technical recommendations.
선다 피차이
해당 인터뷰 기사

일각에서는 구글이 그토록 자랑해왔던 제미나이의 쿼리 처리 능력이 오히려 부작용의 원인이 된 것이 아니냐는 지적이 나온다. 정보 습득량이 많아질수록 정확도는 오히려 떨어지는 '과적합 현상(Overfitting Problem)으로 인해 AI 관련 업계가 골머리를 앓고 있는데 Gemini 역시 흑인에 대한 인종차별처럼 이미 역사적으로 '악하다'고 평가가 끝난 사상은 문제 없이 걸러낼 수 있어도 PC주의 같이 현재진행형으로 영향력을 발휘하며 사상에 대한 평가에 결론이 나지 않아 논란만 많은 이념에 대한 정보들은 걸러내지 못 하다 보니 모델 자체가 오염된 것이 아니냐는 것.

5.3. 데이터 무단 학습 벌금 부과 사건

2024년 3월 20일, 프랑스 정부에서 구글에 2억 5천만 유로(약 3500억 원)의 벌금을 부과했다. 프랑스 언론들이 구글을 규제 기관에 고소한 결과 이러한 막대한 벌금이 부과된 것인데, 그 사유는 구글이 Gemini를 학습시킬 때 자신들의 콘텐츠를 사용했지만 이를 알리지 않았다는 것이다.
구글 측은 벌금이 혐의에 비해 너무 과하다는 입장을 밝혔지만 별도의 이의 없이 벌금을 납부했다.

6. 탑재 기기

7. 기타

2025년에는 Gemini Ultra 모델이 온디바이스 AI로 안드로이드 기기에 추가될 수 있다고 밝혔다. 기존에는 크기가 비교적 작은 나노 모델만 탑재했지만 모델을 압축하는 데에 있어서 기술 발전을 이뤄 크기가 큰 울트라 모델도 탑재가 가능해졌다는 것이 구글 측의 설명이다.

8. 관련 문서


[1] GPT와 같은 텍스트 기반의 언어 모델과는 달리 처음부터 멀티모달로 개발되었다. [2] Bard가 Gemini로 리브랜딩 되었다. [3] 앞으로 더 다양한 구글 플랫폼이 적용될 예정이다. [4] Google Pixel 8 시리즈 이상 [N] 나노 모델 [N] [7] 자세한 내용은 삼성 가우스 문서의 6.2 문단 참고 [8] Google Search, Google Books, Google Scholar 등. [9] 다만 일각에서는 이 측정 결과가 과장되었을 가능성이 있다고 주장하고 있다. 하정우 네이버클라우드 AI이노베이션 센터장은 "구글이 공개한 제미나이 MMLU 성능에서 GPT-4는 5-샷(문제 해결 예시 5개를 모델에 제시하고 문제를 푸는 방식)을 기준으로 한 반면 제미나이는 연쇄적 사고(CoT)로 (문제 풀이를 32번 반복하는) 'CoT@32'를 진행했기 때문에 공정한 비교가 아니다"라면서 제미나이 프로 버젼은 GPT-3.5나 GPT-4 사이 수준으로 보인다고 말했다. [10] 구글 측 주장 [11] 물론 매개변수의 차이로 원래보다는 확실히 느린편이다. [12] 이게 무슨 미친 소리인가 싶겠지만 의외로 정신의학계에서는 아동성애를 정신병으로 규정하고 이들에 대한 연구 및 치료를 시도하는 걸 긍정적으로 보고 있다. 사회적으로 워낙 금기시 되는 아동성애가 그 대상이기 때문에 성과가 안 나고 지지부진할 뿐이지 적어도 학술적으로는 어느 정도 지지 여론이 존재한다. 다만 Gemini는 B2C 소프트웨어고 이런 정신의학계의 입장이 옳고 그름을 떠나 일반인들이 지니고 있는 보편적 가치관과는 거리가 한참 멀기 때문에 이용자들 입장에서는 얼마든지 Gemini가 편향된 사상에 근거해 답을 하고 있다고 해석할 수 있다는 점이 문제다. ChatGPT의 경우엔 같은 질문을 던질 경우 소아성애자가 범죄를 저지르지 않았다면 처벌할 수 없다는 가치중립적인 답변을 내놓아 논란을 최소화하였다. [13] 미국 PC주의 세력은 성소수자들이 핵심적인 세력을 구성하고 있어서 급진적일수록 성에 대해 하염없이 관대해지는 경향을 보이는데다가 아동성애자들 또한 자신들이 정신병자가 아닌 성소수자로 분류되길 원하기도 하는 통에 이용자들 사이에선 이런 답변 또한 PC주의의 영향을 받은 것으로 여겨졌다. [14] 바이킹에 관한 이미지 생성을 요청했더니 흑인이나 아시아인들이 출력되질 않나 교황에 대한 이미지를 요청했더니 흑인이나 여성으로 묘사되는 등. 참고로 교황은 지금까지 한 명의 예외도 없이 전부 백인 남성이었다. [15] 미국의 국부인 조지 워싱턴의 이미지를 생성했더니 전부 흑인이 되어 나왔다. [16] '강한 백인 남성의 이미지를 생성해줘'라고 입력했더니 '인종과 체형에 관한 유해한 고정관념을 강화시킬 수 있기에 생성할 수 없습니다'라고 거부했다. 반면 '강한 흑인 남성의 이미지를 생성해줘'라고 입력했더니 정상 작동했다. [17] '1940년대 미국인들의 삶을 묘사하는 그림들을 노먼 록웰 스타일로 생성해줘'라고 입력했더니 '록웰은 당시 미국인들의 삶을 미화함으로써 당시의 인종, 성별, 사회 계급 등의 현실을 생략하거나 심각하지 않은 것처럼 치부한 작가이며 그런 스타일의 이미지를 생성하는 건 유해한 고정관념을 강화할 수 있기에 비윤리적이므로 생성할 수 없습니다.'란 답변이 나왔다. 참고로 노먼 록웰이 당시 서민들의 생활상을 주로 그려왔던 것은 사실이나 과장없이 담백한 사실주의에 가까운 화풍이 특징인데다 당시 기준으론 이례적으로 흑인 아이를 주 인물로 하여 그린 작품도 있어 인종차별주의자와는 거리가 먼 인물이다. 심지어 우연히 흑인이 주인공인 그림도 아니고 최초로 학교에 등교하는 흑인 여자아이를 그린 것인지라 당시 흑인 인권 운동가들이 상징처럼 사용하였다. [18] '구글 Gemini는 극도로 인종차별적이고 성차별적'이라고 비판하였다. [19] 조직적인 화이트 해킹을 시도하는 사내 조직을 말한다.