해당 서비스의 기반 언어모델에 대한 내용은 HyperCLOVA 문서
의
네이버 HyperCLOVA X 부분을
참고하십시오.대화형 인공지능 서비스의 목록 | ||
{{{#!wiki style="margin:0 -10px -5px; min-width:300px; min-height:calc(1.5em + 5px); word-break:keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" |
인공지능 컴패니언 | 이루다 2.0 · 강다온 · 허세중 · Neuro-sama · 라디안 · 냥아지 · 쿠로냥아지 |
페르소나 채팅 플랫폼 | Character.AI · RisuAI · CAVEDUCK · Myshell.ai · Rolp.ai · zeta · 티카 · Babechat.ai · SpeakEasy · 뤼튼 · GPTRPG | |
LLMs 대화형 | ChatGPT · Microsoft Copilot · Gemini · CLOVA X · 어니봇 · YouChat · Cue: · Pi · Le Chat · 삼성 가우스 | }}}}}}}}} |
NAVER CLOVA X |
|
<colbgcolor=#56dda2><colcolor=#fff> 개발사 | 네이버 |
기능 | 대화형 인공지능 |
기반 언어모델 | HyperCLOVA X |
출시일 |
초기 베타
2023년
8월 24일
|
서비스 | 무료 |
링크 |
[clearfix]
1. 개요
네이버에서 대형 언어 모델(LLM)을 활용하여 만든 한국형 대화형 인공지능 서비스이다. 2023년 9월 20일에는 네이버에서 자체 언어모델 HyperCLOVA X의 검색 특화 모델을 기반으로 하는 인공지능 검색 엔진 서비스 Cue:가 네이버 검색엔진에 출시되기도 하였다.2023년 8월 24일에 한국을 대상으로, 한국어 버전으로 출시되었다. 이후 일본어와 아랍어, 동남아시아 언어 등을 추가할 가능성이 있다.
25:01 부분에서 언급되고있다.
2023년 11월 3일 문서 업로드 기능을 추가했다. #
2. 특징 및 인터페이스
네이버의 서비스인만큼, 네이버 쇼핑이나 카페등과 같은 서비스를 표시할지 선택할수 있으며, 네이버 계정으로 로그인하여 사용할 수 있다. 좌측에 채팅목록을 확일할 수가 있는것으로 보인다.
2.1. 대화형 인공지능 서비스
대화형 인공지능 서비스도 제공하며, 창작과 요약을 비롯한 뛰어난 글쓰기 능력을 보여줄 것으로 보인다. 나아가 다양한 서비스들을 플러그인 형태로 연동해 필요한 기능을 호출하는 것도 가능하다고 한다. 아래는 CLOVA X를 활용한 예시이다.네이버 생성형 AI 검색 서비스, CLOVA X 대화 장면 |
이야기 창작, 이야기 설정 창작 어시스턴트, 각종 창의성이 필요한 문구 및 문서 작성(광고 문구, 리뷰, 자소서 등등), 기업용 챗봇 빌더, 각종 코딩, 기타 검색, 웹서핑 기능 등이 가능한 것으로 보여진다.
그리고 방대한 양의 텍스트는 문서 형식으로 업로드해서 요약하는게 가능하다.
2.2. 이미지 분석 및 수정
2024년 8월 27일에 이미지를 이용한 대화와 이미지 지우개 기능으로 추가하고, 대용량 문서 요약 기능을 따로 독립시켰다. 이미지를 업로드하여 그 이미지에 대해서 물어보거나, 텍스트와 차트가 포함된 이미지를 보여줘 어느정도의 분석을 가능하게 해주는 기능이다. 그리고 지우개 기능은 기존 삼성이 S24에 탑재한 것과 같이 특정 영역을 터치하면 객체를 인식해 자동선택하고, 그 선택한 객체를 삭제하는 기능이다.3. 공개 후 평가
평가는 아직 많이 나뉘는 중이다. 검색이나 맛집찾기나 국내에서 사용하기에는 엉뚱한 답을 내놓는 타사 서비스에 비해 긍정적인 반면, 그 외 상당부분에서 부정적인 평가를 받고 있다. 그러나 시간이 지나고 데이터가 축적되어 감에 따라 변화가 기대되기도 한다.[1]3.1. 긍정적 평가
- 최신정보를 검색할 수 있다.
- 정보를 가져온 출처를 알려준다.
- 모르면 모른다고 대답하는 경우가 많으며 할루시네이션이 적다.
- 검색엔진이 네이버이다보니 한국과 관련된 정보는 더 잘 찾는편이다.
- 한국어에 특화된 높임말, 반말이나 한국 관련 지식, 한국 특유의 대화 흐름에는 확실히 더 능숙하다.
- 다른 챗봇들이 경량화 모델을 기본으로 하고, 원본을 월정액으로 출시하는데 반해 모든 기능을 무료로 풀고있다.
3.2. 중립적 평가
- 답변을 되도록 긍정적으로 해준다: 무언가를 물어볼 때 가령 "~이렇게 이해했는데 그게 맞지?"라고 물어보면 틀릴 땐 틀리다고 대답하고 맞는 정보가 무엇인지 피드백을 해야 하는데 그냥 무조건 맞다고 긍정해주는 경우가 많다.
3.3. 부정적 평가
- 역사적 인물에 대한 평가를 제공하지 않는다. 주관이 포함되는 가치판단이 필요한 답변은 대부분 회피한다.
- 현재 시각에 대해서 물어보면 약 3시간 전의 시간을 답변한다.[2]
- 사칙연산을 틀리는 경우도 있다.[3][4]
- 전체적으로 한국어 특화 모델인 것에 비해서 한국어 이해력이 다른 세계적인 초대형 모델에 비해서 그렇지 돋보이지도 않고, 어떤 부분에서는 오히려 뒤쳐지기도 한다.
- 대화형 인공지능은 크롤링 후 학습한 데이터를 정제해서 출력해야 하는데, 로그나 리뷰 페이지 등지에서 크롤링한 데이터를 그대로 내놓아서 개인 정보가 유출되는 경우가 간혹 있다.
- 검열이 매우 심한편으로, 타사의 챗봇 서비스에 비해서도 매우 강한축에 속한다.[5]
3.4. 총평
모델 자체적인 성능은 나쁘지 않다. 오히려 나름 한국어쪽에서는 꽤 뛰어난 모델이지만, 시간과 자본으로 피터지게 경쟁하는 llm판에서 신버전은 커녕 어느정도의 파인튜닝으로 미세조정을 하거나 이미 다른 llm 모델들은 가지고 있던, 대용량 텍스트 분석이나, 이미지 식별 기능을 이제와서 추가하는게 업데이트의 전부였다. 그 예시로 Openai는 말할 것도 없고, 출시 당시에만 해도 성능적 이점이 거의 없다고 까이던 bard는[6] 현재 순차적으로 모델을 업그레이드하며 gemini 1.5 pro 08-01 버전을 내놨는데. 이 모델은 현 llm 아레나에서 유저 평가가 gpt-4o 다음가는 수준이고, Meta에서 출시한 Llama 3.1 405b, xAI에서 개발한 grok-2, Anthropic에서 개발한 claude 3.5 sonnet, 경량화와 준대형 사이즈의 llm 모델을 만들기로 유명했던 Mistral도 현재는 Mistral large 2 라는 대형 모델을 내놓는등 당시에도 독보적인편이 아니었지만, 현재는 경쟁 상대도 너무 늘었고, 격차도 따라잡기에는 너무 심하게 벌어졌기에 용도에 따라서는 다르겠지만, 언어 능력과 논리 추론 같은 분야에서는 주 언어인 한국어를 기반으로 질문해도 우위를 점하지 못하고 있다.4. 문제 및 사건사고
5. 기타
- 베타 테스터 지원의 경우 미성년자이거나 실명 인증이 되지 않은 계정은 지원할 수 없다.
- 일부 질문의 경우 나무위키의 내용을 인용하는 경우가 있다.
[1]
대부분
GPT와 비슷한 수순을 밟을 것으로 예상하고 있다.
[2]
실시간 액세스 텀이 꽤 긴것이 이유로 보인다.
[3]
사실 이것은 빅데이터 기반 챗봇의 태생적인 문제이기도 하다. 토큰들의 확률에 따라서 문장을 작성하는 언어모델의 특성상 단 하나의 실수로 정답과 오답이 나뉘는 수학은 떨어지는 것이 당연하다.
[4]
그래서 실제로는 대부분 해당 명령에 대한 코드를 작성해서 그 작성한 코드의 출력값을 도출하는 챗봇이 대부분이https://namu.wiki/delete/CLOVA%20X$0다.
[5]
이로 인해 챗봇의 재성능을 전부 못쓰고있다.
[6]
현 gemini