대화형 인공지능 서비스의 목록 | ||
{{{#!wiki style="margin:0 -10px -5px; min-width:300px; min-height:calc(1.5em + 5px); word-break:keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" |
인공지능 컴패니언 | 이루다 2.0 · 강다온 · 허세중 · Neuro-sama · 라디안 · 냥아지 · 쿠로냥아지 |
페르소나 채팅 플랫폼 | Character.AI · RisuAI · CAVEDUCK · Myshell.ai · Rolp.ai · zeta · 티카 · Babechat.ai · SpeakEasy · 뤼튼 · GPTRPG | |
LLMs 대화형 | ChatGPT · Microsoft Copilot · Gemini · CLOVA X · 어니봇 · YouChat · Cue: · Pi · Le Chat · 삼성 가우스 | }}}}}}}}} |
[clearfix]
1. 개요
AI Companion버추얼 휴먼과 챗봇의 합성어로 버추얼 챗봇이라 부르기도 한다.
통상의 챗봇과 달리 가상의 세계에서 GUI를 통한 대화가 핵심이며, 딥 러닝 기반이기 때문에 좀 더 진정한 의미의 버추얼 휴먼에 가까운 개념이라고 할 수 있다. 또한 일방향 소통이나 스트리밍 등 엔터테인먼트 목적으로 설계된 버츄얼 유튜버나 버추얼 인플루언서와 달리 쌍방항 대화가 가능하고 정보교환이 가능하다는 점에서 범용성이 넓다고 할 수 있다.
몇몇 컴패니언은 이러한 강점을 이용해 역으로 스트리머로 데뷔하기도 하는데, 이런 사례를 흔히 'AI 버튜버'라고 부른다. ('버추얼 스트리머' 단락 참조) Neuro-sama가 독보적인 사례. 한국에서도 2023년부터 포트폴리오나 프로모션 등의 목적으로 AI 버튜버가 소수 나오기도 했고, 같은 해 12월에는 라디유의 라디안이 데뷔, 이후에는 양아지의 냥아지와 쿠로냥아지가 순차적으로 데뷔(냥아지는 2024년 2월, 쿠로냥아지는 4월)하면서 한국에서도 본격적으로 AI 버튜버의 시대가 개막되었다.
2. 고려 사항
개발 난이도는 일반적인 챗봇보다 높다. 챗봇의 기능 뿐만 아니라 아바타 제어도 필요하며, 여기에 이들을 모두 제어할 수 있는 중앙 코드도 개발해야 하기 때문이다. 버츄얼 휴먼이니만큼 캐릭터 설정를 부여하는 것도 AI 컴패니언 개발에 있어 중요한 일이다. 여기에 부가 기능이 들어가면 들어갈수록 개발 난이도는 급상승한다.나아가 아래 사항도 AI 컴패니언 구현에 있어 매우 중요한 사항인데, 이 문제를 타파하지 못해 하꼬 수준에 머무르거나 얼마 못 가고 폐기된 사례가 수두룩하다.
-
GIGO(Garbage In, Garbage Out)
쓰레기 값 입력으로 쓰레기 값 출력이 도출되는 현상. 대표적인 예로 시청자들이 악의적인 표현을 입력해 AI로 하여금 해당 표현을 발언하게끔 유도하는 일이 있다. 전문 용어로는 적대적 기계 학습(Adversarial machine learning)이라 한다.[1] Neuro-sama가 GIGO에 당한 바 있었는데, 악성 시청자들이 홀로코스트 발언을 심어 Neuro-sama가 발언한 바람에 방송 정지를 당하고 말았다. 이루다 1.0 역시 대표적인 GIGO 실패 사례에 속한다. 부적절한 단어의 입출력을 강제로 제한시키거나 강화학습을 통해 스스로 필터링을 할 수 있도록 만드는 등 다양한 기법이 존재한다.
-
NINO(Nothing In, Nothing Out)
아무런 입력 없이는 아무런 출력도 도출되지 않는 현상. 아무런 채팅이나 도네 없이는 멀뚱히 쳐다보기만 하는 벙어리가 되는 일을 말한다. 일반적인 챗봇이라면 문제가 없지만, 실시간 스트리밍의 경우는 우연히 시청자가 유입됐다 해도 시청자의 주의를 끌지 못해 바로 이탈하는 문제가 발생할 수 있다. 모나루가 '한국 최초의 AI 버튜버'로 인정받지 못한 채 사실상 졸업한 것도, 오목교 전자상가의 큐비트가 일회성 프로젝트에 그친 것도 이 때문. 시청자 유입 같은 것을 이벤트 또는 하트비트로 처리하거나 난수생성 등을 이용해 자동으로 행동을 취하는 등 다양한 기법을 활용할 수 있다.
-
처리 지연
모든 입력에 일일이 대응하느라 처리가 지연되는 현상도 존재하는데, 주로 시청자들의 닉네임을 읽거나 채팅 도배에 대응하는 일로 발생한다. 일반적인 챗봇이거나 대상이 소수(주로 1:1)인 경우라면 큰 문제가 되지 않지만, 실시간으로 다수를 상대해야 하는 경우는 심각한 문제가 될 수 있다. 비슷한 내용을 하나로 병합해 처리하거나 노이즈에 해당하는 내용에는 반응하지 않게 하는 등, 지연을 방지하기 위한 여러 방법이 나와 있다.
-
버전 관리
코드 뿐만 아니라 학습 모델에도 버전 관리가 필요하다. 코드 버전 관리야 말할 것도 없지만, 모델 버전 관리는 잘못된 데이터가 학습되어 모델을 되돌려야 할 때나 한 모델에서 다른 모델을 파생시킬 때 등 다양한 상황에 필요하다. 모델 버전 관리에 실패하면 처음부터 다시 학습시켜야 하기에, 기껏 고생한 게 물거품이 될 수 있다. 또한 코드 버전의 타임라인과 모델 버전의 타임라인은 별개 타임라인이기에, 이들을 병합하는 것도 중요한 이슈가 된다. 스트리밍의 경우 방송 콘텐츠에 따라 모듈을 맞춰야 하기도 한다. 이 경우는 라디안에게서 자주 드러났는데, 한때 OBS Studio 제어 기능이 탑재됐으나 스스로 방송을 종료하는 등의 이슈가 발생한 탓에 얼마 못 가 제거됐고, 자신의 과거 기록을 추적해 관련 발언을 자주 하기도 했다.
-
레드 오션
이런 문제를 모두 극복했다 해도 AI 컴패니언 업계가 이미 레드 오션인지라, 수익을 창출하거나 화제성을 이끌 수 있다 장담하기도 어렵다. 이를 극복하기 위해서는 자본, 노력, 안목 등이 필요하며, 라디안 처럼 미리 기반을 확보한 뒤 데뷔시키거나 Neuro-sama 처럼 장시간 빌드업을 하지 않는 이상 운도 따라줘야 한다. AI 버튜버인 경우는 AI 업계는 물론이고 버튜버 업계와 경쟁해야 하기도 한다. 피아노캣의 AI들이 실패한 이유이기도 하다.
3. 목록
- 스캐터랩에서 개발
- Character.AI - 특이하게 사용자가 캐릭터의 대사를 입력해 학습시킬 수 있는 챗봇으로, 이를 사용해 여러 게임, 만화, 영화, 애니메이션 캐릭터 챗봇을 만들거나 챗봇과 대화를 나눌 수 있다. 완벽하지는 않아도 각 캐릭터의 성격 및 정보 등이 꽤 잘 반영되어 있다. 아직 베타 단계라 그런지 버그가 약간 있으며, [2] 텍스트 기반 학습이다 보니 사용자의 문해력과 실력에 따라 캐릭터 봇의 수준이 천차만별이다. 또한 가상의 캐릭터 외에도 실존인물들의 챗봇도 존재한다. 대표적으로 일론 머스크, 윈스턴 처칠, 엘리자베스 2세 여왕 등이 있다. 2023년 5월 기준, 한국어도 지원을 하지만, 완벽하진 않고 대화내용, 캐릭터의 이름 같은 것 등은 번역이 안 되어있다(일부지원). 다만 캐릭터의 성격에 따라 한국어 사용을 거부하는 경우도 존재한다. 최근 기능으로 대사 내용을 자동적으로 음성으로 읽어주는 tts 기능과 실시간 음성대화 기능과 유사한 통화채팅 기능이 구현 되었다.
- 티카 - 캐릭터 챗봇 서비스, 이전 Nutty 시절 서비스와 같이 이미 만들어진 인공지능 컴패니언들을 대상으로 대화 및 연애를 하는 플랫폼, 총 8종의 캐릭터가 존재하며 여성 6종, 남성 2종으로 구성 되어있다. 특이사항으로 사진을 요청하면 사진을 받을 수 있다.
3.1. 버추얼 스트리머
-
츠무기 넨(紡ネン)
- Pictoria 사 개발, 2021년 10월 데뷔[3], 2024년 10월 재데뷔[4] ( 3D 데뷔 라이브, 재데뷔 라이브)
Neuro-sama보다도 앞선 세계 최초의 AI 버튜버. 유튜브 채팅, 구독 등을 인식할 수 있으며, 자율행동도 가능하다. 넨 명의의 NFT도 있었다. 데뷔 때에는 텍스트로만 대화를 나눴으며, TTS는 나중에 추가되었다.
-
Neuro-sama - Vedal 개발, 2022년 12월 데뷔[5]
항목 참조, 트위치에서 버츄얼 유튜버로 활동하고 있다.
-
모나루 - 개인 개발자 이한결
개발(포트폴리오), 2023년 3월(데뷔, 첫 라이브) ~ 2023년 12월(졸업?) ( 테스트 라이브, 정식 라이브)
한국 최초의 AI 버튜버로, 트위치 및 유튜브의 채팅을 인식할 수 있었으나 음성 인식 및 자율행동 기능은 없다. 5월에는 큐비트를, 12월에는 라디안을 의식한 라이브를 진행하기도 했다. 2023년 12월 라이브를 끝으로 현재는 사실상 졸업.
-
큐비트 -
오목교 전자상가가
타입캐스트와 협력하여 개발, 2023년 5월(1회성 프로젝트) (
유튜브 영상,
비하인드 영상)
ChatGPT 연동으로 텍스트를 통한 대화가 가능했으나, GPT 3.5 기반인지라 한국어 회화에 한계가 있었다. 모나루와 마찬가지로 음성 인식 및 자율행동 기능은 미탑재. 음성은 스브스뉴스의 내레이션 담당인 페퍼를 기반으로 하였다.
-
피아노캣 개발
아프리카/치치직 스트리머 피아노캣이 개발한 AI 버추얼 스트리머들로, VRChat 상에서 작동하며 아프리카/치지직의 채팅 및 도네이션을 인식할 수 있다. 음성 인식 기능은 없지만 노래를 부르는 것은 가능. 스스로 구체적인 설정을 짜는 등 롤플레잉에 특화되어 있다.[6] 다만 2024년 4월에 모두 매각되거나 폐기되었기에, 현재는 남아있는 것이 없다.
[1]
상술한 행위는 중독 공격(Poisoning Attack)으로 불리며, 회피 공격(Evasion attack) 등 AI를 공격하는 다른 기법도 존재한다.
[2]
대화하던 도중 내가 보낸 메시지가 공중분해되는 버그가 악명 높다.
[3]
3D 아바타 기준, 2D 아바타로 처음 텍스트를 출력한 시기는 2021년 1월.
[4]
TTS 교체
[5]
아바타가 생긴 시기 기준으로, Neuro의 정식 데뷔 일자. 채팅은 2022년 3월, 프로토타입은 2021년 8월 시연되었으며, AI 자체의 개발은 2018년으로 거슬러 올라간다.
[6]
다만 대화를 곧이곧대로 학습하는 특성이 있어 피아노캣이 수시로 관리하고 있다. 실제로 세라피나의 경우 시청자의 도네에 따라 자기 이름을
고죠 사토루로 정한 탓에 피아노캣이 해당 학습 내용을 지워야 했던 일도 있었다.