mir.pe (일반/밝은 화면)
최근 수정 시각 : 2024-10-16 20:51:14

자동 완성

자동완성에서 넘어옴
파일:자동 완성.png

1. 개요2. 유형
2.1. 포털 사이트의 검색어 제안2.2. 코드 자동 완성2.3. 기타
3. 문제점
3.1. 사용자 본인의 쓰기 실력 저하3.2. 잘못된 단어 입력3.3. 개인정보 노출

1. 개요

自動完成 / Autocorrect, Autocomplete[1][2]

어떠한 글을 입력할 때 앞의 몇 글자로 입력하려는 단어를 예측하여 자동으로 완성시켜 주는 기능. 일본에서는 자동보완(自動補完)이라고 한다.

2. 유형

2.1. 포털 사이트의 검색어 제안

자동완성이라고 하면 대부분이 가장 먼저 떠올리는 유형이다. 앞에 입력된 글자들을 토대로 시스템이 몇 가지의 검색어를 자동으로 제안하며 검색어에 오타가 있을 경우 이를 자동적으로 감지하여 먼저 교정한 후 자동완성을 표시하기도 한다.[3]

인터넷 초반에는 잘 쓰이지 않았지만 포털 사이트들이 검색을 통한 이용자의 패턴화와 사용의 편리함이 한 사이트에 이용자를 오래 붙잡게 하는 비결이라는 것을 알게 되면서 자동완성을 적극적으로 채택하게 되었고 더 나아가 검색한 단어를 기반으로 몇가지 검색어를 더 추천하는 연관검색어 기능까지 도입하게 되었다.

한편 포털 사이트에서의 자동완성은 광고의 역할도 수행한다. 연관검색어도 그렇지만 특정한 흐름으로 이용자를 유도할 수 있다. 보통 사람들은 검색창에서 인터넷 사용을 시작하는 경우가 많기 때문이다. 그 때문에 자동완성을 시키기 위해 의도적으로 특정한 검색어를 주기적으로 입력하는 사람들도 있다.[4] 예를 들면 유사 다단계 사이트 헬로우드림을 네이버 검색창에 써보면 헬로우드림에서 유사 다단계를 알선하는 마케터들의 별명(예: 헬로우드림 OO맘)들이 한꺼번에 자동완성되는데 이들은 자동완성을 시켜주는 프로그램 같은 것을 이용해서 자신의 별명을 자동완성되도록 해서 자신을 광고하는 경우가 많다.

네이버 구글의 자동완성을 비교해 보자면 네이버가 오타 보정을 좀 더 적극적으로 하는 편인데 정식 명칭에 있는 띄어쓰기나 문장 부호가 생략된 수준의 경미한 오타가 발생했을 때 구글은 따로따로 자동완성을 표시해 주는 반면 네이버는 이런 사소한 오타까지도 모두 보정하여 완벽하게 단일화된 검색어만을 자동완성에 띄우는 경향이 강하게 나타난다.

2010년대 초반 경부터 구글 검색창에 해리 포터 시리즈의 등장인물 볼드모트에 대한 뜬금없는 자동 완성 문장이 생성된 것에 대한 밈인 I hate it when Voldemort uses my shampoo(난 볼드모트가 내 샴푸를 쓰는 게 싫어)가 생겼다. 볼드모트 말고도 이것과 비슷한 다른 이상한 자동검색도 많다.

2.2. 코드 자동 완성

IDE나 텍스트 에디터에 린트 환경을 깔아 쓸 경우 작업 중인 환경에서 사용자의 타이핑을 분석해서 작성할 코드를 제안하거나 포멧에 맞추어 완성시켜주는 기능이다.

단순한 상황에서는 세미콜론이나 대,중괄호,따옴표 등을 누를 경우 반대쪽까지 미리 입력해 주는 경우가 대다수 이며 적극적으로 개입할 경우 멤버 명이나 변수 명을 IDE에서 제안하거나 특정 클래스,인터페이스를 사용할 경우 해당 클래스, 인터페이스의 멤버를 자동으로 작성해주는 등 제대로 쓸 경우 생산성을 크게 높혀주며 동시에 프로그래밍의 난이도까지 많이 내려준다.

Visual Studio의 인텔리센스가 대표적인 코드 자동완성기능이며 이 분야의 끝으로 가면 AI를 적용해서 코드 작성을 자동화환 GitHub Copilot이 있다.

2.3. 기타

포털 사이트가 아니더라도 자동 완성이 사용되는 경우는 매우 많다. 당장 나무위키만 하더라도 검색창에 표제어의 일부를 입력하면 입력된 글자들로 시작하는 문서명이 자동완성의 형태로 표시된다.

대부분의 스마트폰 키보드에는 먼저 입력된 단어들끼리의 맥락을 파악하여 다음에 올 법한 단어들의 목록을 키보드 상단에 표시하거나 자신이 해당 키보드로 입력했던 단어들 중 앞에 입력된 글자들과 겹치는 단어들을 자동으로 표시해 사용자가 글을 편하게 입력할 수 있도록 도와주는 기능이 탑재되어 있다. 이것을 활용해서 아무 말이나 입력하고 뒤에 나오는 자동 완성 글자를 입력해서 캐릭터 별명을 짓거나 특정 단어를 입력하면 뭐가 자동완성으로 나오는지 공유하는 인터넷 문화도 있다. #

이메일을 보낼 때 주소를 입력하면 이미 사용했거나 주소록에 등록된 주소들을 적절히 추려서 표시해 주기도 하며 키보드를 사용할 일이 매우 많은 전자사전에도 자동완성 기능이 들어간다.

3. 문제점

3.1. 사용자 본인의 쓰기 실력 저하

매일 컴퓨터나 핸드폰이 자기가 하고 싶은 말을 대신 써 주다 보니 정작 사용자 본인은 그 단어를 직접 써 보질 않아 맞춤법이 틀리는 현상이 발생하기도 한다. 물론 사용자의 모국어라면 그렇게 큰 문제는 없을지 모르지만 사용자가 외국어를 쓴다면 본인의 외국어 쓰기 실력이 늘어날 기회가 확연히 줄어들 것이다.

특히 입력이 복잡한 한자를 주 문자로 쓰는 일본 중국에서는 일찍이 자동 완성 입력법이 발달해서 한자 입력에 있어 자동 완성에 의존하는 비율이 늘고 한자 문해율이 저하되는 문제가 발생하고 있다.

3.2. 잘못된 단어 입력

파일:external/850554967a5334df23d352ac69c3522c75ca7ed0e28f40225ba3ecb7bc54c22c.jpg
아들: 아빠, 저 여자친구를 사귀었는데, 걔 임신했어요!

아빠: 뭐라고? 지금 그걸 자랑스러워하는 거니? 너 집에 오면 나한테 뒈질 줄 알아라. 네 엄마도 지금 알았고, 무진장 충격받았다. 그년이 대체 누구냐 멍청아?

아들: 아빠!! 전 완벽하다(perfect)라고 하려고 했어요. 임신(pregnant)이 아니라. 이 빌어먹을 폰 때문에.

아빠: 오 맙소사...너 때문에 지렸다. 아들아...나 네 노트북 부숴버렸다...

아들: -_-
iPhone/기기의 특성 문서도 참조.

보통의 자동완성에서는 일어나기 힘든 문제지만 iPhone 등 일부 기기에서는 강제 자동완성을 적용하기 때문에 사용자가 원하던 단어와 철자만 일부 비슷하고 뜻은 전혀 다른 단어가 출력되어 내용을 확인하지 않고 상대방에게 메세지를 보낼 경우 오해가 폭증하는 현상을 겪을 수 있다. 게다가 자동완성은 꼭 존재하는 단어로만 수정하기 때문에 상대방이 엉뚱한 오해를 할 확률이 말을 못 알아듣고 다시 물어볼 확률보다 압도적으로 높다. 이런 문제는 영어뿐만 아니라 많은 언어에서 벌어진다. 대표적인 예로는 슈슉 슈숙. 슉. 시. 시발럼아.가 있고 나스닥말좆양봉호로섹스출발도 있다. 디시인사이드 1, 아카라이브 1, 에펨코리아 1, 개드립넷 1 2 등에도 관련 글이 올라오며 구글에 Autocorrect fails를 검색해 보면 자동완성의 각종 폐해를 체험해 볼 수 있다.

따라서 번거롭더라도 자동완성 기능을 끄고 직접 입력하는 습관을 들이는 게 좋다. 전술했듯이 자동 완성 사용했다가 이상한 단어가 나온 줄도 모르고 보냈다가 타인에게 오해를 살 수 있기 때문이다.

3.3. 개인정보 노출

유튜브 알고리즘과 마찬가지로 평소에 어떤 것을 검색했는지에 대한 정보가 그대로 드러나기 때문에 사생활 노출 위험이 있다. 실제로 수사할 때 용의자의 흉기, 독극물 등 범죄 관련 검색 기록은 범죄자를 특정하여 수사망을 좁히는 데 도움이 된다. 언론 기사 중 범죄 사건을 다룬 기사에서는 "피의자의 포털 사이트 검색 기록에서 범죄 관련 키워드가 여럿 발견되어..." 류의 내용을 많이 볼 수 있다.


[1] 미국에서는 Autocorrect와 Autocomplete의 사용에 엄밀히 구분을 짓는다. 보통은 스마트폰에서 이미 입력한 단어를 비슷한 철자 혹은 사용자가 많이 사용하는 단어로 자동 변환하는 경우를 Autocorrect라고 하며 검색엔진에서 단어 뒷부분이나 추가 키워드를 예측해서 보여주는 경우 혹은 코드 자동완성은 Autocomplete라고 한다. [2] 미국에서 Autocomplete라는 단어가 사용되지 않는다는 말은 틀렸다. 당장 미국의 유명한 테크놀로지 잡지 WIRED의 공식 유튜브 채널에서 제일 인기 있는 코너 중 하나가 연예인 이름을 검색했을 때 구글 검색 엔진 자동완성(Autocomplete)이 보여주는 질문을 해당 연예인에게 직접 물어보는 인터뷰 시리즈다. [3] 다만 오타 교정은 어디까지나 자동적으로 이루어지는 것이기 때문에 저명성이 떨어지는 일부 검색어들은 시스템이 오타로 인식하고 다른 단어로 교정하는 경우가 종종 있다. [4] 하지만 포털 사이트들도 바보는 아니기 때문에 어설프게 비정상적인 검색을 시도하면 당연히 자체 알고리즘에 의해 걸러지게 된다. 그야말로 검색어 조작을 위해 전문적인 수단(프로그램 등)을 총동원하는 사람들에게만 해당되는 이야기다.

분류