mir.pe (일반/밝은 화면)
최근 수정 시각 : 2023-03-10 17:41:48

사운덱스

1. 개요2. 변환 과정3. 장점

1. 개요

사운덱스 또는 Soundex는 유사한 발음을 가진 미국인의 이름을 검색하기 위해 색인화 하는 음성 알고리즘이다. 20세기 초 미국의 로버트 C. 러셀과 마거렛 킹 오델이 개발하였다.

사운덱스는 1글자의 알파벳과 3자리의 숫자로 구성되어 있으며, 사소한 철자의 차이가 있더라도 비슷하게 발음되는 이름들을 컴퓨터의 도움 없이 비교적 손쉽게 검색할 수 있어 20세기 미국 인구조사에서 널리 활용되었다.

2. 변환 과정

3. 장점

발음을 알지만 정확한 스펠링을 모르는 이름을 손쉽게 검색할 수 있다. 예를 들어 Jonson Johnson은 똑같은 발음으로 읽히지만 정확한 철자를 알지 못하면 한 번에 검색에 성공하지 못할 가능성이 있다. 하지만 이들의 성씨를 사운덱스로 코딩하면 모두 J525로 코딩되므로, 정확한 철자를 몰라도 Jonson과 Johnson을 한 번에 찾아낼 수 있으며 비슷한 발음의 Janssen 등과 같은 이름도 함께 찾을 수 있다.