mir.pe (일반/밝은 화면)
최근 수정 시각 : 2023-12-20 17:16:33

정보검색

1. 정보검색의 개요2. 정보검색의 역사
2.1. 초기 정보검색 (1940년대)2.2. 1950년대, 정보검색 발전2.3. 1960년대, 정보검색 변화2.4. 1970년대, 온라인 정보검색2.5. 1980년대, 정보검색과 기술 발전2.6. 1990년대, 인터넷과 정보검색2.7. 2000년대 이후, 도전과 변화
3. 정보검색시스템
3.1. 정의3.2. 구성요소3.3. 색인의 종류3.4. 적합성 피드백(Relevance Feedback)
4. 정보검색시스템 유형
4.1. 데이터 검색 시스템 (Data Retrieval System)4.2. 참조 정보검색시스템 (Reference-Retrieval System)4.3. 전문 검색시스템 (Text-Retrieval System)4.4. 질의응답시스템 (Question-Answering System)4.5. 지능형 정보검색시스템 (Intelligent Information Retrieval System)
5. 학술정보 데이터베이스

1. 정보검색의 개요

정보검색(Information Retrieval, IR)이란, 수집된 정보를 분석, 조직, 표현, 그리고 축적하여, 이를 기반으로 사용자가 필요한 정보를 찾을 수 있게 해주는 과정 전체를 의미한다. 이 과정은 주로 정보의 축적과 검색으로 나누어진다.

일반적으로 사람들이 "정보검색"이라고 생각할 때는 협의의 개념, 즉 정보를 찾는 행위만을 의미하는 경우가 많다.

위키피디아의 정의에 따르면, 정보검색은 문헌의 내용, 문헌 자체, 메타데이터, 데이터베이스의 정보 찾기 등을 포함한다.
<colbgcolor=#0079c1><colcolor=#fff> 정보검색과 관련된 기타 용어
데이터 검색(Data Retrieval) 정확한 질의어로 조건에 맞는 결과를 찾는 것. 예시: ISBN으로 서지데이터베이스에서 검색.
문헌 검색(Document Retrieval) 주어진 질의어를 만족시키는 데이터보다는 특정 주제와 관련된 정보를 찾는 것이 목적이며, 대부분 자연어 텍스트 기반으로 검색된다.
<colbgcolor=#0079c1><colcolor=#fff> 정보검색의 구성요소
인적요소 정보의 최종이용자, 생산자, 색인자, 전문 정보검색자 등
물적요소 축적된 정보와 이를 통한 정보검색시스템[1]

2. 정보검색의 역사

<rowcolor=#fff> 연대 개요 주요 역사
1940년대 수동, 반기계화된 시스템 Bush Memex
1950년대 정보검색 이론 및 실험의 기틀 마련, 최초의 컴퓨터기반의 검색시스템 개발 Taube의 유니시스템, Luhn의 KWIC색인과 단어 출현 빈도
1960년대 컴퓨터의 본격적 활용, 오프라인 배치 시스템 MEDLARS 배치 검색 서비스 및 크랜필드, SMART 등의 대규모 검색 실험 실시
1970년대 온라인 검색 시스템 다수 개발 MEDLINE, DIALOG, ORBIT, LEXIS 등의 온라인 서비스 시작
1980년대 대규모의 온라인 데이터베이스 데이터통신, CD-ROM의 활용 다양한 데이터베이스 산업의 급성장
1990년대 인터넷(WWW)의 등장 온라인 데이터베이스의 원격 접근, 네트워크를 통한 타도서관의 OPAC 접근
2000년 ~ 현재[2] WWW의 급성장, 디지털 도서관의 등장 웹 자원과 디지털 자원의 확대, 디지털 도서관 구축, 웹 기반 데이터베이스, 웹 기반 OPAC 시스템
정보검색(Information Retrieval)은 Calvin N. Mooers가 1950년에 문헌에서 처음 언급한 개념이다. 그러나 그 이전부터 반기계화된 검색시스템이 존재하였다.

2.1. 초기 정보검색 (1940년대)


정보검색의 개념은 1950년 Calvin N. Mooers에 의해 처음 소개되었지만, 이전부터 반기계화된 검색 시스템이 있었다.

1940년대 학문의 발전과 문헌 증가로 정보검색 시스템의 필요성이 대두되었다. 1945년, Bush, Vannevar는 'As We May Think'에서 Memex라는 기계를 제안하였다. 이 기계는 오늘날의 검색시스템의 원형인 연상색인법을 활용하였다.

2.2. 1950년대, 정보검색 발전

1950년대는 정보검색 분야의 기틀을 마련하는 중요한 시기였다.

1951년, Taube, Mortimer는 연상색인법을 바탕으로 유니시스템을 구현하였으며, 이는 키워드 색인 방식을 최초로 도입한 시스템이다.

1954년에는 컴퓨터를 활용하여 최초의 검색을 시도하였고, 이는 현대의 정보검색시스템의 발단이다.

1950년대 후반, Luhn, Hans Peter는 KWIC 색인을 제안하며 통계적 기법을 도입하였다. 이후의 연구는 단어 출현 빈도를 중심으로 진행되었다.

2.3. 1960년대, 정보검색 변화

1960년대에는 컴퓨터의 본격적인 도입과 함께 오프라인 배치검색 서비스가 시작되었다. 대표적으로 미국 의학도서관의 MEDLARS와 이후 MEDLINE, 그리고 크랜필드 실험 등이 이 시기의 주요 연구였다.

2.4. 1970년대, 온라인 정보검색

1970년대에는 대규모 데이터베이스와 온라인 정보검색 시스템이 등장하였다. 한국에서는 TECHNOLINE, 일본에서는 JOIS-I가 서비스되었다.

2.5. 1980년대, 정보검색과 기술 발전

1980년대에는 개인용 컴퓨터, CD-ROM 등의 기술 발전과 함께 데이터베이스가 급증하였다.

2.6. 1990년대, 인터넷과 정보검색

1990년대는 인터넷의 등장과 함께 정보검색 분야에 혁명이 일어났다. 디지털 자원의 대량화와 디지털도서관의 등장은 정보검색을 획기적으로 발전시켰다.

2.7. 2000년대 이후, 도전과 변화

최근의 연구는 텍스트 위주의 검색에서 멀티미디어 검색 시스템으로의 발전을 추구하고 있으며, 디지털 도서관의 활용성과 접근성을 높이는 방향으로 연구가 진행되고 있다.

정보검색 분야의 발전은 지속적이며, 디지털 시대의 요구와 기술 발전에 따라 변화하고 있다.

3. 정보검색시스템

3.1. 정의

정보검색시스템은 도서관의 소장 문헌 검색을 위한 출발점으로, 이용자가 필요로 하는 정보를 수집, 가공, 논리적 축적 후, 정보요구 발생 시 적합한 정보 제공하는 시스템이다.

3.2. 구성요소

3.3. 색인의 종류

3.4. 적합성 피드백(Relevance Feedback)

검색의 질과 양 개선을 위한 방법.

명시적 피드백과 암묵적 피드백으로 구분.

4. 정보검색시스템 유형

정보검색시스템은 검색 대상의 정보 유형, 데이터베이스 구축 방법, 검색 방식 등에 따라 주로 다섯 가지로 분류될 수 있다.

4.1. 데이터 검색 시스템 (Data Retrieval System)

4.2. 참조 정보검색시스템 (Reference-Retrieval System)

4.3. 전문 검색시스템 (Text-Retrieval System)

4.4. 질의응답시스템 (Question-Answering System)

4.5. 지능형 정보검색시스템 (Intelligent Information Retrieval System)

5. 학술정보 데이터베이스



[1] 데이터베이스, 검색엔진, 인터페이스 포함 [2] 예전: 재현율 중요시, 최근: 정확율 중요