|
IBM 컴퓨터에 구형 8인치 플로피 디스크를 삽입하여 읽는 모습. |
[clearfix]
1. 개요
디지털 암흑시대( Digital Dark Age)란 소프트웨어 및 하드웨어 기술의 급격한 발전으로 인해 도태된 방식의 디지털 데이터에 접근할 수 없게 되면서, 역설적으로 디지털 시대의 역사적 정보가 부족해지고 지식이 매몰되거나 소멸하는 현상을 가리키는 용어다.2. 역사
이 용어는 정보가 디지털 형식으로 전송되고 원본 복사본이 손실되기 때문에 디지털 시대에 기록이 부족할 수 있다는 의미의 'Dark Age( 암흑시대)'라는 용어에서 유래되어 1997년 국제도서관협회 및 기관연맹(IFLA) 회의에서 처음으로 언급되었다. 그리고 1998년 롱 나우 재단(Long Now Foundation)과 게티 보존 연구소(Getty Conservation Institute)가 공동으로 후원한 Time and Bits 컨퍼런스에서도 언급되었다.우리는 DVD에 수록된 영화가 얼마나 오래갈지 아직 모른다. 다만 너무 많이 재생하면 가끔 먹통이 된다는 사실만 안다. 플로피 디스크도 얼마나 오래가는지 확인할 시간이 충분치 않았다. 왜냐하면 금방 CD와 반복해서 쓸 수 있는 CD-RW로 대체되었고, 이것들은 다시 현재 어디서나 사용되고 있는 USB에 자리를 내주었기 때문이다. 다양한 데이터 저장 매체들이 사라지면서 그것을 읽을 수 있는 컴퓨터도 사라졌고(여전히 플로피 디스크를 사용하는 구형 컴퓨터를 가진 사람은 아마 없을 것이다)[1], 모든 자료를 그때그때 출시되는 최신 저장 매체로 제때 옮겨 놓지 않은 사람은(아마 2~3년마다 한 번씩 그래야 할 것이다) 구형 매체에 저장된 자료를 잃고 말 것이다. 사라진 데이터 저장매체를 사용할 수 있는 구형 컴퓨터를 아직 창고에 보관하고 있다면 몰라도.
따라서 모든 기계적, 전기적, 전자적 데이터 저장매체에 대해 우리는 이렇게 단언할 수 있다. 그 매체들은 새로운 것에 밀려 시장에서 재빨리 사라지고, 그래서 우리는 그것들의 수명을 확인할 시간이 없다. 아니, 어쩌면 영원히 그것을 확인할 기회가 없을지 모른다.
움베르토 에코, '저장매체의 불안정성에 관하여'
따라서 모든 기계적, 전기적, 전자적 데이터 저장매체에 대해 우리는 이렇게 단언할 수 있다. 그 매체들은 새로운 것에 밀려 시장에서 재빨리 사라지고, 그래서 우리는 그것들의 수명을 확인할 시간이 없다. 아니, 어쩌면 영원히 그것을 확인할 기회가 없을지 모른다.
움베르토 에코, '저장매체의 불안정성에 관하여'
소설가 움베르토 에코는 이에 관한 다큐멘터리 촬영의 일환으로 2012년 7월 2일 루브르 박물관의 장서각 2층에서 난간 아래로 저서 ' 장미의 이름'과 함께 아마존의 전자책 기기 킨들을 떨어트리는 퍼포먼스를 선보였다. # 그의 종이책은 조금 구겨지기는 했지만 멀쩡했고, 반대로 전자 기기는 작동할 수 없을 정도로 부서졌다. 에코는 이에 대해 '종이책의 소멸을 말하는 시대지만, 전자책 역시 내부에 100권이 들어 있든 1000권이 들어 있든 이렇게 취약하다'고 해설했다.[2]
3. 원인, 보완책/해결책
데이터의 형태로 저장되는 모든 정보에 해당된다. 따라서 순수 텍스트뿐만 아니라 전자 문서, 사진, 비디오, 오디오 등도 같은 위험을 지닌다.유네스코 국제기록유산센터 컨퍼런스에서 여러 사례가 언급되었다.
3.1. 단종된 하드웨어
데이터를 읽는 데 특별한 하드웨어가 필요한 물리적 미디어에 저장되며 문서가 작성된 시점으로부터 수십 년 이내에 이 하드웨어를 사용할 수 없다는 뜻이다. 설령 해당 물건을 다시 만들 수 있다고 해도 시간과 비용이 엄청 많이 소모된다.대표적인 예시로 5.25인치 플로피 디스크를 읽을 수 있는 컴퓨터를 구할 수 없는 경우가 있다. 또한 최초의 한글판 윈도우인 한글 윈도우 2.1은 출시 당시에는 많은 관심을 받지 못해 구입한 사람이 극소수였고, 현재는 단 한 카피만이 실물로 남아 있다고 알려졌다. 파일은 덤프되었지만 소유자가 파일 공개/디스크 기증을 안 해서 5.25인치 플로피 디스크에 담겨 있는 만큼 시간이 더 지나다 보면 디스크가 망가지고 파일이 유실될 수도 있다.
백남준의 다다익선도 이와 비슷한데, CRT가 단종된 이래로 관련 부품이 줄어 제대로 고칠 수 없게 되면 LCD 등으로 바꿀 수밖에 없게 된다. 다만 백남준이 그래도 상관없다 말했다고 증언한 사람이 있다.
3.5인치 플로피 디스크, CompactFlash처럼 오래도록 사용된 규격이면 그나마 낫겠지만, 망한 규격이면 더 심각하게 몇 년 전에 출시된 물건인데도 호환되는 기기가 전무하기도 하다.
3.2. 컴퓨터의 갑작스러운 고장
일반 데스크톱 컴퓨터야 SSD 등 저장 장치 자체가 고장난 게 아닌 이상 메인보드 등 다른 부품이 고장나도 SSD 등을 다른 컴퓨터에 물려서 저장된 자료를 찾을 수 있지만, 이를테면 스마트폰을 쓰면서 사진 앱 자료 등을 내장 메모리에 저장했는데 메인보드 등 다른 부품이 고장나도 그 자료를 찾기 어려워진다. SD카드 장착 안 되는 스마트폰이면 답이 안 나온다.3.3. 저장매체의 불안정성
- 보완책: 장기보존이 가능한 매체 사용
게다가 전자 저장 매체의 자력이 훼손되는 데는 합선이나 정원에 내리친 번개, 또는 그보다 훨씬 더 일상적인 불운만으로 충분하다. 만일 블랙아웃이라도 좀 길게 지속되면 나는 어떤 하드 디스크도 사용할 수 없을 것이다. 내 전자 기억 장치에 아무리 돈키호테 작품 전체가 들어 있더라도 그걸 촛불 아래서나 해먹, 보트, 욕조, 그네에서는 읽을 수 없다. 반면에 아무리 불편한 상황에서도 책은 내게 그것을 허용한다. 또한 노트북이나 전자책 리더기가 6층 창문에서 떨어지면 나는 수학적 확률상 모든 걸 잃을 각오를 해야 하지만, 종이책이 떨어졌다면 기껏해야 모서리에 조금 손상이 갈 뿐이다.
저장매체의 불안정성에 관하여
저장매체의 불안정성에 관하여
로제타 석이나 고대의 돌에 새겨진 문헌들은 정보의 분량에 비하면 부피가 엄청나지만 3~4천 년을 그대로 버텨 왔고 앞으로도 보관하기에 따라 그 수명은 준영구적이다. 기록의 기술이 발달하여 종이보다 먼저 나타난 양피지는 기본 수백 년의 기대수명을 보인다. 혁명적인 저장매체인 종이, 특히 전통 방식으로 제조된 중성지는 온습도만 맞추면 저장된 지식과 정보가 최소 100년 정도에 많게는 5백~1천 년 정도 보존되고, 사진술로 개발된 마이크로필름은 흑백판이면 최대 700년 정도 기대수명을, 컬러판이면 수명이 100년 정도 기대수명을 자랑하며, 더욱 오래가는 디지털 시대 초기 매체이자 아날로그 방식인 마그네트 밴드가 수십 년간 보관될 수 있다.
도서관 하나가 소장하고 있는 장서를 CD 몇 장으로 압축해서 저장할 수 있을 정도로 저장매체의 기술이 발달했지만 저장매체의 정밀도가 너무 높아졌기 때문에 작은 손상에도 쉽게 많은 양의 데이터가 손실될 수 있다는 단점이 생겼고, 저장매체의 수명도 줄어들었는데 싸구려 저장매체는 5~10년이면 망가져 버려 저장된 정보가 사라져 버리는 경우도 있다.
디지털 정보는 얇디얇은 막에 기록되어 있어 지구자석은 물론이고 가까운 오디오 기기 자석에도 손상되기 쉬우므로 엄청난 자산과 노력의 투입으로 얻어진 귀중한 정보, 지식이 허무하게 사라져 버리는데 전자 데이터란 너무 예민하여 몇 백 메가 용량의 정보 중 일부만 유실되어도 모두 무용지물이 되어 버릴 가능성이 있는 데에 문제의 심각성이 있다.[3]
백업용 스토리지로 SSD보다 LTO나 HDD가 선호되는 것도 비슷한 이윤데, 기록보존기술은 편리성보다 경제성과 저장성을 우선하지만, 디지털 저장매체는 최신 기술일수록 저장수명이 짧다. 수명은 대체로 자기테이프>HDD>SSD로 보며, 특히 SSD는 기대수명이 너무 짧다는 이유로 아직도 디지털 아카이빙에서 선호되지 않는다.
HDD는 자성 기록 장치 특성 탓에 물리적인 충격에는 약하되 그 특성 덕에 고장나면 돈은 들어도 일부라도 복구할 가능성이 다소 있으나, SSD는 메모리 셀의 화학적 특성을 이용하기 때문에 물리적인 충격에는 강하되 전기적 충격이나 온도 등으로 인하는 화학적 특성 변화에 약하며 SSD의 셀 수명을 위하는 분산 기록 기술인 마모 평준화(Wear Leveling) 작업이나 쓰레기 수집, 인터리빙 등의 기술 때문에 컨트롤러 단에서 매우 복잡하게 데이터를 분산하므로 이하 계층에는 분석이 까다로워 복구 작업이 매우 까다롭다. 이런 문제들 때문에 데이터 손실이 생기면 복구하기 매우 어렵다.
아무 컴퓨터 파일을 메모장으로 열고 한 글자만 바꿔도 파일이 안 열리는 것을 경험할 수 있는데, 이건 파일 무결성 검사가 통과되지 않았거나 해석 도중에 오류가 발생한 것으로서 파일 전체가 망가졌다는 뜻이 아니라 컴퓨터 자체에서 이 파일은 손상되었으니 사용할 수 없다고 친절하게 알려주는 것이다.
다만 디지털 시스템에서 조그만 손상만으로도 정보 전체를 못 쓰게 되어 버린다는 것은 오해다. 물론 위 글이 쓰인 당시에는 하드 디스크나 플로피 디스크를 제외하면 저장매체가 CD 정도였고 이른바 ' 뻑'이 났으면 그 CD는 쓸 수 없었기에 대체로 사실이었지만, 현재의 기술력으론 몇 비트 날아간 정도는 적절한 처리를 해 주면 되살릴 수 있다. 일부 파일이 손상되어도 민감한 소프트웨어의 소스 코드라고 하면 몰라도, 음성이나 영상 데이터라고 하면 못 알아볼 정도로 손상을 입지는 않는다. 경찰에서도 날아간 CCTV나 블랙박스를 복원하는 작업을 주로 한다. 청해진해운 세월호 침몰 사고를 조사하면서 바다에 침수돼 있던 블랙박스와 CCTV를 복원해 낸 사례도 있다. 파일의 종류별로도 복구 난이도가 다른데, 압축률이 높을수록 기록밀도가 높아져서 같은 양의 유실이라도 손상을 크게 입고 복구가 어려워진다. 무압축 파일이라면 난이도가 낮은 편으로 유실된 딱 그 부분만 손실되고 나머지 부분은 문제 없이 읽을 수 있다.
광학 드라이브는 M-DISC처럼 무식하게 물리적 특성을 강화하고 패키징을 잘 한다면 장기보존 매체로 만들 수 있다.
3.4. 구식화된 파일 형식
구식화된 파일 형식도 파일을 읽을 수 있는 필요한 소프트웨어를 찾을 수 없기 때문에 특히 사유 파일 형식을 사용할 때 문제가 된다. 해당 소프트웨어를 단종시켰다고 해도 그 소프트웨어가 엄연히 돈 받고 파는 상품이고 이해관계가 얽혀 있어 쉽게 사용권을 풀 수 없다. DRM에도 이런 문제가 있다.더구나 해당 소프트웨어가 크로스 플랫폼조차 아니면 악랄함은 배가 된다. 그러나 구식화된 파일 형식 가운데 개발 때 크로스 플랫폼을 고려하지 않은 것이 태반이다.
3.5. 사라진 웹사이트/인터넷 서비스
웹사이트 관련 하드웨어나 소프트웨어가 구식화되거나 관련 업체의 사업 철수나 관리자의 사망 등의 이유로 관련 업체 운영이 어려워져 웹사이트가 폐쇄되거나 인터넷 서비스가 종료되기도 하고, 이래서 데이터가 유실되어 볼 수 없게 되는 것이다. 후자는 기술적인 문제는 아니지만 엄연히 데이터 보존 및 유실과 관련이 있다.영업 이익 부실 등 상업적 문제, 관리자의 신변 문제 등으로 인터넷 쪽 사업을 철수하는 업체는 따로 데이터를 보관해두지 않고 파기하는 경우가 많고, 이래서 영영 볼 수 없게 되는 경우가 많다.
예시로는 엠엔캐스트, 티비플, 다음 블로그, 이글루스 등이 있다. 이들은 모두 폐쇄되거나 서비스를 종료하였고, 그때마다 사용자들이 수동으로 백업하지 않은 많은 데이터들이 사라졌다. 이제는 볼 수 없는 데이터는 물론이고, 있었는지도 모른 채로 사라져버린 데이터는 수도 없이 많을 것이다. PC통신 게재 자료들은 비용 대비 서버 용량이 부족해서인지 일정 기간이 지나면 글이 지워지도록 되어 있었다.
어떤 웹사이트나 특정 인터넷 서비스를 통해야만 프로그램 내용을 읽을 수 있기도 한데 그 웹사이트가 대책 없이 사라지기도 한다. 그래서 어도비에서는 포토샵 CS2 정품 소유자에게 포토샵 CS2를 무료로 배포했다.
피처폰 시절의 수 많은 모바일 게임들도 이에 해당할 수 있다. 일부 작품들은 스마트폰용으로 이식되면서 명맥을 유지하기도 했으나, 대다수 고전 모바일 게임들은 피처폰용 인터넷 지원이 종료되어 역사 속으로 영원히 사라져 버리고 말았다. 이렇게 유실된 고전 모바일 게임 중 가장 대표적인 게 요구르팅 모바일. 그나마 중고거래로 모바일 게임들이 설치된 피처폰들이 고가에 거래되는 경우가 간혹 있다.
3.6. 지식재산권 문제
이쪽은 주로 OTT나 ESD에서 발생하는 문제점이다. 이러한 플랫폼은 상술된 사라진 웹사이트 사례와 달리 운영상 이유가 없대도 역사적 가치를 지닌 작품을 보관하고 이용자들이 언제든 이용할 수 있게 하는 ‘아카이빙’에 별로 관심을 못/안 줄 수밖에 없는데, 디지털 아카이빙에도 돈이 들기 때문이다. 다시 말해 저작권 수수료를 지불하는 데도, 데이터를 보관하는 데도 돈이 드는 것이다. 그러니 저작권 수수료는 많이 드는데 보는 사람은 별로 없는 영화들은 지워나갈 수밖에 없다. #3.7. 아날로그 사례
사실 몇몇 문제는 아날로그에도 해당한다. 20세기에는 영화나 텔레비전 방송 프로그램들이 손실되는 경우가 잦았는데, 특히 TV 프로그램은 비디오 테이프가 너무 비싸서 아예 생방송으로만 방송한 경우도 많았고, 녹화방송이 필요했을 때는 비디오 테이프 대신은 영화필름을 사용해 촬영했지만 방송사에서 필름 관리를 철저히 안 했기 때문에 대부분 소실된 경우가 많다. 최근에는 방송사 차원에서 시민들을 상대로 당시 프로그램을 녹화한 테이프를 찾는 동시에 VCR 장비가 소실될 것에 대비하여 기존 비디오 영상을 디지털화하는 작업을 한다.유명한 사례 가운데 하나로 NASA의 자기테이프가 있다. 이 테이프는 1976년 바이킹 화성 탐사선의 착륙 시기에 사용한 테이프인데 당시 연구원들은 해당 테이프의 내용물을 다른 매체에 옮기지 않고 그대로 테이프만 보존했다. 약 10년 뒤 나사에서 해당 자료를 열람하려고 시도했으나 해당 테이프와 기록 장치는 이미 구식이 된 지 오래되어 버렸고 관련 장비를 다룰 수 있는 기술자와 프로그래머는 전부 사망하거나 나사 밖으로 떠나서 열람이 불가능했다. 그래서 몇 달 동안이나 관련 자료를 싸그리 뒤지면서 해당 테이프와 기록 장치의 작동법을 알아내기 전까지 그 누구도 그 어떤 기계도 이 테이프를 읽지 못했다.
또 다른 사례로 1986년 BBC 둠스데이 프로젝트(BBC Domesday Project)가 있다. 둠즈데이 북 900주년을 맞아 BBC는 여러 컴퓨터 회사들과 합작하여 영국의 각종 '설문 자료(surveys)'들과 방대한 시각적 자료를 취합하는 프로젝트를 실시했다.[4] 이 야심찬 프로젝트의 최종 완성본은 당시는 현역이었던 레이저디스크에 저장되었는데 2002년 경에 디스크와 소프트웨어, 기록 장치가 서서히 도태되어 가면서 훗날에 디스크의 보존 상태를 떠나 자료 자체를 읽지 못할 수 있다는 의견이 제기되었다.[5] 이에 BBC 측은 CAMiLEON 프로젝트를 통해 해당 자료들을 SCSI를 거쳐 리눅스 PC로 옮기는 데 성공했다. 여기서 파생된 프로젝트 Domesday 1986는 지금도 이어지며 레이저디스크 원본의 디지털화 및 관련 컴퓨터 시스템용 에뮬레이션 소프트웨어 개발 등을 다룬다. 예를 들어 2021년 경에는 해외의 유명 아카이브 사이트인 https://archive.org를 통해 레이저디스크 원본들을 공개하였다. #
3.8. 기타 보완책/해결책
-
국제표준의 제정과 양식의 통일
3.1, 3.4, 3.5번 문단에 해당한다. 국제표준을 제정해서 통일한다면 누가, 또는 어느 기업에서 작성하든/제조하든 표준 하드웨어/소프트웨어만 갖고 있대도 그걸로 문제 없이 읽어낼 수 있다. USB 등이 하드웨어의 사례이고, 그 유명한 PDF가 소프트웨어의 사례인데, 후자는 수정할 수는 없어도 거의 대부분의 장치에서 읽을 수 있기 때문이다.
-
에뮬레이터 등 호환 하드웨어 및 소프트웨어/
오픈 소스 개발의 활성화
3.1, 3.4, 3.5번 문단에 해당한다. 최신 기술을 사용하는 하드웨어/소프트웨어를 사용해서 과거 기록을 열람하고 이용할 수 있게 하는 방법이다. 모토로라 68000을 에뮬레이션하는 모듈이 하드웨어의 사례이다. 특히 소스 코드가 누구나 열람할 수 있게 되어 있으면 그 소스 코드를 만든 사람 밖의 누가 이를 이용해 호환 프로그램을 만들 수 있고 프로그램 자체가 관심을 계속 받으면 잊어지지 않는다. 어도비 플래시는 어도비가 플래시 사용을 막아버려서 많은 플래시 게임들이 비슷한 처지가 될 가능성이 있었으나 오픈 소스 기술을 사용해 어도비 플래시 에뮬레이터를 만들어 살려냈다. 다만 소스 코드조차 잊어져 있기도 하고, 악용의 가능성이 언제든지 있기 때문에 GNU 일반 공중 사용 허가서 같은 안전장치를 마련해 두는 것이 일반적이다. 피처폰 게임 일부는 백업되어 있긴 하나 J2ME/MIDP 에뮬레이터에선 구문 오류 등 호환성 문제로 실행할 수 없다.
-
웨이백 머신 이용, HTML/PDF 문서로의 백업, 스크린샷
그나마 개인 단위에서 해볼 수 있는 대안으로, 웹사이트 문서 백업을 전문으로 하는 서비스를 이용하거나 개인적으로 웹사이트 내용을 파일화하여 저장하는 것이다.
4. 관련 글·문서
- 인터넷 아버지 "디지털 암흑 시대 온다" 경고…왜?
- 구글 부사장 '우리는 모든 기록들을 잃어버릴 지도 모르는 디지털 암흑시대에 살고 있다'
- 계획적 구식화
- 단종
- 로스트 미디어
- 에뮬레이터
- 오래된 컴퓨터의 관리
- 유행: 특히 유행을 쫓다 보면 기존 작품에 무관심해지고, 그러다 보면 해당 작품은 잊어지기 마련이다.
- 창작물의 반영 오류: 로스트 미디어와도 유관한 문제로, 유실된 데이터는 당연히 그대로 반영할 수 없으니 이런 오류는 당연한 셈이다.
- 플래시 게임
- GFWL
[1]
2024년 기준으로 아직도
플로피 디스크를 읽을 수 있는 개인 컴퓨터는 있지만, 전체적으로 볼 때 사실상은 사장된 매체긴 하다.
[2]
지진에 취약하다는 의미. 종이책은
화재에 취약하대도 제대로 된 진압과 관리, 대응체계만 갖추면 피해갈 수 있지만, 전자책을 저장하는 데이터 같은 건 관리나 대응체계만으로 피해갈 수가 없다. 또한 종이책은 화재 진압에 따라 건질 가능성이 있으며 물리적으로 존재하기 때문에 직접적인 피해만 없다면 별 문제 없으나, 전자책 쪽의 데이터는 일단 해를 입으면 영구손상 확률이 높으며 경우별로는 재난이 아닌 인재, 특히 크래커 같은 공격자가 작정하고 크래킹을 걸면 데이터 자체가 폭탄이 되어 전방위적으로 다른 데이터로까지 해를 확산시킬 수 있는 공격에 당할 수 있다.
[3]
이원복, 《
현대문명진단》(양지사), '많이는 기억해도 오래는 못 한다!'. 36쪽
[4]
'설문 자료'란 당시 영국의 지리, 역사, 사회적 문제, 또는 일상에 대하여 작성한 글로 구성되어 있다. 이 글들은 대부분 당시의 학교를 다니던 아동들의 작품이다. 시각적 자료로 각종 컬러 사진, 도표, 영상 등의 방대한 자료들도 첨부되어 있다.
[5]
1986년이 얼마나 옛날인가 하면 현재 애니메이션에 쓰이는 GIF 포맷이 발표된 것이 1987년이고 현역으로 쓰이는 JPEG 포맷이 발표된 것이 1992년이다.