1. 빅 데이터 프로세싱 쪽의 buzzword
빅 데이터의 특징을 언급할 때 가트너그룹의 "3V"에서 분석의 정확성 부분을 추가하여 흔히 4V가 거론된다.가트너그룹에서 빅 데이터의 특성을 3V(Volume, Variety, Velocity)로 정의하였으며, 학계와 산업계의 지속적인 연구와 개념정의를 하다 보니 빅 데이터에 대한 정의가 추가되고 있는 것. 빅데이터는 활용되는 목적에 따라 정의가 달라질 수 있으므로 우선은 빅 데이터에 대하여 포괄적이고 개념적으로 이해하는 것이 필요하다.-
Volume(규모)
대용량이다. 일례로 페이스북이 하둡(Hadoop) 데이터베이스에 저장하는 사진문서 용량이 30페타바이트(대략 30,000TB)에 이른다. 뉴욕 증권거래소는 매일같이 1TB에 해당하는 데이터를 쏟아낸다. 좀 더 극단적인 예를 들자면, 우리나라 전국 각지의 골목길마다 설치된 CCTV 영상 수년치 분을 데이터로 취합한다고 상상해 보자. -
Variety(다양성)
흔히 비정형적 데이터(Unstructured Data)로 불리는 것들, 즉 계량화(수치화)가 힘든 데이터도 포함하는 것이다.[1] -
Velocity(속도)
어마어마한 데이터가 아주 짧은 시간에 생성되고 사라지며, 아주 짧은 시간 동안만 유의미하다. 데이터를 처리하는 관점에서 보더라도, 이런 어마어마한 양의 다양한 데이터를 분석하려다 보니 과거의 느린 데이터 마이닝 속도나 분석 속도로는 어림없다. 빅 데이터가 적시에 유용한 정보를 뽑아내기 위해서는 당연히 속도가 빨라야 한다. -
Veracity(정확성)
표본이 크므로 정확도가 높다.
-
Value(가치)
빅 데이터 분석을 통해 도출된 결론은 기업이나 조직의 당면한 문제를 해결할 수 있어야 하며 통찰력 있는 유용한 정보를 제공해야 한다.
한병철 교수 (철학과, 하이데거 전공으로 박사학위 수여) 의 저서 《심리정치》 에서는 빅 데이터에 대해 대륙권 지성의 처지에서 매우 부정적인 견해를 피력하고 있다. 그런데 그의 책에서 놓친 점이 있는데, 위에서 언급한 비정형적 데이터라는 개념을 논의에 포함하지 않음으로써, "빅 데이터는 양적 분석이 질적 분석을 정복해 버리려는 움직임이며, 마치 통계학에 대한 과신과도 같다" 는 잘못된 결론을 내렸다는 것이다. 위의 V자 단어들을 다시 보자. 빅 데이터는 그 자체로 다양성(variety)을 갖고 있기 때문에 양적 데이터든 질적 데이터든 더 이상 가리지 않으며, 이를 통해 결과를 정량적 숫자로 보여주는 것 또한 아니며 도리어 가치(value)를 창출한다. 다만 한병철의 글은 인문학적인 것이니만큼 질적인 내용 한 두 개의 가치를 알자는 것이지 질적 분석을 놓쳤다는 것이 아니다. 빅데이터는 질적 분석 역시 대량으로 접근하는데 한병철은 아주 우수한 문학 작품 한 두 개의 가치를 말하고 있는 것이다.
2. 포켓몬스터 용어
포켓몬스터에서 포켓몬이 지닌 개체치 중 세 종류가 최고치일 때 표현하는 말. 야생에서 조우할 확률은 1/32768이다. (이 수치는 최고인 개체치의 종류를 한정했을 때로, 정확히는 148955/268435456, 약 0.055%이다)5세대까지는 부모로부터 개체를 최대한 좋게 유전받아도 확정은 3V가 한계였기 때문에 핵심 능력치 3V에 나머지 필요한 개체치가 평균 이상이면 실전으로 채용하는 게 마지노선이었다. 실전용도 공격, 방어, 스피드만 V거나 체력, 공격, 방어만 V인 3V 실전용도 지겹도록 볼 수 있다. 대개는 공격/특공, 스피드, 체력이나 내구 중 한 쪽이 V인 것을 상정하며 뽑는다.
하지만 6세대 포켓몬스터 X·Y한정으로 알미발견 그룹은 확정 3V로 조우하기 때문에 알미발견 그룹에 한해서는 엄청 흔해졌고, 6세대 이후로 빨간실의 교배 효과 추가 덕에 5V가 양산되면서 3V는 이제 실전용 개체로서의 가치가 크게 떨어졌다.
또한 6V가 있느냐 없느냐가 관건이지만 개체값이 6V인 포켓몬 2마리와 교배하면 확정 3V가 나오기도 한다.
6세대부터 전설의 포켓몬은 최소 3V가 보장된다.