mir.pe (일반/밝은 화면)
최근 수정 시각 : 2023-08-30 03:01:08

유전체학

Genomics

1. 개요2. 상세3. 목표4. 연구방향5. 한계6. 유전체 전문회사7. 외부 링크

1. 개요

유전체(게놈)를 연구하는 학문. 생물학, 의학, 산업 등에서 제기된 문제의 해결을 위하여 특정 생물체의 개별 유전자들의 총합인 유전체 및 관련 정보를 체계적으로 연구하는 학문이다.

2. 상세

유전체란 동물의 핵 속에 들어있는 유전자 전체를 말하며[1], 게놈(genome)이라고도 하며 유전정보 전체를 말한다.

유전체학은 유전체, 생명체내의 모든 유전자들의 구조 및 기능을 밝히는 연구를 말한다. 주로 유전자 지도작성, 돌연변이동물(형질전환동물, 유전자제거동물, 화학적돌연변이동물, 자연돌연변이동물)의 생산 및 분석, 질병유전자 및 특수형질과 관련한 원인 유전자구명, 분자표지인자(DNA marker)개발연구 등을 포함한다.

게놈이란 한 개체가 지닌 유전자 세트를 말하며 이는 생명 현상의 유지 및 모든 형질의 발현에 필요한 하나의 단위이다. 인간의 게놈은 22쌍의 상염색체(像染色體)와 1쌍의 성염색체, 즉 23쌍의 서로 다른 염색체로 이루어진다. 인간세포 속의 세포핵에는 2중 나선형으로 꼬여 있는 23쌍, 46개의 염색체에 모든 유전정보가 담겨 있다. 유전정보를 담고 있는 물질은 DNA이고, DNA는 A(아데닌) ·G(구아닌) ·C(시토신) ·T(티민) 등 4가지 염기의 다양한 조합으로 이루어져 있다. 이 염기들은 게놈상에서 수백만, 수억 만 번이나 반복되어 있는데, 이들 염기의 결합 순서를 파악하게 되면 각 생물들이 가지고 있는 고유한 염기배열을 알 수 있다.

3. 목표

① 인간 유전자 2만개의 유전자 동정을 파악한다.
② 인간의 DNA를 이루고 있는 30억 개의 화학적 염기배열을 결정한다.
③ 데이터 베이스 정보를 기록한다.
④ 데이터 분석의 기술상의 문제를 개발·보완한다.
⑤ 프로젝트에 관한 도덕적·법률적·사회적인 쟁점에 대한 설명을 하는 것이다.

이 계획이 성공할 경우 새로운 유전자 검사방법 및 질병 치료법, 예방약제, 유전적 치료법의 개발이 가능해진다.

4. 연구방향


5. 한계

1980년대까지만 해도 인간의 유전체를 모두 매핑하면 이를 해독해 인간의 신진대사와 유전병 등에 대한 모든 것을 알아낼 수 있을 줄 알았다. 하지만 실질적으로 인간 대사 및 유전병에 가장 큰 역할을 하는 것은 단백질체(프로테옴, proteome)라는 것이 밝혀지면서, 유전체학만으로는 인간의 모든 것을 이해할 수 없음을 알게 되었다.

설명하자면, 1) 생물의 모든 기능을 담당하는 분자기계인 효소는 주성분이 단백질이고, 2) 단백질의 구성단위는 아미노산이며, 3) 이 아미노산 사슬의 설계도가 바로 유전체이므로 3-2-1의 단계를 밟으면 유전체를 안다 = 인체의 기능을 안다의 등식이 성립할 것을 기대했던 것인데, 실제로는 1과 2 사이에 “3차원 구조화”라는 큰 장벽이 있었던 것이다.

효소(단백질 거대분자)는 아미노산이 무수히 이어진 사슬로 이루어져있는 것은 맞으나, 효소의 기능은 이 사슬에 어떤 아미노산들이 어떤 순서로 배열되어 있는지보다는 이 사슬이 어떤 3차원적 형태로 접히고 뭉쳐있느냐에 좌우된다. 즉 어떤 효소를 구성하는 아미노산들이 뭔지를 전부 알더라도, 이 아미노산의 사슬이 어떤 입체를 이루느냐를 모르면 의외로 별 소용이 없는 것이다.[2]

물론 아미노산 사슬에 있는 여러 아미노산끼리의 약한 결합력으로 인해 사슬이 접히고 입체를 형성하므로, 특정 효소의 아미노산을 코딩하는 (즉 그 효소의 설계도인) 유전자의 염기서열을 알면 이를 기반으로 컴퓨터 시뮬레이션 등을 통해 그 아미노산 사슬이 어떤 3차원 구조를 형성할 것인지를 유추할 수 있다. 하지만 유전자 염기서열이나 아미노산 서열 정보를 입력하면 단백질체(효소)의 입체구조를 정확히 예측해주는 컴퓨터 프로그램은 아직 없으며, 수많은 시도와 오류를 통해서만 입체구조를 파악하는 것이 가능하다.

게다가 후처리(post processing)라는 과정이 있는데, 리보소옴이 유전자(정확히는 RNA)를 설계도삼아 아미노산 사슬을 만들어낸 후 그 일부를 잘라내는 등의 처리를 해야만 비로소 완성품(단백질 효소)으로서 기능하는 경우도 많다. 이런 경우 유전자 염기서열만으로는 어떤 후처리가 행해지는지 알 수가 없다. 뿐만 아니라 DNA를 전사해 전령 RNA를 만드는 과정에서 DNA의 염기서열 중 일부( 인트론)를 잘라내므로, DNA 염기서열만 알아서는 효소의 구조를 유추하는 것이 어렵다.

또한 아미노산 배열이 조금 틀리더라도 효소의 전체적인 형태는 올바르게 잡히도록 하는 프리온이란 물질이 존재하여, 유전자 = 효소의 3차원 구조의 등식이 성립하지 않는 데 일익하기도 한다.

아무튼 이런 것을 연구하는 학문을 단백질체학(프로테오믹스, proteomics)이라 부르는데, 유전체학이 건축학에서 설계도(평면도)를 연구하는 학문이라면 단백질체학은 설계도로 지어진 실제 건물을 연구 대상으로 삼는 학문이라 할 수 있을 것이다.

단백질체학은 3차원 모델링을 기본으로 하므로 유전체학에 비해 강력한 컴퓨팅 파워가 요구되며, 특히 병렬처리(패러렐 프로세싱)가 유용하게 활용되는 분야이다. 나중에 양자 컴퓨터가 실용화된다면 유전체학 연구에 큰 도움이 될 것으로 기대된다.

그러나 단백질체학의 기본은 일단 유전체학임은 말할 필요도 없을 것이다. 일단 아미노산 사슬이 어떻게 구성되어있는지를 알아야 모델을 만들 수 있으니...

2020년 말, 구글 인공지능 프로젝트인 딥마인드가 단백질 3차원 구조를 파악하는 것이 가능해졌다는 발표를 했다( 영문 기사). 단백질 입체구조 파악에 며칠밖에 걸리지 않는다고 하는데, 사실이라면 단백질체학 분야를 반세기 가량 진보시킨 놀라운 성과다.

6. 유전체 전문회사

7. 외부 링크

http://genomics.org
http://personalgenome.net



[1] 포유동물의 경우 약 2만5천에서 3만개의 유전자로 구성됨 [2] 효소나 리보소옴 등에 대해 자세히 모르는 일반인을 위해 극단적으로 단순하게 비유하자면, 사람의 오른손을 구성하는 아미노산이 뭔지 전부 밝혀내더라도 가위바위보에 이기는 데는 별 도움이 되지 않는 것에 비유할 수 있다.