기업나라
주메뉴 바로가기 본문 바로가기
글로벌 미국
당신의 소중한 사진, 이제 DNA에 저장하세요

 

시장조사기관인 IDC에 따르면, 2020년 세계 디지털 데이터 총생산량이 적어도 44조GB를 넘어설 것이라고 한다. 이렇게 디지털 데이터의 연간 생산량이 매년 천문학적으로 늘어가면서 기존의 데이터 저장매체가 데이터의 생산량을 따라가지 못할 것이라는 우려가 커지고 있다. 일부 과학자들은 그 해결책을 생체의 데이터 은행인 DNA에서 찾고 있다. DNA에 디지털 정보를 저장하면 대형 데이터센터 한 곳의 데이터를 각설탕 한 개 공간에, 이제까지 생산된 모든 인터넷 데이터는 신발상자 하나의 공간에 담을 수 있게 된다는 것이다. 기존의 저장기술보다 수백만 배는 더 많은 데이터를 수백 년 동안 저장할 수 있는 DNA 저장기술, 특히 장기보존용 데이터를 위해서는 최적의 저장기술로 부상하고 있다.

스토리지의 혁명, DNA 저장시대가 온다
DNA는 생물의 성장과 발달, 기능, 번식 등에 필요한 유전적 정보를 함유한 유전물질이다. 이중나선형 사다리 구조로 A, C, G, T의 네 개 염기가 한 쌍씩 결합한 특정 서열을 통해 생체의 설계도를 저장한다. 인체의 세포핵 내에는 약 30억 쌍의 염기로 구성된 2m 길이의 이러한 DNA 사슬이 6μ(마이크론) 정도의 공간에 빽빽이 들어차 있다. 염기 하나를 하나의 bit(비트)로 보자면 세포당 약 60억 bit를 포함하는 것이다. 평면구조의 기존 메모리 bit에 비해 DNA는 bit 크기가 훨씬 작은 데다가 3차원 공간을 촘촘히 채울 수 있어 저장밀도가 매우 높다.
이론상으로는 1㎟ 공간에 1EB(엑사바이트), 즉 10억GB(기가바이트)의 데이터 저장이 가능하다고 한다. 뿐만 아니라 DNA에 저장된 정보는 수백 년, 수천 년 후에도 읽을 수 있다는 장점이 있다. 심지어는 6만 년 전에 죽은 맘모스와 70만 년 전의 말의 화석에서도 DNA를 추출했다는 뉴스를 본 적이 있을 것이다. 반면, 현재 장기보존 데이터의 저장에 주로 사용되는 자기 테이프의 수명은 10~30년에 지나지 않는다. 더구나 플로피 디스크처럼 저장기술의 발달에 따라 호환되는 리더 자체가 사라져버리면 시간이 지나 데이터를 읽을 수 없게 되는 상황도 생길 수 있다 그러나 생명체의 근원이 되는 중요한 정보를 지닌 DNA는 이를 분석하기 위한 연구가 계속 진행될 테니 이를 걱정할 필요가 없다.
그렇다면 디지털 정보를 어떻게 DNA에 저장하고 읽을 수 있을까? 간단하게 설명하자면, 바이오텍 분야의 DNA 합성(synthesis) 공정을 통해 정보를 저장하고 DNA 분석(sequence) 과정으로 정보를 읽는다. 그러나 이를 위해서는 우선 ‘0’과 ‘1’로 구성되는 디지털 데이터를 DNA의 A, C, G, T, 4개 염기로 변환하는 과정이 필요하다. 변환된 DNA 서열은 DNA 합성장치를 통해 화학적 염기 서열을 담은 DNA 띠로 조립된다. DNA 띠는 길게 만들수록 오류가 많아지기 때문에 현재 각 100~200개의 염기 길이로 합성되는 것이 일반적이다. 각 띠에는 실제 데이터 조각과 함께 어떤 데이터가 어디에 속하는지를 알려주는 주소 정보를 포함, 분석에 필요한 다른 추가 정보도 함께 실리게 된다. 각 50~100bit의 데이터 조각을 저장한 수만∼수십만 개의 이러한 DNA 띠들은 오류 수정을 위한 복제본들이 함께 섞여 있는 상태로 시험관 안에서 완성된 후, 건조과정을 거쳐 어둡고 차가운 장소에 장기간 보관된다. 저장된 정보를 읽기 위해서는 정반대의 과정이 필요하다. 즉, 건조 상태의 DNA를 침습시켜 DNA 분석장치를 통해 염기의 서열을 해독하고, 이를 이진법의 디지털 데이터로 변환하여 원래의 문서와 사진, 동영상 등을 얻는 것이다.

셰익스피어 소설도 DNA에 저장
DNA 저장기술은 2012년 하버드대학 와이스 연구소(Wyss Institute for Biologically Inspired Engineering)의 조지 처치(George Church) 교수가 합성생물학에 대한 자신의 저서를 DNA에 저장하는 데 성공함으로써 본격적인 궤도에 올랐다. 이 정보는 5만 3,000단어와 11장의 JPG 사진, 자바스크립트 프로그램을 포함, 총 659KB(킬로바이트)에 달한다.
연구진은 각 염기당 하나의 bit를 설정해서 0은 A나 C로, 1은 G나 T로 변환시키는 방법으로 데이터를 변환하고, 각 띠에는 96bit의 실제 디지털 정보와 함께 19bit의 주소 정보와 44 염기의 분석용 정보를 실었다. 전체 데이터는 159 염기 길이 DNA 띠, 5만 5,000개에 저장되었다. 연구진은 이 방법으로 1㎟의 DNA에 550만GB의 데이터 저장이 가능할 것으로 추산했다.
그 다음 해에는 영국 힝스턴에 위치한 EBI(European Bioinformatics Institute)의 닉 골드먼(Nick Goldman) 박사팀이 셰익스피어의 154개 소네트와 마틴 루터 킹의 26초 연설 오디오 파일, 왓슨과 크릭의 DNA 구조 논문, EBI 건물 사진과 데이터변환용 ASCII 텍스트 파일을 포함한 739KB의 데이터를 DNA에 저장하는 성과를 올렸다. 이들은 데이터 합성과 해독에 생기는 오류를 최대한 줄이는 데 중점을 두었다.
우선 데이터 변환에 있어서는 이진 코드를 ‘0, 1, 2’로 나타내는 삼진법 변환을 거쳐 다섯 자리의 DNA 코드로 변환시키는 알고리즘을 적용했다. 예를 들어, 문자 ‘B’는 2진수 01000010에서 3진수 20100을 거쳐 DNA 코드 TAGTA로 변환시켜 같은 염기가 연속 표기될 때 생길 수 있는 오류를 줄였다. 또한 117개 염기의 DNA 띠에서 정보를 나타내는 100개의 염기 중 25개씩을 다른 띠에도 반복 저장시켜 오류를 교차 확인하게 했다. 그 결과 연구진은 100만 개가 넘는 DNA 띠의 합성과정에서 오류를 단 2개로 줄이고, 분석과정에서는 완벽하게 정보를 읽을 수 있었다고 한다.
한편, 지난 7월에는 미국 워싱턴대학 컴퓨터공학과의 루이 시즈(Luis Ceze) 교수팀이 마이크로소프트 연구진과 함께 DNA에 200MB(메가바이트)의 데이터를 저장하는 성과를 발표해서 화제가 되었다. 100권의 고전문학과 HD 뮤직비디오, 100개 언어의 인권선언문을 포함한 이 데이터는 EBI 연구진과 같은 변환 알고리즘을 적용했으며, 각 띠에는 실제 데이터와 주소 정보, 그리고 독특한 PCR(Polymerase Chain Reaction) 서열을 함께 실었다. PCR은 DNA의 단일 띠를 중복 복제해서 그 서열만을 연속 복제할 수 있는 DNA 분석기술인데, 덕분에 이들의 방법은 저장된 정보 중 필요한 데이터만 선택적으로 읽을 수 있는 랜덤 액세스가 가능하다고 한다. 전체 데이터는 수백만 개의 150개 염기 길이 DNA 띠에 저장되었으며, 그 합성작업은 DNA 합성업체인 바이오사이언스(Twist Bioscience)가 맡았다. 마이크로소프트는 본격적인 DNA 저장기술의 개발에 뛰어들면서 지난 4월 트위스트 바이오사이언스에서 1,000만 개의 DNA 띠를 주문한 바 있다.

 

10년 후면 DNA 저장 서비스 등장 기대
DNA 저장기술은 자주 읽을 필요는 없지만 오랫동안 기록으로 남겨야 할 데이터의 저장에 특히 적합할 것으로 보인다. 이는 과학연구 분야의 실험 데이터, 역사 기록, 금융거래 데이터, 정부 기록, 환자의 의료 영상 데이터 등 현재 생산되는 데이터의 상당수를 차지한다.
그러나 DNA 저장기술의 현실화를 위해서는 비용을 낮추는 문제가 시급하다. 현재로서는 나노미터 단위의 분자를 일일이 화학적으로 정밀하게 조립해야 하는 이유로 맞춤용 합성 비용이 염기당 10센트에 달하고, 1MB의 합성에 일주일이나 걸린다. 이 비용은 적어도 1만분의 1로는 떨어져야 경제성이 있을 것이라는 관측이다.
반면, DNA의 분석 비용은 이제 단 1,000달러에 인간게놈의 분석이 가능할 정도로 대폭 낮아졌다. 관련 과학자들은 DNA 기술의 발전과 최근 높아지고 있는 반도체 기업들의 관심이 이미 큰 폭으로 하향화 추세를 보이고 있는 DNA 합성과 분석 비용의 하락을 가속화시킬 것으로 전망한다.
한 예로, 인간게놈 전체를 합성하기 위해 처치 교수가 발안한 ‘HGP-Write 프로젝트’도 이에 한몫할 수 있을 것이다. 옥스퍼드 나노포어(Oxford Nanopore Technologies)의 ‘미니온(MinIon)’처럼 휴대가 편리한 저렴한 소형 DNA 분석장치의 등장도 고무적이다. 마이크로소프트의 연구원인 카린 스트라우트(Karin Strauss)는 10년 후쯤이면 장기보존 데이터를 위한 클라우드 DNA 저장 서비스가 등장할 것이라고 예측한다. 시즈 교수팀은 DNA 합성장치와 분석장치까지 내장한 독립적인 DNA 저장 시스템의 개발도 계획하고 있다. 관련 과학자들은 비용만 낮출 수 있다면 데이터의 DNA 저장은 기술적으로 큰 어려움이 없을 것으로 낙관적인 전망을 제시하고 있다.

고병희 미국 현지 객원기자​

조회수 : 1,600기사작성일 : 2016-11-03
기사 만족도 평가
별 개수를 클릭하여 기사에 대한 만족도를 평가해 주세요.
이 기사의 별점
평균 5점 / 2
  • 매우 불만족
  • 불만족
  • 보통
  • 만족
  • 매우 만족
별 5개 / 매우 만족

의견글 작성
  • (삭제 시 필요)
* 불건전한 내용이나 기사와 관련 없는 의견은 관리자 임의로 삭제될 수 있습니다.
메뉴 열기
맨위로