BRIEFINGS IN BIOINFORMATICS. VOL 2. NO 5. 499-511 |
What is Functional Genomics?
- Functional Genomics의 목표 : 관찰과 실험으로 얻은 거대한 데이터들을 유전체 서열에 포커싱하여 생명 기능의 지식으로 전환
- Functional Genomics를 위하여 다양한 종의 genome sequencing 프로젝트가 진행 중
- Human Genome
- Human genome은 아직 완전히 밝혀지지 않음
- 유전체 서열의 차이는 SNP와 같이 일부분이 바뀌었을 때 일어나는 기능변화 또는 유전자 조절에 영향을 미침
- 서로 다른 유전체의 비교는 실제로 발현되는 기능의 차이를 확인할 수 있을정도로 중요함
- NGS technology를 이용한 Human 1000 genomes project 진행 중
- Genotype의 차이는 기능적인 부분에서 보여지기는 하지만 결정적인 정보를 제공하지 않음
- 개별 genome 서열을 비교하는 것은 의미가 없기 때문에 한 종에서 많은 유전체를 살펴보아야 할 필요성 있음
- NGS 데이터는 Genomics, Epigenomics, Transcriptomics를 위한 1차적인 데이터를 제공하지만 가장 중요한 기능에 대한 부분에서 직접적인 답을 주지 않음
- 따라서 downstream 분석이 필요하며, 그 첫 번째 스텝은 reference genome physical map을 작성하는 것
Genome Annotation - Changing requirements
- Genome Annotation은 다양한 genome browser 시스템으로부터 이용가능하며, 중요한 서열 특징(genes, transcripts, exons, introns, promotes 등)들을 보여줌
- 유전자의 DNA 서열 자체만 확인해서는 프로모터 등의 발현 등을 결정할 수는 없음
- ChIP- 또는 transcriptome과 함께하는 유전체 서열분석으로서 functional downstream 분석이 요구됨
- NGS 데이터는 이 분석들에 중요한 힌트를 제공해 줄 수 있지만, 직접적으로 기능을 해석하는 부분(regulatory networks, pathway)에서는 설명하기가 어려움
Functional Genomics of Transcriptional Regulation
- 전사 조절은 functional genomics의 가장 중요한 부분 중 하나임
- TF : Transcription Factor / TFBSs : Transcription Factor Binding Sites
- 가장 많이 사용되고 있는 downstream 분석 및 functional TFBS 분석은 Microarray 데이터로 이용하였지만 현재는 NGS 데이터도 한 몫을 하고 있음
- NGS 데이터를 이용한 분석 스텝
- NGS read들의 reference mapping
- 해당 유전자들의 기존에 알려진 ontology 및 pathway 검색
- 유전자 전사를 조절하는 regulatory networks 확인
- TF의 기능, TFBSs 물리적 위치 확인
- Functional genomics는 genomics 서열에만 제한을 둘 수 없고, 여러 가지 -omics 데이터들과 함께하여야 설명 가능
- 따라서 파워풀한 downstream 분석은 NGS 데이터 뿐만 아니라 여러 가지 유전학적인 지식들이 포함되어 있는 데이터베이스 또는 문헌정보, pathway 정도 등과 같이 확인하여야 효과적
What kind of data is provided by NGS for TFBSS-based analysis of Transcriptional regulation?
- 최근 NGS는 4가지의 분석방법 카테고리로 접근
- DNA-seq : 유전체를 기반으로 한 sequencing, variation 분석
- RNA-seq : genome-wide RNA sequencing, exon 및 transcripts 분석
- ChIP-seq 1 : TF-based ChIP, 개별적인 TF의 물리적인 binding site 위치 분석
- ChIP-seq 2 : Epigenetic ChIP (DNA methylation, histone modification), TF의 genomic regions, other factors
<Figure> Overview of NGS-based analysis strategies
- Primary analysis : 직접적인 서열을 비교
Assembly : Sequencing coverage -> CNV, InDels, SNPs, Alternative aplice sites, new transcripts
- Downstream analysis : DNA-seq, ChIP-seq, RNA-seq 세가지 분야로 나눌 수 있음
DNA-seq : Genomic resequencing -> GWAS, Haplotypes, Tumor typing
ChIP-seq : modified chromatin(histone methylation, acetylation) -> DNA-binding protein, TFBSs
RNA-seq : Whole transcriptome -> identify most splice variants
- Meta analysis : NGS 분석 결과 및 다른 결과 데이터들을 통합하여 다양한 프로파일로 생물학적인 의미를 설명함
How can NGS data be used to reveal TFBSS-based Transcriptional regulation?
<Figure> Complete strategy for TFBSs focused ChIP-Seq and RNA-Seq data analysis

- ChIP-Seq : enriched regions
- RNA-Seq : corresponding transcripts and promoters
- TFBS-based analyses : promoter 서열 부위에서 분석 수행
NGS-based Functional Genomics and Systems biology
- NGS 데이터는 생물학적인 시스템 분석의 정량적인 모델은 아니지만, downstream 분석을 통한 functional genomics로부터 network 또는 interconnection을 확인 가능
- 따라서 다양한 NGS application으로부터 System biology 접근에 유용하게 이용될 수 있음
Is NGS-Functional Genomics the future of personal genomics/personalized medicine?
- NGS를 이용하여 진단을 위한 biomarker 개발이 진행되고 있음
- 개인 맞춤 의약에 적용 가능
Problems remaining and outlook
- NGS 기술은 많은 장점을 가지고 있으며, 그 응용분야도 다양하지만 여전히 제한적인 요소들이 있음
- Low read length : 짧은 서열로부터 de novo genome assembly에 어려움
- NGS는 막대한 deep-coverage로 많은 분야의 application으로 이용할 수 있지만 상대적으로 보면 low throughput임









