연재 순서

   1. Assembly
   2. Variation study
   3. Expression study
   4. Epigenomics
   5. Genome Annotation
   6. Next Generation Bioinformatics
   7. Data Management for web 2.0 Era
   8. Semantic Network for Integrated Biology Data
   9. Gene Network Discovery by Text-mining
  10. Centralization for High-throughput Data Analysis

이번 연재에서는 Next Generation Sequencing의 두 번째 Application인 Expression study의 마지막 내용으로 한정적인 유전자를 좀 더 다양하게 활용할 수 있는 Alternative splicing 분석에 대해 알아보겠습니다.

2-2-7. Alternative splicing Analysis


 한정적인 유전자를 좀 더 다양하게 활용하기 위한 방법으로 alternative splicing이 이뤄지고 있다[20]. 그러나 어느 유전자에서 어느 정도 alternative splicing이 이뤄지는지는 명확하게  밝혀진 바가 없다. NGS 이전 시대의 ESTs와 기타 실험적인 분석으로 약 72%에 해당하는 human 유전자가 alternative splicing을 하는 것으로 알려졌었으나[21],

 최근 NGS를 이용한 분석으로 약 94%의 유전자가 해당하는 것으로 밝혀졌다[20]. 뇌, 간, 근육, 폐의 조직으로부터 분석한 결과 2개 이상의 mRNA를 만들어 내는 유전자가 92-94%에 해당한다는 것이다. 이후 이를 뒷받침하는 자료로 15개의 조직으로부터 분석한 결과 94% 유전자가 alternative splicing이 이뤄진다고 발표 되었다[22].

 현재 까지 밝혀진 alternative form은 대부분 8가지 형태로 분류 되고 있다(그림 10)[20]. 가장 흔한 형태는 exon이 카세트 형태로 들어갔다 나갔다 하는 exon skipping이며, 그 외에도 intron이 exon처럼 읽혀지는 형태와 UTR 영역의 variation도 많은 부분 차지한다. 이러한 형태는 조직, 발달 단계, 그리고 기타 환경적인 자극에 의한 대처로 서로 다른 형태의 mRNA를 발현하여 세포내 항상성을 유지하는 것으로 보고 있다[20].

 실제 분석을 위해서는 위에서 언급 했듯이 다양한 조건에서 다양한 형태로 발현되므로 이를 반영하여 최대한 다양한 조건의 mRNA를 수집하여 이를 genome과 mapping하고 패턴을 분석하는 것이다. 그러기 위해서는 short-reads 보다는 long reads 플랫폼을 이용한 mRNA 시퀀싱이 좀 더 많은 정보를 담고 있으므로 유용하다. 이후 reference assembly를 통해 유전자 영역에서의 transcriptom alignment 형태를 분석하여 alternative 분석을 수행한다(자세한 분석 방법은 2-4-1 C. Alternative splicing analysis 참조).

사용자 삽입 이미지
그림 10. Alternative splicing 형태[20].




다음주 연재에서는 유전자의 염기서열에는 변화를 주지 않으면서 유전자의 발현 등에 영향을 주어 개체의 차이를 나타내게 하는 현상에 대해 연구하는 Epigenomics의 분석 방법에 대해 알아보겠습니다.

많은 관심 부탁드립니다.


참고문헌

1. Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B. (2008) Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods. 7, 621-628.
2. Fei Z, Tang X, Alba RM, White JA, Ronning CM, Martin GB, Tanksley SD, Giovannoni JJ. (2004) Comprehensive EST analysis of tomato and comparative genomics of fruit ripening. Plant J. 40, 47–59
3. Rensink WA, Lee Y, Liu J, Iobst S, Ouyang S, Buell CR. (2005) Comparative analyses of six solanaceous transcriptomes reveal a high degree of sequence conservation and species-specific transcripts. BMC Genomics. 6, 124
4. Ronning,C.M. et al. (2003) Comparative analyses of potato expressed sequence tag libraries. Plant Physiol. 131, 419–429
5. Guo J, Zhu P, Wu C, Yu L, Zhao S, Gu X. (2003) In silico analysis indicates a similar gene expression pattern between human brain and testis. Cytogenet Genome Res. 103, 58-62
6. Benjamini, Y., Daniel Yekutieli. (2001) The control of the false discovery rate in multiple hypotheses testing under dependency. Annal. Stat. 4(29), 1165–1188
7. Tsai CA, Hsueh HM, Chen JJ. (2003) Estimation of false discovery rates in multiple testing: application to gene microarray data. Biometrics. 59, 1071-81
8. Audic S, Claverie JM. (1997) The significance of digital gene expression profiles. Genome Res. 7, 986–995
9. Roche 454 : Products & Solutions - Multiplexing
(http://www.454.com/products-solutions/experimental-design-options/multiplexing.asp)
10. Tatusov RL, Koonin EV, Lipman DJ. (1997) A genomic perspective on protein families. Science. 278, 631-637
11. Kato T, Murata Y, Miura K, Asai K, Horton PB, Koji T, Fujibuchi W. (2006) Network-based de-noising improves prediction from microarray data, BMC Bioinformatics. 7, S4
12. Noh SJ, Lee K, Paik H, Hur CG. (2006) TISA: tissue-specific alternative splicing in human and mouse genes. DNA Res. 5, 229-243
13. Zeeberg BR, Feng W, Wang G, Wang MD, Fojo AT, Sunshine M, Narasimhan S, Kane DW, Reinhold WC, Lababidi S, Bussey KJ, Riss J, Barrett JC, Weinstein JN. (2003) GoMiner: a resource for biological interpretation of genomic and proteomic data, Genome Biol. 4, R28
14. GeneSpring GX : Products & Services - GeneSpring GX Software
(http://www.chem.agilent.com/en-US/products/software/lifesciencesinformatics/genespringgx/pages/default.aspx)
15. Wingender E, Chen X, Hehl R, Karas H, Liebich I, Matys V, Meinhardt T, Prüss M, Reuter I, Schacherer F. (2000) TRANSFAC: an integrated system for gene expression regulation. Nucleic Acids Research. 28, 316-319
16. PathwayStudio : Products-pathway Studio
(http://www.ariadnegenomics.com/products/pathwaystudio/)
17. Eveland AL, McCarty DR, Koch KE. (2007) Transcript profiling by 3'-untranslated region sequencing resolves expression of gene families. Plant Physiol. 146, 32-44.
18. Torres TT, Metta M, Ottenwälder B, Schlötterer C. (2008) Gene expression profiling by massively parallel sequencing. Genome Res. 1, 172-7.
19. Vega-Arreguín JC, Ibarra-Laclette E, Jiménez-Moraila B, Martínez O, Vielle-Calzada JP, Herrera-Estrella L, Herrera-Estrella A. (2009) Deep sampling of the Palomero maize transcriptome by a high throughput strategy of pyrosequencing. BMC Genomics. 10, 299.
20. Wang ET, Sandberg R, Luo S, Khrebtukova I, Zhang L, Mayr C, Kingsmore SF, Schroth GP, Burge CB. (2008) Alternative isoform regulation in human tissue transcriptomes. Nature. 2456, 70-76.
21. Johnson JM, Castle J, Garrett-Engele P, Kan Z, Loerch PM, Armour CD, Santos R, Schadt EE, Stoughton R, Shoemaker DD. (2003) Genome-wide survey of human alternative pre-mRNA splicing with exon junction microarrays. Science. 302, 2141-2144.
22. Ledford H. (2008) Human genes are multitaskers. Nature. 456, 9.
23. CLC Genomics Workbench: RNA-Seq analysis
(http://www.clcbio.com/index.php?id=1330&manual=RNA_Seq_analysis.html)








Posted by 人Co

2010/03/05 08:45 2010/03/05 08:45
Response
No Trackback , No Comment
RSS :
https://www.insilicogen.com/blog/rss/response/52

Trackback URL : 이 글에는 트랙백을 보낼 수 없습니다



« Previous : 1 : ... 316 : 317 : 318 : 319 : 320 : 321 : 322 : 323 : 324 : ... 368 : Next »