What are the known and potential side effects of my drug?


약물의 알려진 부작용과 잠재적인 부작용에는 무엇이 있는가?
후천성면역결핍증이라 불리는 에이즈는 에이즈바이러스가 몸속에 침입하여 우리몸의
면역세포를 파괴시켜 면역기능이 저하되면서 각종 감염병이나 암 등이 생겨 사망에 이르게 되는 질병이다. 에이즈를 치료하는 치료제는 역전사효소 억제제와 단백질분해효소
억제제 두 가지로 나누어지는데 오늘은 단백질 분해효소 억제제인 Ritonavir에 대해 알아보고자 한다. Ritonavir(리토나비어)는 단백질분해 효소 억제제로 세포사의 후기 단계에서 바이러스의 부분인 단백분해를 차단하여 복제를 방해하는 약물로 혈액내의 순환하고 있는 바이러스의 숫자를 줄이고 T-cell의 숫자를 증가시키는 약물이다. Ritonavir의 부작용으로는 오심, 구토, 설사, 구강주위부 및 말초의 감각이상, 중성지방 및 콜레스테롤의 증가 및 간효소의 증가등이 있다. Ritonavir는 간의 cytochrome P450 효소를 강력히 억제하므로 간에서 대사되는 다른 약물과 같이 사용하여서는 안된다고 알려져 있다.
오늘은 Ritonavir에 대한 알려져 있는 부작용과 잠재적인 부작용에 대해 알아보고자 한다.

Step to follow


  • 알려진 부작용: Ritonavir와 관련있는 질병 찾기

Step 1. Ritonavir 검색

하단의 List pane에서 copy contents & paste

사용자 삽입 이미지
Step 2. Pathway 옵션 설정

Algorithm Type : “Add neighbors” > Direction : “downstream” > Entity Type : “Disease” > Relation Type : “Regulation” (filter on effect positive)

사용자 삽입 이미지
Step 3. Pathway 결과 확인 & Advanced visualization toolbar

Style > Active Style Sheet > By Reference Count 선택

사용자 삽입 이미지

  • 잠재적 부작용: Ritonavir와 관련있는 Cell Process 찾기

Step 4. Ritonavir 검색

하단의 List pane에서 copy contents & paste

사용자 삽입 이미지
Step 5. Pathway 옵션 설정

Algorithm Type : “Add neighbors” > Direction : “downstream” > Entity Type : “Cell Process” > Relation Type : “Regulation”

사용자 삽입 이미지
Step 6. Pathway 결과 확인 & Advanced visualization toolbar

Style > Active Style Sheet > By Effect 선택

사용자 삽입 이미지

아래 동영상보기를 하시면 4개의 Step을 한 번에 보실 수 있습니다.


Posted by 人Co

2011/01/11 11:09 2011/01/11 11:09
, , , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/91


How can I find literature supporting a list of candidate genes related to a specific plant trait?


식물 리그닌화(목질화)에 대한 후보 유전자 리스트를 확인할 수 있는 있는가?
리그닌은 목질소라고도 하며 셀룰로오스, 헤미셀룰로오스와 더불어 식물골격 구성성분의 하나로 목재 20~30%에 달한다. 식물의 리그닌화(목질화)는 식물이 자라는 과정에서 세포막이나 중간층에 리그닌이 생겨 흡착되거나 화학적으로 결합하여 강하고 단단해지는 현상을 말한다. 일반적으로 세포의 성장에 따라 서서히 일어나지만 병태 또는 상해 조직에서는 유조직세포벽에 급속히 일어나는 경우도 있다. 목질화된 세포벽은 병원균에 의해 잘 침범되지 않기 때문에 병태조직 또는 상해조직에서의 목질화는 일종의 방어반응이라고 할 수 있다.

Step to follow


Step 1. Gene list 검색

검색하고자 하는 유전자의 TAIR ID를 검색한다. Import > Gene List > 복사해 놓은 TAIR ID 리스트 Paste from Clipboard > Lookup in the Database 클릭

사용자 삽입 이미지

Step 2. Lignification과 관련있는 Cell Process 검색


사용자 삽입 이미지
Step 3. Pathway 옵션 설정

Protein과 Cell Process의 Relation 사이의 관계를 나타내기 위해 Protein을 선택한 상태에서 Add 메뉴를 선택하고 "Relations between Selected and Unselected" 클릭

사용자 삽입 이미지
Step 4. Pathway 확인

"Relations between Selected and Unselected"를 하면 서로 연관이 있는 Relation만 표시가 되고 연관이 없는 Entity는 Relation이 되지 않고 남아있다.

사용자 삽입 이미지
Step 5. 엔티티 추가하기

"lignin" small molecule을 검색하여 4번 pathway에 추가하고 Protein과 "lignin" 사이의 Relation을 확인하기 위해 "lingin"을 선택한 다음 Step 3을 반복한다.

사용자 삽입 이미지
아래 동영상보기를 하시면 4개의 Step을 한 번에 보실 수 있습니다.


Posted by 人Co

2010/12/27 09:01 2010/12/27 09:01
, , , , , , , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/88

What small molecules are known to regulate my pathway?


PTPRC(CD45)는 세포의 활성화 신호를 억제 조절할 수 있는 역할을 하는 단백질 중 하나이다. PTPRC(CD45)는 세포막에 위치한 protein tyrosine phosphatase의 일종으로 T세포 또는 B세포의 신호전달에 관여한다. PTPRC(CD45) 단백질을 제거한 실험에서 JAK와 신호 전달체 및 전사 활성인자 (STAT)가 활성화된다고 알려져 있다. 이러한 PTPRC(CD45) -> STAT6 signaling pathway를 조절하는 small molecule들은 무엇이 있는지 확인해보고자 한다.

Step to follow


Step 1. PTPRC -> STAT6 signaling pathway 검색

Information pane에서 PTPRC -> STAT6 signaling pathway를 검색한다. 검색된 Pathway를 더블클릭하면 새 Pathway 문서에서 확인 할 수 있다.
사용자 삽입 이미지

Step 2. Pathway 옵션 설정

PTPRC -> STAT6 signaling pathway를 제어하는 small molecule에는 무엇이 있는지 알아보기 위해 옵션 설정 과정을 거친다. Advanced Build Pathway Wizard에서 Add Neighbors > Directionality: "Upstream" > Entity type : "Small molecule"를 순서대로 선택하고 Relation type은 창 하단의 Cheak All을 클릭하여 모든 Relation을 한 번에 선택해 준다.
사용자 삽입 이미지

Step 3. Pathway 확인


사용자 삽입 이미지

Tip. 복잡한 Pathway를 간략하게 정리하고 싶다면?


Tip 1. View > Relation Table View 기능 사용

Reference가 적은 relation들을 확인하고 삭제하는 manual 방법

사용자 삽입 이미지

Tip 2. Common Regulators 알고리즘 활용

Advanced Build Wizard 에서 Algorithm Type : “Add Common Regulators" > Algorithm Type : “Add Common Regulators” > Entity Type : “Small Molecule” > Relation Type : “All Regulation Type” 순으로 선택한다.

사용자 삽입 이미지


아래 동영상보기를 하시면 3개의 Step을 한 번에 보실 수 있습니다.




Posted by 人Co

2010/12/20 08:38 2010/12/20 08:38
, , , , , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/87

Can I identify potential drug-drug interactions mediated by alterations of drug metabolism?


 drug 대사의 변경에 의해 조절되는 잠재적인 drug-drug interactions를 확인 할 수 있는가? 항응고제로 혈액응고를 방지하기 위한 약물로 알려진 쿠마딘의 대사에 대해 알아보고자 한다. 쿠마딘(와파린)은 항응고를 하는 약제로 혈관안에서 혈전이 형성되는것을 막아주기 때문에 주로 혈전 및 색전증 치료에 쓰이고 있다. 쿠마딘은 주로 간에서 대사되는데, 간 대사효소인 CYP3A4에 의해 미량 대사된다고 알려져 있다. PathwayStudio를 통해 쿠마딘과 CYP3A4의 관계를 알아보고 CYP3A4에 영향을 주는 약물에 대해 조사해봄으로써 durg-drug 상호작용을 확인해보고자 한다.

Step to follow


Step 1. Coumadin 검색

Information pane에서 coumadin을 검색한다. 검색된 coumadin을 복사하고 새 pathway 문서에 붙여넣기를 한다.

사용자 삽입 이미지


Step 2. Pathway 옵션 설정 및 Pathway 확인

coumadin이 어떤 효소에 의해 대사되는지 알아보 pathway로 나타내기 위해 옵션 설정 과정을 거친다. Advanced Build Pathway Wizard 에서 Add Neighbors > Directionality: “upstream” > Entity type: “protein” > Filter Parameters: “ChemicalReaction” 순으로 선택한다.

사용자 삽입 이미지

Step 3. Pathway 옵션 설정

coumadin의 대사에 관여하는 효소 15개를 확인하였고, 그 중에서 CYP3A4라는 효소는 다시 어떤 small molecule에 의해 영향을 받는지 알아보기 위해 pathway 찾기를 재수행한다. CYP3A4를 선택하고 Advanced Build Pathway Wizard 에서 Add Neighbors > Directionality: “upstream” > Entity type: “small molecule” > Filter Parameters: “DirectRegulation” 순으로 선택한다.

사용자 삽입 이미지

Step 4. Active Style 변경

Effect와 Reference 개수에 따라 그래프 보기에서도 효과를 나타내 줄 수 있다. Style 메뉴의 Active Style Sheet에서 By Effect를 선택하면 Effect의 Positive, Negative 효과에 따라 Relation 선색을 다르게 할 수 있으며, By Reference Count를 선택하면 Reference의 개수에 따라서 Relation 선색이 달라지는 것을 확인 할 수 있다.

사용자 삽입 이미지

아래 동영상보기를 하시면 4개의 Step을 한 번에 보실 수 있습니다.


Posted by 人Co

2010/10/25 08:43 2010/10/25 08:43

How can I find candidate genes related to a specific plant trait?


특정 식물의 특성과 관련이 있는 후보 유전자는 어떻게 찾을 수 있을까?
식물의 특성 중에서도 과일 단계에서 과일의 크기, 모양, 색과 같은 다양한 특성에 관련된 유전자를 찾는 방법에 대해서 알아보고자 한다. 또한 과일의 색에 영향을 주는 유전자들을 찾았다고 한다면 유전자들 중에서 영향을 많이 준 순서대로 보는 방법과 과일의 색과 유전자의 관계를 뒷받침해주는 논문의 수가 많은 순서대로 보는 방법도 함께 소개한다.

Step to follow


Step 1. Fruit 검색

Search Entities by keword를 통해 과일과 관련이 있는 Cell Process만 검색한다. 검색된 Cell Process 중에 보고자 하는 것만 선택하고 복사한 뒤 새 Pathway 문서에 붙여넣기 한다.

사용자 삽입 이미지

Step 2. Pathway 옵션 설정

선택한 Cell Process와 관련이 있는 유전자를 찾고 Pathway로 나타내기 위해 옵션 설정 과정을 거친다. Advanced Build Pathway Wizard 에서 Add Neighbors > Directionality: “Upstream” > Entity type: “Protein” > Filter Parameters: “Regulation” 순으로 선택한다.

사용자 삽입 이미지
Step 3. Entity Table 보기(View > Entity Table View)

엔티티 테이블 보기를 하면 Pathway에 있는 모든 엔티티에 대한 정보를 테이블 형태로 볼 수 있다. 테이블 컬럼 중에 Outdegree 컬럼을 내림차순으로 정렬하면 과일의 특성과 관련된 유전자 중에서 많은 영향을 준 유전자 순으로 볼 수 있다.

사용자 삽입 이미지

Step 4. Relation Table 보기(View > Relation Table View)

Relation 테이블 보기는 Pathway의 Relation에 대한 정보들을 테이블 형태로 보여 주는 기능을 한다. # of Reference 컬럼을 내림차순으로 정렬하면 Relation 정보를 뒷받침해주는 Reference가 많은 순으로 Effect 정보와 함께 볼 수 있다.

사용자 삽입 이미지
Step 5. Active Style 변경

Effect와 Reference 개수에 따라 그래프 보기에서도 효과를 나타내 줄 수 있다. Style 메뉴의 Active Style Sheet에서 By Effect를 선택하면 Effect의 Positive, Negative 효과에 따라 Relation 선색을 다르게 할 수 있으며, By Reference Count를 선택하면 Reference의 개수에 따라서 Relation 선색이 달라지는 것을 확인 할 수 있다.

사용자 삽입 이미지

아래 동영상보기를 하시면 5개의 Step을 한 번에 보실 수 있습니다.




Posted by 人Co

2010/10/18 10:44 2010/10/18 10:44

How can I find diseases that are involved in the amplification of a specific gene?


표피성장인자수용체(EGFR)의 증폭과 관련이 있는 질병에는 어떠한 것들이 있을까?
보통 표피성장인자수용체(EGFR)가 증폭되었을 때 어떤 질병과 관련이 있는지 알아보기 위해서 먼저 인터넷 또는 논문 검색을 하게된다. 인터넷 또는 논문 검색을 통해 찾은 정보들은 무수히 많고 그것을 하나하나 살펴보고 정리하는 것도 만만치 않은 일이다. 그래서 표피성장인자수용체가 증폭되었을 때 생길 수 있는 질병만 선택해서 찾고 한번에 Pathway까지 그릴 수 있는 방법을 소개하고자 한다.


Step to follow


Step 1. 표피성장인자수용체(EGFR) 검색

PathwayStudio 검색창에서 표피성장인자수용체인 EGFR을 검색한다. 검색된 EGFR을 복사한 후 새 Pathway 문서에 붙여넣기 한다.

사용자 삽입 이미지
Step 2. Pathway 옵션 설정

표피성장인자수용체(EGRF)에 의해 나타나는 질병을 모두 찾고 Pathway로 나타내기 위해 옵션 설정 과정을 거친다. Advanced Build Pathway Wizard 에서 Add Neighbors > Directionality: “downstream” > Entity type: “disease” > Filter Parameters: “regulation” 순으로 선택한다.

사용자 삽입 이미지
Step 3. Relation 속성을 이용한 검색 기능

Pathway에서 “amplif”가 포함된 Regulation 관계만 찾기 위해 pathway 검색 tool에서 “Find Relation by Attribute”를 클릭한다. 찾고자 하는 Attribute에 대해 설정하는데 논문의 문장에 "amplif"가 포함된 것만 찾기위해 Attribute를 Sentence로 선택하고 Operation은 "includes", Value는 "amplif"로 설정하고 검색을 한다. 검색 결과 Reference sentence에 "amplif(amplification/amplified)"가 포함된 Relation만 파란색으로 표시된것을 확인할 수 있다.

사용자 삽입 이미지
Step 4. 선택된 Pathway만 보기

복잡한 Pathway에서 선택된 것만 자세히 보기 위해 Edit에서 Copy를 하고 새 Pathway 문서에 붙여넣기 한다. 그러면 EGFR이 증폭했을 때 생길 수 있는 질병에 대한 pathway만 확인 할 수 있다.

사용자 삽입 이미지

아래 동영상보기를 하시면 4개의 Step을 한 번에 보실 수 있습니다.






Posted by 人Co

2010/10/11 09:09 2010/10/11 09:09
, , , , , ,
Response
No Trackback , No Comment
RSS :
https://post-blog.insilicogen.com/blog/rss/response/82


연재 순서

 1. PathwayStudio 소개
 2. 문헌정보를 활용한 유전자 네트워크 분석
 3. Chip 실험 데이터에서의 유전자 네트워크 분석
 4. Drug 발굴을 위한 지식 데이터베이스 ChemEffect


Chip 실험 데이터에서의 유전자 네트워크 분석


 DNA Chip 분석 실험을 통해 유전자의 발현 양상을 분석하는 연구가 이전부터 많이 진행되어 왔다. 특정한 조건하에서 발현을 보이는 유전자가 무엇인지 검토하고 이들 유전자에 대한 다양한 정보를 검토하는 것이 이전의 연구방향이었다. 그러나 Eukaryote유전체에서는 하나의 유전자가 다양한 역할을 수행하기도 하며, 반대로 여러 개의 유전자들이 서로 상호 연관관계를 맺어서 하나의 기능을 수행하기도 한다. 따라서, 이러한 유전자들의 상호 연관관계를 도출하고자 하는 연구가 최근들어서는 중요시되고 있다. 즉 차등발현을 보이는 여러 개의 유전자들을 upstream 단계에서 조절하고 있는 요소가 무엇인지, 또한 여러 개의 유전자들이 공통적으로 타겟을 정하고 있는 질병이나, 유전자들이 무엇인지를 밝히고자 한다. 이번 블로그에서는 PathwayStudio를 이용하여 Chip 실험 데이터에 대한 유전자 네트워크 분석 방법에 대해서 알아보고자 한다.

Data importer

 
 실험 데이터를 분석하기 위해 먼저 실험데이터를 Import 해야 한다. Pathway Studio는 실험 데이터를 매우 쉽게 입력 할 수 있도록 인터페이스가 구성되어 있다. 입력 할 수 있는 형식으로는 Gene expression, Metabolomics, Proteomics가 있다. 입력 할 수 있는 데이터의 포맷도 아래와 같이 다양하게 제공된다.

  • Tab-delemited text(Generic)
  • Microsoft Excel
  • GEO Datasets (GDS in SOFT format)
  • Affymetrix Raw (CEL)
  • Affymetrix CHP
  • Agilent
  • Illumina

 입력할 데이터의 포맷은 DNA Chip 실험 분석을 통해서 얻어진 정보들을 탭 분리형식으로 구성되어진 파일과 엑셀 형식으로 되어 있는 파일을 불러들일 수 있다. 또한 Affymetrix, Agilent, Illumina 사와 같은 기존에 가장 많이 분석에 이용되고 있는 상용화 DNA Chip 정보 포맷도 쉽게 불러들여 분석을 진행 할 수 있다. 탭 분리형식으로 데이터가 저장된 파일을 불러들여 분석을 할 경우 아래와 같이 모두 10가지 단계를 거치게 된다.

 실험 데이터의 형식, 파일 포맷, 그리고 입력할 파일과 최종 저장할 디렉토리를 선택하면 모두 10가지 단계의 입력과정을 거치게 된다. 첫 번째 단계에서 부터 순서대로 실험 데이터의 헤더 설정, 데이터가 시작되는 행의 지정, Probe identity를 표현하는 컬럼 지정, 샘플의 layout 설정, 데이터의 마지막 컬럼 지정, 부가적으로 사용될 annotation으로 컬럼 설정, 샘플 타입, 부가적으로 Probe를 식별하는데 사용하는 Identifier, expression 분석에 사용되는 annotation 컬럼을 선택한다. 마지막 열 번째 단계에서는 반복실험을 수행한 샘플들간의 상호 연관성을 볼 수 있는 sample correlation 단계로 샘플 간에 가까운 상관관계가 있는 것끼리 그룹으로 설정하여 Tree 형태로 보여준다. 여기에서 correlation이 잘못된 경우 분석에서 제외할 샘플을 선별 할 수 있다.

사용자 삽입 이미지
그림 1. Chip 실험 데이터 import step


Result and displays


 모든 입력 단계가 완료되면 아래와 같이 Pathway Studio에 실험데이터가 입력 된 것을 확인할 수 있다. 실험 데이터 뷰어는 크게 5가지 부분으로 나뉜다.

  1. 데이터를 분석하거나 편집할 때 많이 사용하는 기능을 모아 놓은 Toolbar
  2. Probe를 빠르게 검색하여 찾을 수 있는 검색창
  3. Probe ID 컬럼
  4. 발현 차이를 보기 위해 t-test 통계 수치가 계산된 컬럼
  5. 샘플 데이터
사용자 삽입 이미지
그림 2. 실험 데이터 Viewer 인터페이스


Data analysis algorithms


Pathway Studio에서 실험데이터를 분석하는 알고리즘은 크게 세 가지가 있다.

  • Fisher's Exact Test
  • Gene Set Enrichment Analysis
  • Sub-Network Enrichment

 Fisher's Exact Test와 Gene Set Enrichment Analysis는 Enrichment를 분석하는 서로 다른 알고리즘이고 Sub-Network Enrichment는 ResNet에서 사용자가 직접 Gene Set을 설정해 주는 것으로 알려진 Gene Set을 사용하는 앞의 두 알고리즘과는 다르다.

 먼저 Fisher's Exact Test를 수행하기 전에 통계적으로 유의한 유전자 리스트를 확인하기 위해 필터링 과정을 거친다. Toolbar에서 Filter Probes by value를 클릭하면 대화창이 나타난다. 필터링을 적용하고자 하는 샘플을 선택하고 Probe 범위와 P-value cutoff 값을 입력하여 필터링을 수행 한다. 이제 Filter를 통해 나온 데이터들을 이용해서 Fisher's Exact Test를 수행한다. 분석하고자 하는 데이터 컬럼에서 마우스 오른쪽을 눌러 Find Pathway/Groups Enriched with Selected Entities를 선택한다. 대화창이 나타나는데 여기에서 실험 데이터를 대상으로 Fisher's Exact Test를 수행 할 Ontology나 Pathway를 선택한다.

사용자 삽입 이미지

그림 3. Fisher's Exact Test 분석 1) Filter Probes by value 2) Find Pathway/Groups Enriched with Selected Entities

 분석이 완료되면 하단에 P-value를 기준으로 정렬된 분석 결과가 테이블 형태로 나타난다. 결과 테이블에서는 분석할 때 선택한 샘플 유전자들이 어떤 Pathway나 Group에 가장 가깝게 해당되는지 알 수 있다. 아래의 결과 테이블을 예로 들어보면 Fisher's Exact Test를 할 때 선택해준 샘플 데이터가 결과 테이블 첫 번째 행에 있는 ECM degradation 즉, ECM 단백질의 분해에 관여하는 Group에 속한다는 것을 알 수 있다. ECM degradation group에는 14개의 Entity가 있는데 그 중에서 선택한 샘플 데이터와 중복이 되는 것은 3개이고 구체적으로 어떤 유전자가 중복이 되는지 리스트도 함께 보여준다.

사용자 삽입 이미지
그림 4. Fisher's Exact Test 분석 결과 테이블

결과 테이블에서 보고자 하는 Pathway를 오픈하면 Graph view에서 볼 수 있다. 이 Pathway에 있는 Entity들이 입력한 실험 데이터에 있는 유전자들 중에서도 발현이 되고 있는지 보고자 한다면 실험 데이터 viewer의 Toolbar에서 Link 버튼을 이용한다. 발현이 되고 있다면 Entity의 색이 변하는 것을 볼 수 있다.

사용자 삽입 이미지
그림 5. Fisher's Exact Test 분석 결과 Pathway 보기 Link 메뉴를 통해 분석결과 나온 Pathway와 실험 데이터의 유전자들이 서로 link 되어 있는지 확인할 수 있다.

 두 번째 알고리즘인 Gene Set enrichment 분석은 Fisher's Exact Test와 비슷한 분석이지만 실험 데이터에 서열화 방법을 적용하였다는 차이점이 있다. Gene Set enrichment 분석을 할 때에는 Filter를 적용하지 않고 분석을 시작한다. Enrichment 분석 할 알고리즘으로 2가지가 제공되는데 Mann-Whitley Utest와 Kolmogorov-Smirnov가 그것이다. 두 가지 모두 순위척도 자료를 위한 비모수 통계방법으로 두 모집단 사이에 유의한 차이가 있는지를 검정할 때 사용한다.

 Gene Set enrichment 분석도 마찬가지로 분석이 완료되면 그림 3과 같은 결과 테이블을 제공한다. 결과 테이블에서 Fisher's Exact Test와 다른점이 있다면 Median fold change 값을 제공한다는 것이다. 이 값을 통해 측정된 Entity 그룹에 대한 fold change 값의 분포를 알 수 있고, 결과 set에서 더 up regulated 되거나 더 down regulated 되는 그룹을 빠르게 확인 할 수 있도록 정보를 제공해 주고 있다.

 이렇게 분석 결과 나온 pathway는 여러 가지 pathway를 합쳐서 보거나, 공통된 것 또는 공통된 것을 제외한 나머지 부분만을 볼 수도 있다. 또한 실험데이터가 Time-course로 진행된 실험이라면 특정 Entity가 시간에 따라 어떻게 발현이 달라지는지 볼 수 있다. 보고자 하는 Entity를 하나 선택하고 마우스 오른쪽을 클릭하면 Show diagram이 있다. 이것을 클릭하면 그림에서 보는 것과 같이 Line plot 형태로 그려진 diagram이 생성된다. 다시 이 다이어그램을 클릭하고 마우스 오른쪽을 노르면 Show as Heat Map 메뉴가 있는데 이것은 Line plot 형태의 다이어그램을 Heat Map 형태로 바꾸어 볼 수 있는 역할을 한다.

사용자 삽입 이미지
그림 6. Visualizing time-course data on pathway

 Pathway Studio를 통해서 실험데이터 차등발현유전자를 선별하고 여러가지 통계분석을 통해 이 유전자들을 조절하는 상위조절인자를 분석하거나 차등발현유전자들이 공통적으로 작용하고 있는 질병, 세포내 프로세스 등을 알아볼 수 있었다. 앞선 연재에서 설명한 Pathway Studio의 ResNet DB 또는 문헌정보를 활용한 유전자 네트워크 정보와도 비교 분석하면서 데이터를 해석하면 좀 더 의미있는 결과가 도출될 것이다.

Posted by 人Co

2010/06/16 09:23 2010/06/16 09:23

PathwayStudio 소개

연재 순서

 1. PathwayStudio 소개
 2. 문헌정보를 활용한 유전자 네트워크 분석
 3. Chip 실험 데이터에서의 유전자 네트워크 분석
 4. Drug 발굴을 위한 지식 데이터베이스 ChemEffect


카레 성분의 커큐민(cucumin)이 전립선암을 억제한다고?


 미국에는 해마다 전립선암 환자가 증가하고 있는데 반해 인도인들은 전립선암 환자가 거의 발생하지 않고 있다. 유전적인 요인도 있겠지만, 식습관의 차이가 전립선 암환자의 발생을 유도하거나 억제하지 않을까라는 단순한 궁금증을 가지고 카레와 전립선암과의 연관관계에 대한 연구를 시작하고자 한다. 이때 우리는 “인도인들이 즐겨먹는 카레의 주성분에서 전립선암을 억제하는 상호기작이 있을 것이다”라고 가정할 수 있다. 그럼 카레의 주성분은 무엇일까? 카레의 색깔이 노란색인 것은 커큐민이라는 성분때문인데, 이 커큐민이 카레의 주성분이다. 전립선암과 우리가 즐겨 먹는 카레의 주성분인 커큐민은 상호 어떤 관계가 있을까? 실험을 통해서 일일이 검증을 해야 확인할 수 있겠지만, PubMed와 같이 과학 문헌 데이터베이스에서 커큐민 성분에 영향을 미치는 유전자에 관련된 논문과 전립선암에 관여하는 유전자에 대한 논문을 찾은 후 ‘커큐민-유전자-전립선암’과의 관계를 유추할 수 있다.

이와 같이 신약을 발굴하기 위해서 바이오마커를 찾거나, 특정 질병에 관여하는 유전자들이 무엇인지 알고자 할 경우, 또는 DNA Chip 분석을 통해서 얻어지는 차등 발현 유전자들이 공통적으로 관여하는 질병을 찾거나, 유전자들의 상호 연관관계를 알고자 할 경우에 사용되는 유용한 프로그램 가운데 PathwayStudio라 는 프로그램을 소개하고자 한다.

Pathway Studio 시스템 구성


Pathway Studio는 세 가지 시스템으로 구성되어 있다.

  • MedScan: 자연어처리기술(NaturalLanguageProcessing) 을 이용한 과학 문헌의 전문화된 텍스트 마이닝프로그램, 단백질 중심의 생물학적 연관관계 추출
  • ResNet Database: MedScan을 이용하여 PubMed와 Interaction 관련 저널에서 추출한 Mammalian, Plant의 생물학적 네트워크 정보를 생물학 전문가에 의해 재검증한 데이터베이스
  • PathwayStudio: MedScan과ResNet Database를 통해 추출된 데이터를 이용하여 Pathway를 편집 할 수 있도록 제공되는 사용자-친숙한 인터페이스
사용자 삽입 이미지
그림 1. 시스템의 구성. 1) 자연어 처리 기술을 응용하여 문헌에서 생물학적인 데이터를 추출하는 MedScan Reader 2) 추출된 데이터를 데이터베이스화 한 ResNetResNet Database는 Mammalian과 Plant 두 가지로 구분되어진다. 3) 데이터베이스의 정보를 그래픽 형태로 pathway를 생성하고 편집할 수 있는 인터페이스를 제공하는 PathwayStudio Database.


Pathway Studio 응용분야


Pathway Studio는

  • 유전자 발현 데이터 또는 high throughput 데이터를 해석할 때,
  • pathway를 설계, 확장하고 분석 할 때,
  • 유전자, 단백질, cell processes, 질병 사이의 관계를 찾을 때,
  • publication-quality pathway 다이어그램을 그릴 때,
  • 문헌 정보에서 바이오마커와 drug 후보군을 찾을 때,
와 같은 다양한 연구 분야에서 사용되고 있으며, 수많은 연구자들이 Pathway Studio를 이용하여 분석한 결과 및 방법들을 논문으로 투고하고 있다. ARIADNE사의 홈페이지((http://www.ariadnegenomics.com/technology-research/publications/)) 에는 아래와 같은 카테고리 별로 PathwayStudio를 이용하여 투고된 논문 정보를 바로 확인할 수 있다.

  • Epigenetic studies
  • Pathway Analysis
  • Analysis of gene expression microarray data
  • Anayisis of proteomics data
  • Drug discovery
  • Human genetics
  • Toxicogenomics
  • Biomarkers
  • Neuroscience
  • Text mining
  • Model organisms
  • Plants

Pathway Build 방법


 과연, 그렇다면 Pathway Studio에서는 어떤 방법으로 pathway를 그릴 수 있을까? pathway를 그릴 수 있는 방법은 아래 그림과 같이 크게 3가지 정도로 나누어 볼 수 있다. 첫 번째로 내가 알고 있는 유전자 하나 혹은 여러 개의 유전자 목록을 검색하여 엔티티들 사이에 어떤 관계가 있는지 pathway를 직접 그려가면서 확인하는 검색을 통한 방법이 다. 두 번째로는 어떠한 주제로 연구를 할 때 기존에 밝혀져 있는 문헌에 대해 리뷰하는 과정을 거치게 되는데 이 때 관련 문헌을 모두 검색하고 거기에서 보고자 하는 정보들을 추출 할 수 있다. 이렇게 추출된 정보들은 문헌을 통한 검색으 로 추출되었기 때문에 신뢰도가 높은 정보를 제공할 뿐만 아니라 Pathway Studio를 통해서 그들 간의 pathway도 그려 볼 수 있고, 그것을 더 확장해 나가면서 새로운 의미를 도출 할 수도 있다. 마지막으로 실제 실험을 통해 나온 데이터를 입력하고 통계 분석을 한 뒤 통계적으로 유의한 유전자들 사이의 관계를 pathway로 그려보고 발현양상을 살펴보는 방법이 있다.

사용자 삽입 이미지
그림 2. pathway build 방법 1) 유전자 검색을 통한 방법 2) MedScan 문헌 검색을 통한 방법 3) Import한 실험 데이터를 이용하는 방법

Pathway 편집


 위의 세 가지 방법을 통해 pathway를 그릴 때에는 pathway를 보기 쉽게 편집하는 것 또한 중요하다. Pathway Studio에서는 pathway를 그릴 때 편집하기 쉬운 인터페이스를 제공하고 있을 뿐 아니라 서로 다른 Entity와 Relation을 한 눈에 구별 할 수 있도록 그것을 다양한 모양과 색으로 표현하고 있다. 완성된 pathway를 이미지로 저장할 때에는 아래 그림과 같이 Entity와 Relation 정보를 범례로 포함하여 저장 할 수 있어 pathway를 처음 보는 사람이더라도 쉽게 그 관계를 이해 할 수 있다. 또한 그려진 pathway에서 Relation을 나타내는 화살표에 마우스를 가져가면 Entity들 간에 어떤 관계에 있는지 그리고 그 관계를 뒷받침 할 수 있는 관련 문장이 어떤 문헌에서 추출 되었는지와 같은 정보를 제공해 준다.

사용자 삽입 이미지
그림 3. Entity, Relation, component group의 종류

Pathway layout


 완성된 pathway는 layout을 바꾸어 가면서 볼 수 있다. Pathway Studio에서는 DirectForce layout, Symmetric layout, Cell Localization layout, Hierachical layout과 같이 다양한 layout을 제공하고 있다. layout을 변경을 통해서 보다 새로운 의미를 찾을 수 있을 것이다.

  • DirectForce layout : Entity를 중심으로 관련 정보를 축 방향으로 나타내주는 layout
  • Symmetric layout : Entity를 중심으로 관련 정보를 대칭 형태로 나타내주는 layout
  • Cell Localization layout : pathway의 Entity들이 Cell 안에서 어떤 곳에 위치하는지 보여주는 layout
  • Hierachical layout : Entity를 중심으로 유전자를 조절하는 up-regulation 또는 공통적으로 작용하는 down-regulation 정보를 계층적인 구조로 보여주는 layout
layout을 통해 그랙픽 형식으로 검토하는 방법 이외에도 Entity table, Relation table 보기 기능도 지원하고 있다. Table 보기에서는 Entity와 Relation 정보 이외에도 다양한 annotation 정보도 함께 제공하고, 테이블의 컬럼도 사용자의 편의에 맞게 선택적으로 customizing 하여 볼 수 있도록 되어 있다.

사용자 삽입 이미지
그림 4. pathway view 방식 1) pathway 그래프 보기의 다양한 layout 형태 2) Entity, Relation 테이블 형태의 보기 방식

Pathway data export


 pathway는 다양한 형태로도 저장이 가능하다. 그래프 형태의 pathway는 .gif, .jpg, .png, .tif, .bmp 5가지 확장자의 이미지 파일로 저장 할 수 있다. 이미지로 저장을 할 때에는 범례를 포함하여 저장 할 수 있는데 pathway를 문헌에 효율적으로 이용할 수 있도록 이미지의 넓이, 높이의 크기와 DPI 해상도까지 지정할 수 있다. Entity와 Relation 정보의 table 보기는 엑셀의 형태로 저장 할 수 있어 차후에 2차 분석을 할 때 유용하게 사용할 수 있다. 이 밖에도 웹 문서인 HTML 형태로 저장을 하면 Pathway Studio가 설치되어 있지 않은 곳에서도 웹을 통해 데이터들을 모두 볼 수 있으며 Pathway Studio의 고유 파일 형식인 .gpp 파일 포맷으로 저장을 할 경우에는 Pathway Studio가 설치되어 있는 사용자 간의 혹은 pathway 데이터를 백업 할 때 사용할 수 있다.

사용자 삽입 이미지
그림 5. Pathway 데이터 export 방식.


 2010년 5월 24일 현재 Pathway Studio는 7.1 버전까지 업데이트 되었으며 꾸준한 기능 향상과 데이터베이스 업데이트를 통해 항상 최신의 데이터를 제공하고 있다. Pathway Studio는 다양한 연구 분야를 비롯하여 제약회사를 포함한 전세계의 고객에 의해 사용되고 있다. Ariadne사에서는 고객들이 Pathway Studio를 효과적으로 사용할 수 있도록 case study를 다양한 형태로 제공하기도 하며 국내에도 매 년 몇차례 방문하여 세미나를 개최한 바 있다. 앞으로도 지속적인 기능 향상과 최신의 데이터베이스를 유지함으로써 국내의 많은 연구자들에게 도움이 될 것으로 생각된다.



Posted by 人Co

2010/05/31 08:40 2010/05/31 08:40

BKL PROTEOME

  진핵생물의 세포내 조절 메카니즘은 전사 수준의 유전자 발현 조절과 이후 생성된 단백질 간의 조절 메카니즘으로 구분지어 볼 수 있다. 이들은 세포 밖 외부 신호로부터 target 유전자까지의 신호전달을 유기적으로 전달하며 다양한 루트를 통해 전달한다. 따라서 하나의 단백질과 유전자가 한 가지 기능만을 수행하기 보다는 다양한 단백질과 유전자들과의 상호 협력적인 관계를 통해 전체적인 세포내 항상성을 유지하게 된다.

Biobase는 이러한 총체적인 세포내 조절 메카니즘 분석을 위해 BKL TRANSFAC을 통해 전사수준의 세포내 조절 메카니즘 분석을 위한 resource 데이터를 제공하고, BKL PROTEOME을 통해 이후 단백질 수준의 조절 메카니즘 분석을 위한 데이터베이스를 서비스하고 있다.

2010년 현재 PROTEOME은 6개의 category로 구분된 데이터베이스로 운영되고 있다. Disease-biomarker associations 관심 있는 유전자 혹은 질병에 관련된 pathway, regulation networks, drug interaction 정보를 제공하며 단백질과 질병간의 조절관계를 모 식도를 통해 이해하기 쉽도록 다양한 정보를 제공하고 있다.

  • 자연계에서 일어나는 현상에 대한 인과 관계 및 예방을 위한 정보
  • mRNA의 과잉 발현, DNA mutation, altered protein의 activity와 관련된    질병정보
  • 해당 약물의 질병 메카니즘에 끼치게 될 영향 및 target 유전자에 가해질    잠재적인 예후 정보
  • 새롭게 찾아낸 단백질의 다양한 pathway 정보 및 관계 정보

 Drug-protein interactions 특정 약물에 의해 영향을 받는 대사회로 및 네트워크    정보를 제공하며, 이는 drug 개발을 위한 결정에 보다 직관적인 정보를 제공 한다.


  • Drugbank 로부터 7,000개의 drug-protein interaction 정보를 분석
  • Yeast에서 확인된 1,200개의 chemical regulation 정보
  • Human, yeast 그리고 worm에서 annotation된 12,000개의 drug interaction의 자세한 정보.

 Signaling, metabolic pathway, and expression regulation data 모식화 된 pathway 및 regulation networks 정보를 통해 세포내 조절 메카니즘을 총체적으로 이해 할 수 있도록 하였다.

  • 19,000 건의 signaling interactions
  • Fungal 유전자의 2,700개의 regulator정보
  • 5,100건의 pathway 정보
Yeast and worm models 관심 있는 질병, 병원체, pathway 연구를 위한 model organism으로 다양한 관련 정보를 제공한다.

  • S.cerevisiae, S.pombe - 질병, 노화, fungal pathogen, 바이오연료       그리고 그 외 기초 연구를 위한 모델 정보
  • C.elegans - 질병, 노화, miRNA technology, nematode pathogen         그리고 그 외 기초 연구를 위한 모델 정보
 Fungal pathogens 관심 18개의 human pathogen과 관련된 infection disease 정보 및 pathogen drug 개발을 위한 기초자료를 제공 한다.

  • C. albicans and other Candida species
  • Aspergillus species
  • Blastomyces species
  • Coccidioides immitis
  • Cryptoccocus neoformans
  • Histoplasma capsulatum
  • Pneumocystis species

 Plant Science public data와 전문가의 manual curation 데이터의 조합을 통한 식물 유전체 내의 pathway 정보와 resource data를 제공한다.


  • Arabidopsis, soybean, maize, sorghum, and rice
  • 다른 데이터베이스에서는 찾아 볼 수 없는 표현형과 발현치에 대한 정보
  • Cell signaling and metabolic pathway data
  • BAR을 통한 발현데이터 visualization
  • Sequence 정보를 이용한 규명되지 않은 단백질의 GO, domain정보

PROTEOME Tutorial


 Quick search BKL PROTEOM은 Gene/protein, disease, pathway, drug 그리고 keyword category를 통해 검색 할 수 있다. 원하는 유전자가 포함된 disease 및 pathway정보를 문헌을 통한 전문가의 curation으로 세포내 기능을 검색할 수 있다.

사용자 삽입 이미지
Figure 1. BKL PROTEOM quick search. 유전자, 질병, pathway, drug, keyword를 통해 원하는 정보를 손쉽게 검색할 수 있다. 또한 organism을 제한하여 많은 데이터들 속에서   원하는 정보만을 한 번에 검색 할 수 있다.

STAT3 단백질을 검색한 결과 기본적인 단백질의 대표 기능과 함께 다양한 데이터베이스에서 활용되고 있는 STAT3의 synonyms 정보를 서비스 한다. 또한 좀 더 세분화된 카테고리로 구분된 단백질의 정보를 서비스하는데, biomarker
associations, drug interaction, gene ontology, mutant phenotype, pathway, transcriptional regulation, protein feature, annotation에 관련된 세포내 총체적인  기능을 이해 할 수 있도록 서비스 하고 있다.

Biomarker association disease와 관련된 biomarker로 활용되고 있는 단백질의 정보를 서비스한다. 이러한 정보는 질병의 진단을 위해 혹은 질병 징후에 대한 연구를 위해 활용되고 있다(Figure 2).

사용자 삽입 이미지
Figure 2. Biomarker association. 질병과 관련한 단백질의 표지인자로 활용되는 정보를 서비스한다. 각 질병과 관련된 단백질의 상세 관계 정보는 질병을 클릭하여 자세히 확인 할 수 있다.


 Pathway interaction 단백질과 관련한 pathway 및 interaction 정보를 서비스 한다(Figure 3). Multi-function하는 단백질의 특성상 다양한 pathway와 interaction정보를 검색 할 수있으며 이들의 pathway는 모식도를 통해 graphical하게 확인 할 수 있다. Pathway상의 upstream, downstream에 존재하는 단백질과 관계정보를 총체적으로 살펴 볼 수 있으며 이들 정보는 모두 text 형태로도 변환이 되어 서비스된다.

사용자 삽입 이미지
Figure 3. Pathway & Interaction. 관심 있는 단백질이 포함된 pathway와 interaction정보를   모식도를 통해 서비스하고 있다.


Pathway 모식도는 figure 4에서 보여지는 것과 같이 대표 단백질로 간편화 하여 전
체적인 세포내 기능을 이해 할 수 있는 것(figure 4. A)과 관련 단백질의 모든 관계를 표시한 PathFinder(figure 4. B)로 구분 지어 있다. PathFinder는 많은 단백질의 관계 중에 보고자하는 특정 질병 및 drug 그리고 유전자 관련 pathway만을 지정하여 tag를 이용하여 표시함으로써 이해를 돕고 있다.

사용자 삽입 이미지
Figure 4. Pathway. Graphical viewer를 통한 pathway의 주요 단백질 만들 대상으로 전체적인 정보를 보여주는 것(A)과, PathFinder(B)를 통한 모든 관련 단백질의 관계를 포함한 질병 및 drug 정보를 자세히 살펴 볼 수 있다. PathFinder에서는 zoom-in/out을 통해 단백질간의 관계를 자세히 살펴 볼 수 있으며, 원하는 단백질, 질병, drug정보를 기준으로 직접적으로 영향을 주는 pathway에 하이라이트를 통해 보다 직관적으로 이해할 수 있도록 하였다.

Regulation 특정 단백질이 조절하는 다른 단백질 정보를 서비스하는 것으로 up-regulation, down-regulation 그리고 non-effect로 구분되어 있다(figure 5). Pathway상에서 찾아 볼 수 있는 정보를 보다 유연한 형태로 서비스함으로써 사용자 편의를 고려한 서비스라 하겠다.

사용자 삽입 이미지
Figure 5. Regulation. 단백질들 간의 조절 관계를 up-/down-regulation을 통해 정리하였다.

Annotation 단백질의 pathway 정보뿐만 아니라 expression정보, GO 정보, modification 정보, localization 정보를 비롯한 단백질의 모든 기능을 서비스한다.   이들 정보는 모두 전문가의 curation을 통해 정리된 것으로 참고가 된 문헌 정보는 모두 링크를 통해 서비스 되고있다(figure 6).

사용자 삽입 이미지
Figure 6. Annotation. 단백질의 다양한 function 정보를 서비스한다. Pathway를 비롯한 expression, domain, GO, mechanism, feature정보를 문헌정보와 함께 서비스하고 있다.


2010년 4월 업데이트를 통해 새롭게 서비스 되는 BKL PROTEOM은 이전 버전과 비교하여 사용자 편의를 고려한 서비스가 매우 강화 되었다. Export 기능을 통해 원하는 정보를 모두 다운로드 받을 수 있으며, 많은 정보 가운데 원하는 정보만을 선택적으로 살펴 볼 수 있도록 카테고리화 한 점도 이에 해당한다. 그러나 무엇보다 Biobase의 최대 장점은 문헌정보를 바탕으로 한 전문가의 curation으로 데이터의 신뢰성을 높였다는 것으로 BKL PROTEOM 또한 신뢰성 높은 데이터베이스를 제공하고 있다.


Posted by 人Co

2010/05/04 16:34 2010/05/04 16:34

BKL TRANSFAC

 Biobase의 대표적인 제품군인 TRANSFAC은 eukaryotic gene regulation을 분석하기 위한 최적의 기초 데이터를 제공하고 있다. Transcription factors, miRNAs, 그리고 이들과 관련된 유전자의 프로모터 정보를 비롯하여 ChIP-Seq 데이터로부터 1,000,000건 이상의 binding sites 정보, 57,000건 이상의 human RNA polymeraseII의 위치정보를 포함하고  있다. 이들 정보는 모두 실험적으로 증명 되었거나 논문에 게재된 정보를 전문가의 리뷰를 통해 정확하면서도 통합적인 이해를 할 수 있도록 하였다.

 2010년 현재 TRANSFAC®의 데이터베이스는 DNA binding, expression 그리고 regulation에 관련한 전문가의 manual curation을 다음과 같이 수행하였다.

사용자 삽입 이미지

이들 데이터는 실험적으로

  • transcription factor binding site나 혹은 composite elements를 증명하고자       할 때,
  • promoter sequence를 찾고자 할 때
  • miRNA targets을 찾고자 할 때
  • 관심 있는 영역에 binding 가능한 transcription factor를  찾고자 할 때
  • transcription factor들 간의 조절을 알고자 할 때
 실험에 앞서 가능한 factor들의 기초 정보를 제공하게 된다. 따라서 microarray를 통한 유전자 발현 패턴을 분석했다면 동일한 발현 패턴을 보이는 유전자들의 상관관계를 분석하는데 많이 이용되며, 약리 반응이나 신물질의 target을 밝히는 데에도 기초 자료로 인용되고 있다.


TRANSFAC®의 데이터 구성


 TRANSFAC® Professional은 공개된 데이터에 비해 약 4년 정도의 데이터가 업데이트되어 있는 상태로 그 데이터양은 promoter서열이 약 280,000건, 700,000건의 ChIP-chip/-Seq 데이터를 더 포함하고 있다(figure 1).

사용자 삽입 이미지
Figure 1. Public database와 Professional version의 데이터양의 차이


이들의 자세한 내용은 figure 2에서 보여 지는 것과 같이 transcription factor의 서열 정보를 비롯한 binding 가능한 site정보, 도메인정보, regulation 정보를 총체적으로 담고 있다.

사용자 삽입 이미지
Figure 2. Transcription factor feature. Transcription factor의 서열 정보, 종 정보, 조직 정보, 도메인 정보, binding site 정보, interaction protein 정보, regulation정보를 총체적으로 서비스하고 있다.

 GO category정보 및 pathway정보도 가능한 모두 서비스가 되고 있어 세포내 생물학적 기능을 종합적으로 분석하고자 할 때 기초자료로 많은 정보를 주고 있다(figure3).

사용자 삽입 이미지
Figure 3. Transcription factor의 function 정보. Factor간의 interaction정보, pathway 정보, inhibitor 및 activator와 같은 regulation 정보 등을 문헌자료를 통해 데이터베이스화하고 서비스한다.



미지의 서열에 binding 가능한 transcription factor search.


 특정한 발현 패턴을 보이는 유전자의 발현 조절 메커니즘을 분석 하고자 할 때 기본적으로 유전자의 upstream 영역에서 작용하는 transcription factor(TF)를 알아보게 된다. TRNASFAC®은 기본적인 transcription factor 및 binding site에 대한 정보를 제공함과 동시에 미지 서열에 binding 가능한 transcription factor를 예측할 수 있는 MatchTM, PatchTM, 그리고 Catch® 프로그램도 제공하고 있다(Figure 4).

사용자 삽입 이미지
Figure 4. TRANSFAC Professional의 TF search를 위한 PATCH. Pattern match를 통한 미지의 서열에 binding 가능한 TF를 search한다. 이때 false positive를 최소화하기 위해 찾고자 하는 TF의 종 정보를 제한하여 식물 유전자의 경우 식물 데이터베이스를 사용하고 mamalian 유전자의 경우 mamalian 데이터베이스를 사용한다. 또한 특정 찾고자 하는 TF만을 대상으로 할 경우 분석자에 의해 선택된 TF만으로 구성된 프로파일을 제작하여 분석할 수도 있다.


 MatchTM는 TF의 binding site를 matrix로 구성하여 찾는 방법이며, PatchTM는 서열의 pattern match 방법을 이용하여 찾는 방법이다. Catch®는 composite elements를 찾고자 할 때 사용하게 되는데 보통 이들 프로그램을 모두 사용하여 가능한 모든 TF를 찾고 실험에 이용한다. 또한 실험적으로 하나하나 규명할 수도 있으나 유전체 전체 유전자를 대상으로 분석하고자 할 때, 웹으로 운영되는 다음 프로그램에 서열을 하나씩 분석하기는 매우 어려우므로 local 서버나 PC에 설치하여 batch로 서열을 분석할 수도 있다. 이후 얻어진 유전자의 upstream 영역에서 작용하는 TF의 profile정보는 통계적 기법을 통해 유의한 TF를 선별하기도 하고, 데이터베이스화하기도 한다.

또한 얼마 전 덴마크의 CLCBio사와의 협력을 통해 CLCMainWorkbench 혹은 CLCGenomicsWorkbench의 plug-in 기능을 통해 TF정보를 visualization 할 수도  있게 되었다. 따라서 NGS에 의한 RNA-seq 정보 및 유전자 발현정보와 함께 전사조절 ,    메커니즘까지 확대하여 함께 분석할 수 있는 최적의 데이터를 제공하고 있는 것이다.

사용자 삽입 이미지




Posted by 人Co

2010/04/27 14:55 2010/04/27 14:55