Contents
Overview
예제로 따라해보기
USING THE VARIANCE TABLE TO IDENTIFY SNPs
다음 예제에서는, Variance Table을 이용하여 47개의 환자 샘플로부터 SNPs를 빨리 확인하고 보고할 것입니다.
File > Import > Sequencher Project…에서 Variance Table을 선택합니다.
- 95 서열들을 보실 것입니다.
- Reference Sequence 뿐만 아니라, 서열들은 두 개의 다른 Primer와 함께 47개의 다른 샘플을 가진 auto-sequencing data를 포함합니다.
Trimming
Automated sequencer로부터 나온 데이타의 분석 첫 단계는 Trimming입니다. 이것은 PCR products의 서열들에도 적용이 됩니다.
모든 서열들을 선택한 후 (Select > Select All 또는 Ctrl + a), Sequence > Trim Ends…를 선택합니다.
- Change Trim Criteria 버튼을 클릭하고, 다음과 같이 설정합니다.
- 5' end 세번째 줄 : 25, 3, 25
- 3' end 네번째 줄 : 25, 3, 25
- Post fix 두번째 줄 : checked
- OK를 클릭하고, Trim Checked Items 버튼 클릭 후, Trim 버튼을 클릭합니다.
- Project창에 Quality column의 값들은 변경되었을 것입니다.
Defining the Assembly Parameters
각 서열들의 이름은 Well_ID_Primer_P#의 형태로 이름지어졌습니다. ex) J06_14667_0045E1SNP88F_P1
Name column을 드래그합니다. (full name을 보기 위해서)
- 서열 이름의 각 4개의 요소들은 _(underscore)에 의해 구분되어졌고, 사용자의 contig들을 편성하고, 조립하고, 명명하기 위해 분리되어졌습니다.
- Assembly Parameters 버튼을 클릭합니다.
- Name Settings 버튼을 클릭하고, 아래와 같이 설정합니다.
- Name Delimiters : _Underscore
- Assembly Handles
- Well
- ID
- Primer
- P#
- OK를 클릭하고, Assemble By Name에서 Enabled에 체크하고 오른쪽에서 Primer 선택합니다.
- Assemble by Name Settings창에서 사용자가 만든 handles의 이름은 Assemble by Name group box에 Handle pull down menu에 있습니다.
- Assembly Parameters의 다른 설정을 합니다.
- Dirty Data checked
Use ReAligner checked
- 3' Gap Placement checked
- 85% match, minimum 20 base overlap
- OK를 클릭하여 설정을 마칩니다.
- 이제 사용자는 이런 PCR products가 배열되어진 4개의 primers 목록을 가진 Handle column을 가지고 있습니다.
- 모든 서열들을 선택 후, To Reference by Name 버튼을 클릭합니다.
- Sequencher는 예상되어지는 contig의 목록을 사용자에게 보여줍니다.
- Assemble 버튼을 클릭하고, Close 버튼을 클릭합니다.
- 이제 사용자는 3개의 contig를 볼 수 있습니다.
Create a Variance Table
Variance Table은 특화된 primary sequence에 관한 데이타의 개요를 제공합니다. 사용자는 primary sequence로써 Reference Sequence를 할당할 수도 있고, Consensus Sequence나 contig 대신 top sequence를 이용할 수도 있습니다. Reference Sequence로 assembly한 후에 primary sequence로써 이것을 이용할 것입니다. Variance Table에서 초기에 보여지는 것은 47개의 환자 샘플들에서 SNPs로 추정되는 것들입니다.
0045E1SNP88R contig를 선택하고, Sequence > Compare To > Reference Sequence를 선택합니다.
- 서열들의 이름이 꽤 길기 때문에, 모든 서열들은 기본 column 크기가 짧아져 있습니다.
- 테이블에 포함되어진 variants는 기본 순서로 목록화 되어졌기 때문에 column은 contig 안에 있는 서열들의 순서로 되어 있고, row는 Reference Sequence에 관한 차이의 위치에 따라 배열되어졌습니다.
- 전체 테이블에서 일부분을 보았을 때, 5, 235, 476의 3개의 variants가 있고, 그 중 476은 하나 이상의 variants를 가지고 있는 것을 알 수가 있습니다.
- 오른쪽 구석 아래에 있는 셀은 테이블에 variants가 16개 임을 나타냅니다.
- Variance Table의 왼쪽 아래에 있는 Total 버튼을 클릭합니다.
- 이제 variants를 가진 모든 서열들은 왼쪽으로 정렬이 됩니다.
- 이 데이타와 함께, 서열은 2개의 variants 보다 많이 가지지 않습니다.
- Total 버튼 왼쪽에 있는 resize icon을 클릭합니다.
- 각 서열의 이름을 볼 수 있도록 column의 크기를 변경합니다.
- 다시 한번 클릭하면 크기가 또 변합니다. (세가지 버전)
- Column 사이에 커서를 놓아 resize icon으로 변하면, 마우스를 좌우로 드래그해서 column의 크기를 수동으로 조절할 수도 있습니다.
- column의 폭이나 분류뿐만아니라, 사용자가 분석의 효율성을 증가시키기 위해 Variance Table에서 데이타를 보는 방법은 많이 있습니다.
- Variance Table의 Help 버튼을 클릭합니다.
- Variance Table에 대한 설명을 테이블과 함께 보여줍니다.
Reviewing the Data by Primer Sequence
각각의 assembly된 contig들은 하나의 primer로 만들어진 PCR product들의 sequencing 결과를 포함합니다. 어떤 연구에서, 이용할 수 있는 샘플 데이타는 하나의 primer에서 나온다고 합니다. 여기에서는 대부분의 샘플들이 두 개의 primer로 sequencing 되어졌습니다. 먼저 하나의 primer로 된 데이타를 볼 것이고, 다음에 두 개의 primer로부터 마지막 분석을 하기 위해 데이타를 결합할 것입니다.
Variance Table의 Review mode는 사용자의 contig에서 흥미로운 지점을 찾아내기 위해 테이블에서 그 차이점을 한 눈에 확인하게 해 줍니다. 사용자가 Review 버튼을 클릭했거나 테이블 안에 셀을 더블클릭 했을때, Contig창과 Chromatogram Editor창이 함께 열립니다. 각각의 Editor창에서 보여지는 데이타는 Variance Table에서 사용자의 선택에 의해 업데이트되어집니다.
R이라고 쓰여진 셀을 더블클릭 해 보십시요.
- 사용자가 선택한 셀에 대한 데이타를 보기 위해 Contig창과 Chromatogram Editor창이 함께 열립니다.
- 두 Editor창은 Variance Table에서 사용자의 선택에 맞게 보여집니다.
- Base를 포함하지 않은 셀들은 여전히 supporting data를 연결시키고 있습니다.
- 이 창들은 variant base로부터 chromatogram을 빨리 볼 수 있게 해주고, 샘플 위치에서 Reference와 matching되는 base와의 비교를 할 수 있게 해줍니다.
- 간단하게 하나의 셀에서 다른 셀로 마우스를 이용해서 선택해 보십시요.
- Reverse primer 데이타인 0045E1SNP88R은 chromatogram 데이타에 의해 지지되어지기 때문에 editing이 필요하지 않습니다.
- 이것은 forward primer의 경우가 아닙니다.
- Contig Editor와 Variance Table창을 닫고, 0045E1SNP88F를 선택합니다.
Sequence > Compare To > Reference Sequence를 선택합니다.
- 이 Variance Table은 이전 Variance Table처럼 같은 구성으로 되어있지만, 반대쪽 방향으로 준비되어진 sequencing reactions을 가진다는 점이 다릅니다.
- 이전 Variance Table (reverse primer)에서 보고되어진 모든 차이점 또한 여기에서도 보여지지만, 전체 차이점이 19인점이 이전 테이블과 다릅니다.
- low quality base calls의 밀집과 5 base 위치에서 Reference Sequence의 불일치는 이 위치에 좀 더 주위를 요한다고 알려줍니다.
- 5 base의 첫번째 셀을 더블클릭합니다.
- 이것은 Variance Table창을 재조정하고, Review mode에서 선택된 base의 정보를 보기 위해 Contig와 Contig Chromatogram창을 엽니다.
- 사용자는 이 위치의 base calls과 chromatograms을 볼 수 있습니다.
- 오른쪽 방향키를 이용하여 다른 셀들의 base calls와 chromatograms 정보를 볼 수 있습니다.
Reference Sequence는 2,3,4,5 base에 4개의 A를 가지고 있습니다.
- In the forward primer, this area has partial coverage, but in no sequence are there four “A’s” in either the current or original data.
- This is an area that is best reviewed in combination with the reverse sequence.
- You will notice as you navigate through the cells that, when you select a cell with a pink X indicating no coverage
at that position, Sequencher displays all traces that do cover the selected position in the Chromatogram Editor.
- In contrast, if you select a cell that has no chromatogram data associated with a base call, as will occur if you select
the Reference, Sequencher displays an empty Chromatogram Editor.
- Contig Editor와 Variance Table창을 닫고, 1011MARa를 선택합니다.
Sequence > Compare To > Reference Sequence를 선택합니다.
- 이 contig에서는 sample sequence와 Reference Sequence 사이에 차이점이 없습니다.
Reviewing the Data by Contig
지금까지 각 primer들의 서열 데이타를 보았습니다. 우리는 base 5 주위에 데이타는 약하고, 235, 476 위치에서 있음직한 variants를 확인했습니다. 이제 46개의 분리된 contig와 하나의 Variance Table에서 각 샘플들과 연관된 모든 데이타를 통합할 준비를 할 것입니다.
모든 데이타를 선택 후, Contig > Dissolve Contig를 선택하고 Dissolve Contig 버튼을 클릭합니다.
- 사용자가 contig를 fragments로 만드는 동안, 몇 개의 Reference가 더 생긴 것을 볼 수가 있습니다.
- 이것들은 assembly에 방해되지는 않지만 만약 사용자가 Project를 지우려한다면, 더 생긴 Reference Sequences를 선택하고 삭제하십시요.
- 모든 fragments를 선택한 후, Assembly Parameters 버튼을 클릭합니다.
- Assemble by Name group box에서 Handle을 Primer에서 ID로 변경하고 OK를 클릭합니다.
- To Reference by Name 버튼을 클릭하고, Assemble, Close 버튼을 차례대로 클릭합니다.
- Forward and a reverse primer sequence, Reference sequence를 포함하는 47개의 contig를 만들 것입니다.
Contig > Compare Consensus to Reference를 클릭합니다.
- You have now created a new Variance Table that compares the consensus sequence from each of the selected contigs to the Reference Sequence.
- Combining the data from both primers creates more samples that have full Reference coverage, noted by the grey shading.
- The same three positions, 5, 235, and 476, are flagged as having variants in the contig table as were reported in the sequence tables, but again the numbers are different.
- The nature of this table is that it reports a few differences across a large number of sequences.
- Therefore, it might be best configured to stretch horizontally across the top of your screen, rather than vertically to the left.
- One of the advantages of the Variance Table Review mode is that you can optimize the organization of your windows, and then preserve that orientation in subsequent Sequencher sessions.
- Review 버튼을 클릭합니다.
- Variance Table창, Contig창, Contig Editor창을 보기 좋게 재정렬합니다.
Window > Remember Window Layout > Variance Review를 선택합니다.
- 사용자가 정의한 이 창의 구성은 다음에 다른 Variance Table에 Review mode를 불러와도 변하지 않습니다.
- Variance Table창을 활성화 한 후, Alt키를 누른채 방향키를 눌러보십시요.
- The Alt + arrow combination directs your cursor to the next difference position in the Variance Table.
- The editors now display the contig bases and chromatogram data for sample 15320, the first contig in the table that has a difference to the Reference at base position 5.
- The base call is an “R” in both the forward and reverse direction and the call is supported by the chromatograms.
- 커서가 ID 15320의 base 5위치에 아직 있다면, alt키를 누른채 오른쪽 방향키를 눌러보십시요.
- You have now jumped to Sample 16037 where there is a gap in the Variance Table.
- There is only data from the forward primer at this position, and it is not very strong.
- At this time, you can use the Contig and Chromatogram Editors as you normally would in Sequencher.
- Move your cursor to the first consensus base in the contig editor with coverage in both the forward and reverse direction, the “C” at position 12, so that you can see the trimmed data from the Reverse primer.
- The Reverse Primer sequence has four clearly defined A peaks around base position 5 where the Forward Primer sequence has an amorphous green blob.
- Sequencher always stores two copies of your data, your Experimental Data, as you imported it into Sequencher, and your Current Data.
- In a chromatogram, the Experimental Data lies below the Current Data, where you can select the original base calls and selectively revert the Current Data to the original calls.
- Select the original bases in the Reverse Primer sequence so that you at least highlight the four “A” peaks
around the colon in the forward primer.
- From the Sequence menu, select Revert to Experimental Data.
- The Current Data in the Reverse Sequence now includes the four “A” bases around position 5.
- Place your cursor at base position at consensus position 5, above the bullet, and type A.
- The disagreement is now resolved in the contig, but the Variance Table still shows the difference.
- In order to update the Variance Table with the new edit, hit the Refresh button in the Variance Table.
- Note that the total number of differences for position 5 has been reduced from 2 to 1.
- Move your selection throughout the Variance Table.
- You will find that the rest of variants in the table are supported by the data, with the exception of 16195, which has a pink X at position 5.
- You can use the Revert to Experimental command again, or you can just report that sequence as having partial coverage.
Exporting the Variance Table









