분석사례

분석, 제품, 시퀀싱에 대한 견적요청 게시판입니다.

분석사례

Resequencing을 통한 Genome-wide SNP detection

페이지 정보

작성자 최고관리자 작성일11-07-20 14:53 조회2,067회 댓글0건

본문

Reference genome을 기준으로 서로 다른 9개종을 각각 resequencing후  SNP(Single Nucleotide Polymorphism)를 예측하고자 한다. Reference genome 데이터는 scaffold서열로 구성되어 있다. 그리고 9개종은 Illumina 1.3에서 생산된 short read이며, 이중 2종은 30X(genome의 30 folds), 나머지 7종은 18X paired end로 읽었다.
 
NGS(Next Generation Sequencing) 기술로 얻은 short read 데이터는 각각의 서열과 base calling quality정보를 포함하고 있는 FASTQ 포맷으로 제공되었다. 121nt, 78nt 길이로 읽은 이들 데이터에는 퀄리티가 낮은 base가 많이 내포되어 있어 alignment에 나쁜 결과를 초래할 수 있으므로 분석에 앞서 데이터 퀄리티를 체크하여 불량 base는 제거하는 작업을 거친다. Base quality trimming의 cutoff 는 phred score 20 이상으로 하였다.
 
 


Input 파일의 read 개수, base 개수 그리고 trimming후 분석에 이용된 read와 base 개수를 나타내고 있고 퀄리티 체크 후 전체 지놈 사이즈의 coverage와 데이터 실손 량을 보여준다.
 
각 read 데이터의 퀄리티 체크 결과를 plot으로 보여준다. 가로축은 short read서열의 길이이고, 세로축은 퀄리티에 해당하는 base calling 에러률이다. 80bp가 넘으면 에러가 증가함을 알 수 있다.
 
 
Linkage gropu별로 분할된 scaffold의 수와 예측된 유전자의 수
Genetic map에 있는 scaffold에 근거하여 10개의 linkage group으로 분류하였다.

Linkage gropu별 genic & intergenic SNP

종별 annotation결과를 정리하여 테이블 형태로 제공한다.

댓글목록

등록된 댓글이 없습니다.