GenomeStudio에서 genotype을 FinalReport로 다운로드 받았다. 다운로드 받은 genotype을 필요에 따라서 숫자로 변환하는 것이 필요하다. 물론 PLINK로 분석할 때는 그에 따른 자료포맷을 사용하면 되는데 여기서는 FImpute, BLUPF90 프로그램 등에서 사용하는 자료 포맷을 만들려고 하는 것이다. 자료 포맷은 다음과 같이 생겼다.

123456789 02202020202200222011120200020020 ......
123456790 02101011102200222000020200120020 ......

FinalReport를 분석을 위한 자료 포맷으로 변환하는데는 Illumina2pregs란 프로그램을 사용할 것이다. 기본적인 명령은 다음과 같다.

illumina2preGS —snpfile <yourSnpFinalReportFilename>

그러나 여기에 SNP_Map.txt 파일과 output 파일 네임을 지정하면 더욱 명확할 것이다. 예를 들어 다음과 같다.

illumina2pregs --snpfile bv2_20211207_111_FinalReport.txt --mapfile SNP_Map.txt --sortmap --snpfile_out bv2_for_fimpute_01.txt --mapfile_out snp_map_bv2 | tee illumia2pregs_01.log

여기서

illumina2pregs은 프로그램의 이름
--snpfile bv2_20211207_111_FinalReport.txt은 GenomeStudio에서 다운로드 받은 finalreport의 폴더 경로와 이름
--mapfile SNP_Map.txt은 GenomeStudio에서 다운로드 받은 SNP Map의 폴더 경로와 이름
--sortmap : 0 1 2로 변환할 때 그 순서를 finalreport의 순서로 할 것인가, 아니면 chromosome, position 순서로 할 것인다. --sortmap 옵션을 써 주면 chromosome, position 순서로 코드화 한다. 이게 illimina2preGS 1.22까지 기본이 chromosome, position 순서였던 것 같은데, 1.30에서는 이 옵션을 안 넣으니 finalreport 순이 되었다. 그래서 이 옵션을 항상 사용하는 것을 권장한다. 이 옵션을 썼다 안 썼다하면 만들어진 0 1 2의 순서가 뒤죽박죽이 될 것이다.
--snpfile_out bv2_for_fimpute_01.txt 유전자형을 변환 후 저장할 파일의 이름
--mapfile_out snp_map_bv2 새로운 map file의 이름
| tee illumia2pregs_01.log 화면에 나오는 정보를 저장할 파일의 이름. 이걸 찬찬히 보고 실행이 잘 되었는지 살펴볼 수 있다.

그 외에도 -- genome, --alphasize 와 같은 옵션을 줄 수 있다. 개체의 이름이 길 경우 --alphasize 옵션을 사용하여 모두 읽을 수 있다.


탐색기에서 Shift 버튼을 누르고 마우스 오른쪽 버튼을 누르면 다음과 같아 진다.

여기에 PowerShell 창 열기를 클릭한다.

illumnia2pregs가 설치되어 경로에 있다고 가정하고 다음과 같이 입력하고 실행한다. 다음은 실행화면이다.

두 개의 파일이 새로 만들어 졌는데 snp_map_bv2와 output 파일로 지정한 bv2_for_fimpute_01.txt 파일이다.


먼저 bv2_for_fimpute_01.txt의 내용은 다음과 같다.


아래로 길게 나열된 유전자형이 옆으로 길게 나열된 것을 알 수 있다.

AA는 0, AB와 BA는 1, BB는 2로 변환되었고, 5는 genotyping이 안되었다는 것이다.

snp_map_bv2는 다음과 같다.

새로운 SNP Map 파일이다. 1열은 SNP이름, 2열은 염색체 번호, 3열은 위치, 4열은 기존 map file의 순서이다. 위에서 --sortmap 옵션을 주느냐 안주느냐에 따라서 결과가 달라진다. 바로 blupf90 분석을 한다면 상관없으나 fimpute로 임퓨테이션을 한다면 snp_info 만들 때 순서가 매우 중요하다.

+ Recent posts