드디어 Final Report를 다운로드하는 단계에 왔다. Final Report를 다운로드하는데 반드시 Export Complete를 확인해야 한다. SNP 6만개, 30두 정도는 몇 분 만에 끝나지만 SNP 70만개, 5000두는 며칠이 걸릴지 모른다. 며칠이 걸려도 끝나기만 하면 좋겠는데 너무 용량이 커서 끝나지 못하는 경우도 있다. PC의 메모리 영향을 받는 것 같다. 경험상 16G 램에서 SNP 40만개라면 1000두 정도, SNP 6만개라면 5000두 정도를 처리하는 것으로 보인다. 행의 수로는 3 ~ 4억 정도의 행을 출력하는 것으로 보인다. 자신의 컴퓨터에 알맞은 SNP 수, 샘플 두수를 정하기를 바란다. 그리고 해당 컴퓨터에서 다른 일을 하고 있다면 다운로드할 수 있는 행의 수는 아마도 더 줄어들 수도 있을 것이다.
snp map 파일과 final report가 만들어 졌으면 잘 만들어 졌는지 확인해야 하는데 snp map 파일이야 5만에서 70만 행이므로 열어볼 수 있겠지만 final report가 3억 개의 행을 가지고 있다면 열어 보기가 쉽지 않다. 그럴 경우 Unix 명령어 head, tail, wc 등을 이용하여 확인하여야 한다.
다음은 head, tail 명령어로 파일의 앞 뒤를 확인하는 화면이다.
다음은 wc 명령어로 행의 수를 확인하는 그림이다.
SNP Map 파일의 행의 수는 63656이었다. header를 제외하면 SNP 개수는 63655개임을 알 수 있다. Final Report의 행의 수는 1,909,661개인데 이것은 30두 x 63655 SNP 개수 + 11 행 header = 1,909,661이다. 잘 다운로드된 것을 확인할 수 있다. 경험에서 우러나오는 얘기를 하자면 다운로드된 파일을 믿으면 안된다. 일루미나의 지놈스튜이도, 써모피셔의 Axiom Analysis Suite도 오류를 일으킨다. 자기가 실수했다고 실토하면 좋겠지만 그렇지 않은 경우가 많다. 결국 다운로드가 잘 되었는지 안 되었는지 확인해야 하는 것은 사용자의 몫이다. 항상 하는 얘기지만 위와 같은 확인을 하는 것이 정신 건강상 좋고, 결국 시간을 절약하는 길이다.
(위 화면은 우분투가 설치된 윈도우즈 WSL2 환경에서 명령어를 입력한 화면이다. 윈도우즈에 WSL2를 설치하면 유닉스-리눅스 명령어를 사용할 수 있다. 무료로 설치할 수 있다. 예전에는 WSL2 설치가 복잡했는데 요즘에는 무척이나 간단해 졌다. 윈도우즈에서 리눅스 명령어를 사용하기 싫다면 리눅스가 설치된 컴퓨터로 파일을 보내서 확인해야 한다.)
'Animal Breeding > Axiom Microarray Genotyping' 카테고리의 다른 글
일루미나 SNP 이름으로 Final Report 다운로드하기 (1) | 2024.11.07 |
---|---|
일부 SNP에 대해서 Final Report 다운로드하기 (2) | 2024.11.06 |
Final Report 다운로드 하기(개체 이름 템플릿 작성) (1) | 2024.11.06 |
Genotyping Data를 다운로드하기(PLINK) (2) | 2024.11.05 |
Genotyping Data를 다운로드하기(VCF) (0) | 2024.11.05 |