imputation 또는 qc 과정에서, 사용하는 프로그램에 따라 친자감정 결과를 제시하거나 또는 진짜 부모라고 여겨지는 개체를 찾아 주기도 한다.

 

여기서는 아비, 어미를 본격적으로 찾아주는 프로그램(seekparentf90)을 이용하여 아비 어미를 찾아보자.

 

MS를 이용한 친자감정에서는 아비 – 어미 – 자손 이렇게 세 개체가 필요한데, SNP를 이용한 친자감정에서는 아비 – 자손 또는 어미 – 자손 이렇게 두 개체만 이용한다. 어느 아비의 SNP가 0일 때 자손은 0 또는 1이 나올 수 있지만, 2는 나올 수 없다. 또 아비의 SNP가 2일 때 자손은 1 또는 2가 나올 수 있지만 0은 나올 수 없다. 즉 아비와 자손이 0과 2, 또는 2와 0이 나오면 이상한 것이다. 즉 opposite homozygote(OH)가 나오면 안 된다. OH의 비율이 1%를 넘으면 친자 관계가 아니라고 본다. 즉 1%까지는 실험실 오차로 볼 수 있다.

 

seekparentf90의 실행은 다음과 같다.

 

seekparentf90 --pedfile stam_pedi.dat --snpfile genotypes_imp_arrange.txt --yob --seeksire_in_ped --seekdam_in_ped --seektype 2 —full_log_checks | tee seekparentf90_01.log

 

옵션에 대한 설명은 다음과 같다.

 

--pedfile stam_pedi.dat : 혈통 파일의 이름

 

--snpfile genotypes_imp_arrange.txt : 유전체 정보가 있는 파일의 이름

 

--yob : year of birth 생년 정보를 사용

 

--seeksire_in_ped : 주어진 혈통의 아비들 중 진짜 아빠를 찾는다.

 

--seekdam_in_ped : 주어진 혈통의 어미들 중 진짜 어미를 찾는다.

 

--seektype 2 : 1을 친자감정 불일치 개체에 대해서만 아비 어미를 찾고, 2를 주면 모든 개체에 대해서 아비 어미를 찾아 본다.

 

--full_log_checks : 체크할 때 자세한 설명을 출력한다.

 

| tee seekparentf90_01.log : 화면에 출력하는 것을 파일에도 저장한다.

 

준비한 혈통 파일은 다음과 같다.

 

 

혈통에 year of birth가 있으면 출생연도를 따져서 부모를 찾는다.

 

실행화면은 다음과 같다.

 

 

실행결과 생기는 파일은 다음과 같다.

 

- Check_stam_pedi.dat : 개체의 혈통과 생년(year of birth), 유전체 자료가 있는지 없는지, 있을 경우 Match 인지, No-Match 인지 표시

 

 

- Assigned_all_stam_pedi.dat : 혈통을 검사하고 부모를 할당한 수정된 혈통 파일이다.

 

 

- Seek_Dam_all.txt : 어미를 찾은 결과를 포함하는 파일이다.

 

 

* KOR002092441851개체의 Dam이 없는데 463마리를 어미로 넣은 결과 알맞은 어미가 없음. Match가 있을 경우 다른 상황을 고려하여 판단.

* 컬럼 설명

1: 친자감정 결과(Result of parentage check)

2: 개체 번호(Id of Animal)

3: 부 또는 모 번호(Id of parent)

4: 비일치 SNP 수(Number of conflicts)

5: SNP 수

6: 비일치 SNP 비율(Percentage of conflicts)

7: 개체 NoCall SNP 수(Number of NoCall SNP for Animal sample)

8: 부모 NoCall SNP 수(Number of NoCall SNP for Parent sample)

9: 개체-부모 NoCall SNP 수(Number of NoCall SNP for Animal-Parent)

10: 개체 Call Rate(Call Rate for Animal sample)

11: Call Rate for Parent sample

12: 개체-부모 CallRate(Call Rate for Animal-Parent)

 

- Seek_Sire_all.txt : 아비를 찾은 결과를 포함하는 파일이다.

 

 

- Seek_Sire_all.txt를 이용한 아비 찾기 방법을 설명한다. 텍스트를 처리의 편리함을 위하여 엑셀로 복사한다.

 

 

* a2가 Match 인 것만 남긴다.

* 혈통 파일에서 sire를 찾아 sire 열에 입력(vlookup 이용)

* 찾은 아비(a4)와 혈통 아비(sire)가 다르면 1, 같으면 0 표시(cp 열)

* cp가 0인 경우 삭제하고 1인 경우 처리 방법 결정. 기존 MS 친자감정과 비교. 새로운 아비를 넣었을 때의 MS 친자감정 결과 참조.

 

같은 얘기를 반복하자면 call rate이 낮은 개체의 자료를 이용하면 결과가 이상해진다. 반드시 실험결과 call rate 높은 개체의 자료만 사용한다.

 

 

+ Recent posts