phenotype은 없고 genotype만 가지고 있는 개체를 유전평가 모형에 포함해 유전체 육종가를 추정하였으나, 매주 이러한 개체들의 유전체 육종가를 계산해야 한다고 했을 때 매번 유전평가를 하는 것은 매우 어려운 일이다. 그래서 SNP 효과를 추정하고, 이 값을 이용하여 새로이 genotyping한 개체의 유전체 육종가를 계산해야 할 것이다. 여기서는 유전평가를 통하여 유전체 육종가를 구한 후 미래의 계산을 위하여 PostGSF90을 이용하여 SNP 효과를 추정하는 방법에 대하여 알아본다.

 

먼저 renumf90이 만든 파라미터 파일 renf90.par를 복사하고 이름을 renf90_postgsf90.par로 만든다.

 

50k_for_gs.txt를 찾아 50k_for_gs.txt_clean으로 바꾼다.

 

OPTION chrinfo snp_map_for_gs.txt_clean을 추가한다.

 

만일 PreGSF90에서 OPTION saveGInverse란 옵션을 사용했다면 OPTION readGInverse란 옵션을 추가하고 그렇지 않으면 생략한다. 유전체 자료를 가진 개체가 많은 경우 계산 시간이 많이 걸리므로 한 번 저장하고 여러 번 사용하겠다는 옵션이다.

 

blupf90 또는 remlf90에서 사용한 옵션(OPTION sol se, OPTION conv_crit 1d-12, OPTION use_yams 등)은 지운다.

 

 

 

다음 명령어로 PostGSF90을 실행한다.

 

postgsf90 renf90_postgsf90.par | tee postgsf90_01.log

 

다음은 실행화면이다.

 

 

postgsf90_01.log 파일을 열어서 실행 과정을 살펴보길 바란다.

 

입력 파일 및 옵션으로 다음이 사용되었다는 알 수 있다.

Parameter file: renf90_postgsf90.par

Data file: renf90.dat

Pedigree File: renadd02.ped

Options read from parameter file for genomic

* SNP format: BLUPF90 standard (text)

* SNP file: 50k_for_gs.txt_clean

* SNP Xref file: 50k_for_gs.txt_clean_XrefID

* Map file: snp_map_for_gs.txt_clean

 

실행결과로 생긴 파일은 다음과 같다.

 

Solutions for SNPs in file: "snp_sol"

Files for pedictions by SNP effects in file: "snp_pred“

 

snp_sol은 다음과 같다.

 

 

 

 

첫째 형질의 둘째 효과의 42561개의 SNP 효과가 염색체 번호와 위치와 함께 나와 있다. 만일 다형질로 유전평가를 했다면 둘째 형질의 해당 효과의 SNP 효과도 나올 것이다. 컬럼별 설명은 다음과 같다.

 

1: trait

2: effect

3: SNP

4: Chromosome

5: Position

6: SNP solution

7: weight

if OPTION windows_variance is used

 

8: variance explained by n adjacents SNP.

if OPTION snp_p_value is used

 

9: variance of the SNP solution (used to compute the p-value)

 

다음은 snp_pred이다.

 

 

첫 행에 model, tuning, blending information

둘째 행에 trait/effect info가 나온다.

그리고 각 SNP의 allele frequency가 10열로 나누어 나온다.

 

 

각 SNP의 allele frequency가 나오면 그 다음 줄에 mu_hat과 var_mu_hat이 나온다.

그리고 비로소 SNF effect가 나온다. 만일 다형질로 분석을 했다면 SNP effect가 형질 수만큼의 행(아래)으로 나올 것이다. snp_pred는 predf90 프로그램이 genotype으로부터 유전체 육종가를 계산할 때 사용하게 될 것이다. 

predf90 프로그램에서 --use_mu_hat 옵션을 쓰면 바로 위에서 설명한 mu_hat 값을 더하여 값을 내 준다.

 

+ Recent posts