blupf90으로 단형질 개체 모형(Single Trait Animal Model)의 육종가(Breeding Value) 구하기
자료는 Linear Models for the Prediction of Animal Breeding Values, 2nd Edition. R.A. Mrode의 p43에 나오는 자료 이용
자료
4 1 4.5
5 2 2.9
6 2 3.9
7 1 3.5
8 1 5.0
혈통
1 0 0
2 0 0
3 0 0
4 1 0
5 3 2
6 1 2
7 4 5
8 3 6
Ignacy Misztal이 만든 여러 프로그램을 “BLUPF90 family of programs” 라고 한다. 그 중 육종가를 추정하는 프로그램이 BLUPF90 프로그램이다. BLUPF90을 이용하여 육종가를 추정하려면 먼저 RENUMF90을 이용하여 자료를 가공하여야 한다. RENUMF90을 이용하여 자료를 가공하면 BLUPF90을 이용하여 육종가를 추정할 때 필요한 파라미터 파일도 자동으로 생성된다. RENUMF90을 실행할 때 필요한 파라미터 파일은 다음과 같다. 파라미터 파일에 대한 자세한 사항은 http://nce.ads.uga.edu/wiki/doku.php?id=readme.renumf90 을 보기 바란다.
# Parameter file for program renf90; it is translated to parameter
# file for BLUPF90 family programs.
DATAFILE
stam_perf.dat
TRAITS
3
FIELDS_PASSED TO OUTPUT
WEIGHT(S)
RESIDUAL_VARIANCE
40
EFFECT
2 cross numer
EFFECT
1 cross numer
RANDOM
animal
FILE
stam_pedi.dat
FILE_POS
1 2 3
PED_DEPTH
50
(CO)VARIANCES
20
위의 내용은 renumf90_stam.par이라고 저장한다.
위의 파라미터 파일에 대한 설명은 다음과 같다.
DATAFILE
stam_perf.dat
자료 파일 이름을 제공한다.
TRAITS
3
자료 파일에서 관측치의 열 번호를 제공한다.
FIELDS_PASSED TO OUTPUT
결과 파일에 그대로 다시 나가기를 원하는 열을 적는다. 없으면 공란
WEIGH
가중치 열을 적는다. 없으면 공란
RESIDUAL_VARIANCE
40
잔차 분산 값을 적어 준다.
EFFECT
2 cross numer
각 효과에 대한 정보를 적는다. 2열이 고정효과이며, 분류 변수이며, 숫자로 되어있다는 것을 말한다.
EFFECT
1 cross numer
RANDOM
animal
FILE
stam_pedi.dat
FILE_POS
1 2 3
PED_DEPTH
50
(CO)VARIANCES
20
1열도 효과인데, 분류 변수이며, 숫자로 되어있다는 것을 의미한다.
그런데 임의효과이며 개체 효과란 것을 의미하여 개체의 혈통정보가 있는 파일 이름이 주어지며, 파일 내에서는 animal sire dam 순서로 되어 있으며, 혈통 파일의 모든 혈통을 이용하며(검정 자료를 가지고 있는 개체들의 선조를 골라내려면 50 또는 100 등과 같이 적당이 높은 숫자를 준다. 이 숫자는 50세대까지 선조를 추적하라는 뜻), 분산은 20이다.
실행화면이다. renumf90이라고 타이핑한다.
파라미터 파일의 이름을 묻는다. renumf90_stam.par이라고 타이핑 한다.
renf90.dat를 열어 보면 다음과 같다.
4.5 1 2
2.9 2 5
3.9 2 3
3.5 1 1
5.0 1 4
관측치가 1열로 가고, 고정효과가 2열, 개체 효과가 3열로 된 것을 알 수 있다. 고정효과는 원래 1, 2로 코딩이 되어 있어 번호가 다시 매겨지지 않았지만 개체 효과는 다시 번호가 매겨진 것을 알 수 있다.
renf90.tables 파일을 보면 다음과 같다.
Effect group 1 of column 1 with 2 levels, effect # 1
Value # consecutive number
1 3 1
2 2 2
원래 1번은 자료가 세 개인데 1번으로 renumber되고, 원래 2번은 자료가 두 개인데 2번으로 renumber된 것을 알 수 있다.
renadd02.ped 파일을 보면 다음과 같다.
1 2 5 1 0 2 1 0 0 7
7 0 0 3 0 0 0 0 2 2
2 6 0 2 0 1 1 1 0 4
3 6 7 1 0 2 1 0 1 6
6 0 0 3 0 0 0 2 0 1
4 8 3 1 0 2 1 0 0 8
8 0 0 3 0 0 0 2 0 3
5 8 7 1 0 2 1 0 1 5
각 열이 의미하는 바는 다음과 같다.
1) renumber된 개체 번호
2) renumber된 1번 부모 번호
3) renumber된 2번 부모 번호
4) 3 – 알려진 부모의 수
5) 알려진 또는 추정된 생년, 없으면 0
6) 알려진 부모의 수
7) 기록 수
8) 부모 1로서 자손의 수
9) 부모 2로서 자손의 수
10) 원래 개체 ID
예를 들어 1 2 5 1 0 2 1 0 0 7 은 원래 7번 개체(부 4, 모 5)인데 1번으로 renumber되었고, 부모인 4번 개체는 2번으로, 5번 개체는 5번으로 renumber된 것을 알 수 있다. 또한 알고 있는 부모의 수가 2이므로 3 – 2 = 1이고, 생년은 없으므로 0이고, 알고 있는 부모의 수가 2이고, 기록 수가 1개이고, 부모로 기록된 바가 없어 0, 0 이다.
7 0 0 3 0 0 0 0 2 2 은 원래 2번 개체가 모(dam)로 2번 쓰인 것을 알 수 있다.
renf90.par의 내용은 다음과 같다.
# BLUPF90 parameter file created by RENF90
DATAFILE
renf90.dat
NUMBER_OF_TRAITS
1
NUMBER_OF_EFFECTS
2
OBSERVATION(S)
1
WEIGHT(S)
EFFECTS: POSITIONS_IN_DATAFILE NUMBER_OF_LEVELS TYPE_OF_EFFECT[EFFECT NESTED]
2 2 cross
3 8 cross
RANDOM_RESIDUAL VALUES
40.00000
RANDOM_GROUP
2
RANDOM_TYPE
add_animal
FILE
renadd02.ped
(CO)VARIANCES
20.00000
BLUPF90을 run하기 위하여 필요한 파라미터 파일을 자동적으로 생성해 준다. 자료 파일(DATAFILE)은 renf90.dat이며, 형질(NUMBER_OF_TRAITS)은 1개이며, 효과(NUMBER_OF_EFFECTS)의 수는 2개(고정효과, 개체효과)이며, 관측치(OBSERVATION(S))의 위치는 1열이다. 각 효과의 위치와 수준 수와 종류(EFFECTS: POSITIONS_IN_DATAFILE NUMBER_OF_LEVELS TYPE_OF_EFFECT[EFFECT NESTED])가 나와 있다. 2 2 cross의 의미는 2열에 있는 효과는 수준 수가 2개이며 분류변수(연속변수, 즉 covariate이 아니라는 뜻)이며, 3 8 cross 의 의미는 3열에 있는 효과(개체 효과)는 수준 수가 8개이며 분류변수인 것을 의미한다. 임의 잔차 분산(RANDOM_RESIDUAL VALUES)은 40이다. 임의 효과의 수(RANDOM_GROUP)가 2개이며, 임의 효과의 종류(RANDOM_TYPE)는 add_animal(상가적 개체 효과)이며, 혈통 파일(FILE)은 renadd02.ped이다. (상가적 개체 효과의) 유전분산((CO)VARIANCES)은 20이다. 이외에 추가할 사항이 있으며 파라미터 파일 아래에 적어 내려간다. 추가할 사항은 http://nce.ads.uga.edu/wiki/doku.php?id=readme.blupf90 을 참고하기 바란다.
이제 BLUPF90을 실행시켜 육종가를 추정하자. blupf90을 실행시키자. 파라미터 파일의 이름으로 renf90.par을 입력하자. 파라미터에 입력한 사항이 다시 출력된다. 파라미터 파일을 알맞게 입력했는지 확인한다.
효과가 2개 있는데 분류 변수이며 위치는 2와 3이고 각각 수준은 2와 8이다. 잔차 분산은 40이다.
임의 효과의 수는 2개(개체효과, 잔차효과)이며, 임의 효과의 종류는 additive animal이며, 혈통 파일은 renadd02.ped이다. 분산은 20이다. 자료의 record length는 3열이며, 총 방정식 수는 10(고정호과 2개, 개체 효과 8개)이다. 5개의 records를 읽었으며, 8개의 개체를 읽었다.
left hand side와 right hand side
각 round의 convergence criteria가 나와 있다. 열 번의 반복만에 수렴 기준을 만족하였으며 해는 solutions 파일에 있다.
다음은 solutions 파일의 내용이다.
trait/effect level solution
1 1 1 4.35850233
1 1 2 3.40443010
1 2 1 -0.24945855
1 2 2 -0.00866312
1 2 3 0.17687209
1 2 4 0.18261469
1 2 5 -0.18573210
1 2 6 0.09844458
1 2 7 -0.01877010
1 2 8 -0.04108420
1번 형질의 1번째 효과(고정효과)의 1번 수준의 해가 4.35850233이다. 1번 형질의 2번째 효과(개체 효과)의 1번 수준(원래 7번 개체)의 해가 –0.24945855이다.
'Animal Breeding > BLUPF90' 카테고리의 다른 글
blupf90으로 다형질 모형(different model)의 육종가 구하기 (0) | 2014.03.12 |
---|---|
blupf90으로 다형질 모형(same model with missing record)의 육종가 구하기 (0) | 2014.03.12 |
blupf90으로 다형질 모형(same model and no missing record)의 육종가 구하기 (0) | 2014.02.25 |
blupf90으로 common environmental effect 모형의 육종가 구하기 (0) | 2014.02.25 |
blupf90으로 repeatability 모델의 육종가 구하기 (0) | 2014.02.25 |