blupf90으로 단형질 개체 모형(Single Trait Animal Model)의 육종가(Breeding Value) 구하기

 

자료는 Linear Models for the Prediction of Animal Breeding Values, 2nd Edition. R.A. Mrodep43에 나오는 자료 이용

 

자료

4 1 4.5

5 2 2.9

6 2 3.9

7 1 3.5

8 1 5.0

 

혈통

1 0 0

2 0 0

3 0 0

4 1 0

5 3 2

6 1 2

7 4 5

8 3 6

 

Ignacy Misztal이 만든 여러 프로그램을 “BLUPF90 family of programs” 라고 한다. 그 중 육종가를 추정하는 프로그램이 BLUPF90 프로그램이다. BLUPF90을 이용하여 육종가를 추정하려면 먼저 RENUMF90을 이용하여 자료를 가공하여야 한다. RENUMF90을 이용하여 자료를 가공하면 BLUPF90을 이용하여 육종가를 추정할 때 필요한 파라미터 파일도 자동으로 생성된다. RENUMF90을 실행할 때 필요한 파라미터 파일은 다음과 같다. 파라미터 파일에 대한 자세한 사항은 http://nce.ads.uga.edu/wiki/doku.php?id=readme.renumf90 을 보기 바란다.

 

 

# Parameter file for program renf90; it is translated to parameter

# file for BLUPF90 family programs.

DATAFILE

stam_perf.dat

TRAITS

3

FIELDS_PASSED TO OUTPUT

 

WEIGHT(S)

 

RESIDUAL_VARIANCE

40

EFFECT

2 cross numer

EFFECT

1 cross numer

RANDOM

animal

FILE

stam_pedi.dat

FILE_POS

1 2 3

PED_DEPTH

50

(CO)VARIANCES

20

 

위의 내용은 renumf90_stam.par이라고 저장한다.

 

위의 파라미터 파일에 대한 설명은 다음과 같다.

DATAFILE

stam_perf.dat

자료 파일 이름을 제공한다.

 

TRAITS

3

자료 파일에서 관측치의 열 번호를 제공한다.

 

FIELDS_PASSED TO OUTPUT

 

결과 파일에 그대로 다시 나가기를 원하는 열을 적는다. 없으면 공란

 

WEIGH

 

가중치 열을 적는다. 없으면 공란

 

RESIDUAL_VARIANCE

40

잔차 분산 값을 적어 준다.

 

EFFECT

2 cross numer

각 효과에 대한 정보를 적는다. 2열이 고정효과이며, 분류 변수이며, 숫자로 되어있다는 것을 말한다.

 

EFFECT

1 cross numer

RANDOM

animal

FILE

stam_pedi.dat

FILE_POS

1 2 3

PED_DEPTH

50

(CO)VARIANCES

20

1열도 효과인데, 분류 변수이며, 숫자로 되어있다는 것을 의미한다.

그런데 임의효과이며 개체 효과란 것을 의미하여 개체의 혈통정보가 있는 파일 이름이 주어지며, 파일 내에서는 animal sire dam 순서로 되어 있으며, 혈통 파일의 모든 혈통을 이용하며(검정 자료를 가지고 있는 개체들의 선조를 골라내려면 50 또는 100 등과 같이 적당이 높은 숫자를 준다. 이 숫자는 50세대까지 선조를 추적하라는 뜻), 분산은 20이다.

 

 

 

 

 

 

실행화면이다. renumf90이라고 타이핑한다.

파라미터 파일의 이름을 묻는다. renumf90_stam.par이라고 타이핑 한다.

 

renf90.dat를 열어 보면 다음과 같다.

 

4.5 1 2

2.9 2 5

3.9 2 3

3.5 1 1

5.0 1 4

 

관측치가 1열로 가고, 고정효과가 2, 개체 효과가 3열로 된 것을 알 수 있다. 고정효과는 원래 1, 2로 코딩이 되어 있어 번호가 다시 매겨지지 않았지만 개체 효과는 다시 번호가 매겨진 것을 알 수 있다.

 

renf90.tables 파일을 보면 다음과 같다.

 

Effect group 1 of column 1 with 2 levels, effect # 1

Value # consecutive number

1 3 1

2 2 2

 

원래 1번은 자료가 세 개인데 1번으로 renumber되고, 원래 2번은 자료가 두 개인데 2번으로 renumber된 것을 알 수 있다.

 

renadd02.ped 파일을 보면 다음과 같다.

 

1 2 5 1 0 2 1 0 0 7

7 0 0 3 0 0 0 0 2 2

2 6 0 2 0 1 1 1 0 4

3 6 7 1 0 2 1 0 1 6

6 0 0 3 0 0 0 2 0 1

4 8 3 1 0 2 1 0 0 8

8 0 0 3 0 0 0 2 0 3

5 8 7 1 0 2 1 0 1 5

 

각 열이 의미하는 바는 다음과 같다.

1) renumber된 개체 번호

2) renumber1번 부모 번호

3) renumber2번 부모 번호

4) 3 알려진 부모의 수

5) 알려진 또는 추정된 생년, 없으면 0

6) 알려진 부모의 수

7) 기록 수

8) 부모 1로서 자손의 수

9) 부모 2로서 자손의 수

10) 원래 개체 ID

 

예를 들어 1 2 5 1 0 2 1 0 0 7 은 원래 7번 개체(4, 5)인데 1번으로 renumber되었고, 부모인 4번 개체는 2번으로, 5번 개체는 5번으로 renumber된 것을 알 수 있다. 또한 알고 있는 부모의 수가 2이므로 3 2 = 1이고, 생년은 없으므로 0이고, 알고 있는 부모의 수가 2이고, 기록 수가 1개이고, 부모로 기록된 바가 없어 0, 0 이다.

7 0 0 3 0 0 0 0 2 2 은 원래 2번 개체가 모(dam)2번 쓰인 것을 알 수 있다.

 

 

renf90.par의 내용은 다음과 같다.

 

# BLUPF90 parameter file created by RENF90

DATAFILE

renf90.dat

NUMBER_OF_TRAITS

1

NUMBER_OF_EFFECTS

2

OBSERVATION(S)

1

WEIGHT(S)

EFFECTS: POSITIONS_IN_DATAFILE NUMBER_OF_LEVELS TYPE_OF_EFFECT[EFFECT NESTED]

2 2 cross

3 8 cross

RANDOM_RESIDUAL VALUES

40.00000

RANDOM_GROUP

2

RANDOM_TYPE

add_animal

FILE

renadd02.ped

(CO)VARIANCES

20.00000

 

BLUPF90run하기 위하여 필요한 파라미터 파일을 자동적으로 생성해 준다. 자료 파일(DATAFILE)renf90.dat이며, 형질(NUMBER_OF_TRAITS)1개이며, 효과(NUMBER_OF_EFFECTS)의 수는 2(고정효과, 개체효과)이며, 관측치(OBSERVATION(S))의 위치는 1열이다. 각 효과의 위치와 수준 수와 종류(EFFECTS: POSITIONS_IN_DATAFILE NUMBER_OF_LEVELS TYPE_OF_EFFECT[EFFECT NESTED])가 나와 있다. 2 2 cross의 의미는 2열에 있는 효과는 수준 수가 2개이며 분류변수(연속변수, covariate이 아니라는 뜻)이며, 3 8 cross 의 의미는 3열에 있는 효과(개체 효과)는 수준 수가 8개이며 분류변수인 것을 의미한다. 임의 잔차 분산(RANDOM_RESIDUAL VALUES)40이다. 임의 효과의 수(RANDOM_GROUP)2개이며, 임의 효과의 종류(RANDOM_TYPE)add_animal(상가적 개체 효과)이며, 혈통 파일(FILE)renadd02.ped이다. (상가적 개체 효과의) 유전분산((CO)VARIANCES)20이다. 이외에 추가할 사항이 있으며 파라미터 파일 아래에 적어 내려간다. 추가할 사항은 http://nce.ads.uga.edu/wiki/doku.php?id=readme.blupf90 을 참고하기 바란다.

 

이제 BLUPF90을 실행시켜 육종가를 추정하자. blupf90을 실행시키자. 파라미터 파일의 이름으로 renf90.par을 입력하자. 파라미터에 입력한 사항이 다시 출력된다. 파라미터 파일을 알맞게 입력했는지 확인한다.

 

 

효과가 2개 있는데 분류 변수이며 위치는 23이고 각각 수준은 28이다. 잔차 분산은 40이다.

 

 

임의 효과의 수는 2(개체효과, 잔차효과)이며, 임의 효과의 종류는 additive animal이며, 혈통 파일은 renadd02.ped이다. 분산은 20이다. 자료의 record length3열이며, 총 방정식 수는 10(고정호과 2, 개체 효과 8)이다. 5개의 records를 읽었으며, 8개의 개체를 읽었다.

 

 

left hand sideright hand side

 

roundconvergence criteria가 나와 있다. 열 번의 반복만에 수렴 기준을 만족하였으며 해는 solutions 파일에 있다.

 

다음은 solutions 파일의 내용이다.

 

trait/effect level solution

1 1 1 4.35850233

1 1 2 3.40443010

1 2 1 -0.24945855

1 2 2 -0.00866312

1 2 3 0.17687209

1 2 4 0.18261469

1 2 5 -0.18573210

1 2 6 0.09844458

1 2 7 -0.01877010

1 2 8 -0.04108420

 

1번 형질의 1번째 효과(고정효과)1번 수준의 해가 4.35850233이다. 1번 형질의 2번째 효과(개체 효과)1번 수준(원래 7번 개체)의 해가 0.24945855이다

 

 

 

01_ex_stam.zip

 

+ Recent posts