genotype을 결정하였으면 분석을 위하여 다운로드를 받아야 한다. 그런데 이때 아무런 조치를 하지 않으면 개체의 이름으로 cel 파일 이름이 출력된다. 난감한 상황이다. 여기서는 genotype을 다운로드할 때 개체의 이름으로 cel 파일 이름이 아니라 우리가 입력한 이름으로 출력하는 방법을 설명한다. 

실험실에 cel 파일 이름을 어레이타입_어레이바코드_어레이위치_개체번호 형식으로 만들어 달라고 요구하는 것이 바람직할 것이라고 설명했다. cel 파일 이름이 이런 형식으로 되어 있다면 다음과 같이 쉽게 개체 이름을 추출할 수 있을 것이다.

 

A2 cell 있는 cel 파일 이름을 잘 살펴 보면 네 번째 "_" 다음에 개체 번호가 시작된다. 네 번째 "_"의 위치를 찾아내는 함수는 =FIND("~", SUBSTITUTE(A2,"_","~",4))+1 과 같다. 네 번째 "_" 를 "~"로 바꾼다음 "~"의 위치를 찾는 함수이다. 그리고 개체 번호 다음 문자가 "."인데 이것의 위치를 찾아내는 함수는 =FIND(".",A2)이다. 개체 이름은 =MID(A2,C2,D2-C2) 함수로 추출할 수 있다. 결과는 다음과 같다.

 

Sample Filename 열과 Alternate Sample Name 열만 출력하여 필요한 파일을 만들면 된다. 동영상에선 간단히 개체 이름을 입력하지만 실제에선 위와 같은 방법을 이용하여야 한다.

 

 

 

+ Recent posts