생화학/생물정보학

NCBI-3-DNA sequence(DNA 서열) 찾기

NSRDL 2013. 5. 12. 15:08

4번째 포스트 이군요.


-----------------------------------------------------------------------------------


이번에는 DNA sequence를 찾아보도록 하겟습니다.

이전 2번째 포스트 (NCBI-초급-2-protein sequence(단백질 서열) 찾기)와 하는 방법은 같으므로 쉽게 하실수 있으리라 생각합니다.

 

자 그럼 오늘은 p53 gene의 DNA sequence를 찾아보겟습니다.

 

▼우선 검색 메뉴를 Nucleotide로 설정해줍니다. 그후 검색어를 적어줍니다. 저는 p53을 찾을것입니다.


▼search버튼을 누루면 아래와 같이 창이 바뀝니다.


검색결과가 굉장히 많습니다. 우선 종을 선택해주셔야겟죠! 당연히 인간을 찾을것입니다.

 

▼이전 포스트에 한것처럼 종을 선택해줍니다.


그런데 꼭 이렇게 종을 선택해 주어야 해야하는것은 아닙니다. 

 

▼아래와 같이 human과 같이 종을 적어줄수도 있습니다.


검색결과입니다. 뭔가 차이가 있나요? 그렇게 많이 차이나보이진 않습니다만 역시... 검색갯수가 차이납니다. 

따로 종을 선택해주었을때 17121개 / human을 적어서 한번에 검색햇을때 7256개 

2배 정도 따로 종을 선택해주니까 많이 검색됩니다. 이유는 NCBI에 등재될 때 종을 선택하여 등재하기 때문입니다.

하지만 결과만 말씀드리면 두개의 결과는 모두 큰 차이가 없습니다. 

보통 내가 찾고자 하는 nucleotide의 검색결과는 보통 200개 내에서 찾을 수 있습니다. 

검색결과가 신뢰도를 바탕으로 하기때문입니다. 따라서 그 이외에는 모두다 버리는 검색결과입니다. 

여담입니다만 자주 찾다보면 보통 50개 이내에서 다 찾습니다. 200개는 최대로 검색한다고 했을때 원하는 정보를 얻어봣네요.

어쨋든 종을 따로 선택하지 않으셔도 "원하는 검색어 - 종" 이렇게 검색하여도 무관합니다.

 

▼본론으로 돌아가서 검색결과를 확인하고  p53 을 찾아보겟습니다. 위에는다 partial 이었네요. 12번째 complete를 찾았습니다.


▼클릭하여 들어오시면 p53 유전자에 대한 정보가 뜹니다.


▼역시 맨 아래에 DNA 서열이 나와있습니다.

-----------------------------------------------------------------------------------

 

4번째 포스트는 여기까지 입니다.

 

5번째 protein sequence와 DNA sequence를 저장하는 방법에 대해서 알려드리겠습니다.

 

부족한 부분이 많지만 댓글로 수정 요청이나, 알고싶은 부분을 알려주시면 최대한 적어드리겟습니다.


출처 


http://www.ncbi.nlm.nih.gov/