상단/하단(TOP/BOT) 가닥 및 A/B 대립유전자를 식별하기 위한 간단한 가이드라인

11/10/21


단일 뉴클레오티드 다형성(SNP)에 대한 DNA 가닥 및 대립유전자 지정을 결정하는 것은 어려울 수 있는데, 이는 가닥 지정 및 배향이 참조된 데이터베이스 또는 어셈블리(예: NCBI 유전체 구축 업데이트)에 따라 다를 수 있기 때문입니다. 이 문제를 해결하기 위해, Illumina는 사용된 데이터베이스 또는 유전체 구축에 관계없이 시간이 지남에 따라 동일한 대립유전자 호출을 허용하는 DNA 가닥 배향을 할당하기 위해 서열 기반 컨텍스트를 사용하여 상단/하단(TOP/BOT) 가닥 및 A/B 대립유전자 명명법을 개발했습니다.

  1. 명확한 SNP[A/(G 또는 C)] 또는 [T/(G 또는 C)]
  2. [A/T] 또는 [G/C]가 아닌 SNP의 경우, A는 항상 상단 가닥에 있고 T는 항상 하단 가닥입니다. A 및 T 뉴클레오티드는 “A 대립유전자”이고, G 및 C 뉴클레오티드는 “B 대립유전자”입니다.

  3. 모호한 SNP[A/T] 또는 [G/C]
  4. SNP가 [A/T] 또는 [G/C]인 경우: 시퀀스 워킹을 사용하여 TOP/BOT 가닥을 결정 한 다음 A/B 대립유전자를 할당합니다.

  1. 시퀀스 워킹을 사용하여 가닥 할당:
    1. SNP 위치는 “n”입니다. 뉴클레오티드는 “n”의 상류 위치 1개와 하류 위치 1개는 “n-1”과 “n+1”입니다. 뉴클레오티드는 “n”에서 2개의 업스트림 위치와 2개의 다운스트림 위치는 “n-2”와 “n+2”입니다. 기타
    2. n-1|n+1을 검사합니다. 쌍 중 하나는 “A” 또는 “T”이고 다른 하나는 “G” 또는 “C”입니까?
      1. 아니요인 경우: n-2|n+2를 검사합니다. 필요한 경우, 한 쌍이 “A” 또는 “T”이고 다른 쌍은 “G” 또는 “C”인 n-x |n+x 페어링을 찾을 때까지 계속 걸으면서 시퀀스를 진행합니다. 그런 다음 A2b 단계로 진행합니다.
      2. 예인 경우: 이 명백한 SNP 위치의 페어 5’(“n”) 또는 SNP 위치의 3’(“n”)에서 “A” 또는 “T”가 있습니까?
        • 5′인 경우: 이것이 TOP Strand입니다.
        • 3′인 경우: 이것이 BOT Strand입니다.
  2. 뉴클레오티드 명칭 A 또는 B 대립유전자 배정:

TOP 가닥의 경우: [A/T] SNP의 경우, 대립유전자 A = “A” 및 대립유전자 B = “T”. [G/C] SNP의 경우, 대립유전자 A = “C” 및 대립유전자 B = “G”.

BOT 가닥의 경우: [A/T] SNP의 경우, 대립유전자 A = “T” 및 대립유전자 B = “A”. [G/C] SNP의 경우, 대립유전자 A = “G” 및 대립유전자 B = “C”.

자세한 내용은 기술 노트 “TOP/BOT” Strand 및 “A/B” 대립유전자를 참조하십시오.