차세대 시퀀싱 용어의 정의

NGS 용어 가이드

차세대 시퀀싱 용어의 정의를 사용하여 시퀀싱 프로젝트를 계획할 때 주요 용어와 중요한 개념을 명확히 해 보세요.

NGS 용어의 정의

NGS 라이브러리 준비의 일부로 시퀀싱 라이브러리에서 각 DNA 절편의 5'와 3'말단에 라이게이션된 짧은 시퀀스 특이적 올리고. 어댑터는 Illumina 플로우 셀 표면에 존재하는 짧은 시퀀스를 상호보완합니다.
시퀀싱 리드를 참조 유전체(reference genome)와 일치시키는 과정.
Illumina 플로우 셀의 표면에서 일어나는 증폭 반응. 플로우 셀 제조 과정에서 표면은 흔히 ‘P5’와 ‘P7’이라고 하는 두 가지 다른 올리고뉴클레오티드의 얇은 층으로 코팅됩니다. 브리지 증폭의 첫 번째 단계에서는 단일 가닥 시퀀싱 라이브러리(상호보완적 어댑터 말단이 있는)를 플로우 셀에 로드합니다. 라이브러리의 개별 분자는 얇은 올리고 층을 가로질러 ‘흐르면서’ 상호보완하는 올리고에 결합합니다. 프라이밍은 라이게이션된 절편의 반대쪽 말단이 구부러져 표면에서 다른 상호보완적인 올리고에 ‘브리지’되면서 발생합니다. 변성 및 확장 사이클을 반복하면(PCR과 유사) 단일 분자가 플로우 셀 전체에 걸쳐 수백만 개의 고유한 클론 클러스터로 국소적으로 증폭됩니다. ‘클러스터링’이라고도 하는 이 과정은 NGS 기기 내의 온보드 클러스터 모듈에서 발생합니다.
새 창에서 보기
플로우 셀 표면에 결합된 템플릿 DNA의 클론 그룹. 각 클러스터는 단일 템플릿 DNA 가닥으로 시드(seed)되며, 클러스터가 최대 1000개의 복제본을 가질 때까지 브리지 증폭을 통해 복제 증폭됩니다. 플로우 셀의 각 클러스터는 단일 시퀀싱 리드를 생성합니다. 예를 들어, 플로우 셀에 10,000개의 클러스터가 있다면 10,000개의 싱글 리드와 20,000개의 페어드 엔드 리드(paired-end read)를 생성할 수 있습니다.
새 창에서 보기
모든 i5 인덱스가 매트릭스의 각 i7 인덱스와 짝을 이루어 고유한 인덱스 페어를 생성하지만 고유한 단측(single-sided) 인덱스는 생성하지 않는 인덱스 페어.
중복되는 시퀀싱 리드를 정렬하여 생성된 인실리코의 연속적인 시퀀스 확장.
새 창에서 보기

알려진 참조 염기에 정렬되거나 ‘커버’하는 시퀀싱 된 염기의 평균 수. 예를 들어, 전장 유전체가 30배 커버리지로 시퀀싱되었다는 것은 유전체의 각 염기가 평균적으로 30번 시퀀싱되었다는 것을 의미합니다. 커버리지 수준이 높을수록 더 높은 신뢰 수준으로 베이스 콜을 할 수 있습니다.

더 알아보기
주어진 뎁스에서 유전체 또는 표적 영역 전체에 걸쳐 시퀀싱된 염기의 백분율을 설명하는 지표(예: 최소 10배 커버리지로 커버된 염기의 95%). 평균 또는 중간 시퀀싱 뎁스 자체(예: 평균 커버리지 30배)는 허용 임계값 한계 이하로 시퀀싱된 염기 또는 전혀 시퀀싱되지 않은 염기의 비율을 고려하지 않습니다. 예를 들어, 데이터 세트의 보고된 ‘커버리지 분포가 95%이고 최소 10배 커버리지인 경우,’ 이는 염기의 5%가 10배 임계값 미만으로 커버되었거나 전혀 커버되지 않았음을 나타냅니다. 이러한 이유로, 커버리지 분포는 일반적으로 평균 커버리지와 함께 시퀀싱 결과를 설명하는 데 사용됩니다.
새 창에서 보기
NGS 기기에서 소모품으로 사용되는 1개, 2개 또는 8개의 물리적으로 분리된 레인이 있는 유리 슬라이드 또는 기타 고체 표면. 시퀀싱 템플릿은 플로우 셀 표면에 고정되어 효소에 대한 접근을 용이하게 하는 동시에 표면 결합 템플릿의 높은 안정성과 형광 표지된 뉴클레오티드의 낮은 비특이적 결합을 보장하는 방식으로 DNA를 보여주도록 설계되었습니다. 고체상 증폭(클러스터 생성)은 각 단일 템플릿 분자의 최대 1000개의 동일한 복사본을 근접하게 생성합니다. 평방 센티미터당 천만 개의 클러스터가 밀집되어 있습니다.
대체 텍스트 필수
라이브러리 준비 과정에서 각 DNA 절편에 추가된 고유한 짧은 DNA 시퀀스. 이 고유한 시퀀스를 통해 많은 라이브러리를 함께 풀링하고 동시에 시퀀싱할 수 있습니다. 풀링된 라이브러리에서 리드된 시퀀싱은 최종 데이터 분석 전에 바코드에 따라 컴퓨터로 식별 및 분류됩니다. 라이브러리 멀티플렉싱은 소규모 유전체로 작업하거나 관심 유전체 영역을 표적화할때 유용한 기술입니다. 바코드를 통한 멀티플렉싱은 런(run) 비용이나 런 타임을 크게 늘리지 않고 한 번의 런으로 분석되는 샘플 수를 기하급수적으로 늘릴수 있습니다.
새 창에서 보기
라이브러리 준비 과정에서 샘플 DNA가 절편화되고, 특정 크기(일반적으로는 200~500 bp이지만 더 클 수 있음)의 절편이 두 올리고 어댑터 사이에 라이게이션되거나 ‘삽입’됩니다. 원본 샘플 DNA 절편은 ‘삽입’이라고도 합니다.

유전체 DNA 샘플(또는 cDNA 샘플)을 시퀀싱 라이브러리로 변환하는 분자 생물학 프로토콜로, 그 후 NGS 기기에서 시퀀싱할 수 있습니다. 라이브러리 준비의 첫 번째 단계는 DNA 샘플을 무작위로 절편화한 다음, 각 DNA 절편에 5′ 및 3′ 어댑터를 라이게이션하는 것입니다. 또는 ‘태그멘테이션’은 절편화 및 라이게이션 반응을 단일 단계로 결합하여 라이브러리 준비 과정의 효율성을 크게 높입니다.

더 알아보기
차세대 시퀀싱의 또 다른 이름.

라이브러리 준비 과정에서 고유한 짧은 DNA 시퀀스 또는 ‘인덱스’를 각 DNA 절편에 추가하는 과정. 이 고유한 시퀀스를 통해 많은 라이브러리를 함께 풀링하고 동시에 시퀀싱할 수 있습니다. 풀링된 라이브러리에서 읽은 시퀀싱은 최종 데이터 분석 전에 컴퓨터로 식별 및 분류됩니다. 라이브러리 멀티플렉싱은 소규모 유전체로 작업하거나 관심 유전체 영역을 표적화할때 유용한 기술입니다. 멀티플렉싱은 런 비용이나 런 타임을 크게 늘리지 않고 한 번의 런으로 분석되는 샘플 수를 기하급수적으로 늘릴 수 있습니다.

더 알아보기
새 창에서 보기

시퀀싱 라이브러리의 모든 DNA 절편에 걸쳐 각 염기 위치에 동일한 비율의 A, C, G, T 뉴클레오티드가 존재하는 것. Illumina 시퀀싱 시스템에서 효과적인 이미지 분석을 위해서는 색상 균형이 필요합니다. 따라서 대부분의 Illumina 라이브러리 준비 워크플로우에는 라이브러리의 각 염기 위치에 필요한 시퀀스 다양성을 생성하는 무작위 절편화 단계가 포함되어 있습니다.

게시판 읽어보기
새 창에서 보기

동일한 런에서 DNA 절편의 양쪽 말단에서 시퀀싱하는 과정.

더 알아보기
새 창에서 보기

베이스 콜링에서 오류가 발생할 확률을 예측하거나 추정하는 NGS의 메트릭스. 품질 점수(Q-score)는 매우 작은 오류 확률을 간결하게 전달하는 역할을 합니다. Q-score가 높을수록 베이스 콜이 더 안정적이며 오류 가능성이 적다는 뜻입니다.

더 알아보기
참조 유전체는 완전히 시퀀싱되고 조립된 유전체로, 새로운 시퀀스 리드를 정렬하고 비교할 수 있는 발판 역할을 합니다. 일반적으로 시퀀싱 런에서 생성된 리드는 데이터 분석의 첫 단계로 참조 유전체에 정렬됩니다. 참조 유전체의 예로는 hg19 및 hg38이 있습니다.
SBS 기술은 형광 표지된 4개의 뉴클레오티드를 사용하여 플로우 셀 표면의 수천만 개의 클러스터를 병렬로 시퀀싱합니다. 각 시퀀싱 주기 동안 단일 표지된 데옥시뉴클레오티드 삼인산(dNTP)이 핵산 사슬에 추가됩니다. 뉴클레오티드 라벨은 중합을 위한 ‘가역적 종결자(reversible terminator)’ 역할을 합니다. dNTP 포합 후 레이저 여기 및 이미징을 통해 형광 염료를 식별한 다음 효소적으로 절단하여 다음 단계의 포합을 가능하게 합니다. 베이스 콜은 각 주기 동안 신호 강도 측정을 통해 직접 이루어집니다. 가역적 종결자에 결합된 네 가지 dNTP(A, C, T, G)는 모두 하나의 개별 분자로 존재하기 때문에 자연적인 경쟁이 포합 편향을 최소화합니다.
새 창에서 보기
주어진 샘플에서 특정 변이를 검출하는 능력을 말합니다. 대립 유전자 빈도가 낮을수록 이를 검출하는 데 필요한 민감도가 높아집니다. 차세대 시퀀싱은 모세관 전기영동보다 더 높은 민감도를 제공하여 희귀 돌연변이를 검출할 수 있는 능력을 제공합니다.
시퀀싱 리드의 시작점을 나타내는 어댑터 시퀀스에 인접한 PCR 프라이머. 시퀀싱 과정에서 프라이머는 템플릿 가닥에 있는 시퀀싱 어댑터의 일부에 결합됩니다. DNA 중합효소는 이 부위에 결합하여 상호보완적인 뉴클레오티드를 염기별로 성장하는 반대쪽 가닥에 포합합니다.
시퀀싱 라이브러리에서 각 DNA 절편에 해당하는 A, T, C, G 염기의 데이터 문자열. Illumina 기술에서는 라이브러리가 시퀀싱될 때 각 DNA 절편이 플로우 셀 표면에 클러스터를 생성하고 각 클러스터가 단일 시퀀싱 리드를 생성합니다. (예를 들어, 플로우 셀의 클러스터 100만 개는 100만 개의 싱글 리드와 200만 개의 페어링 엔드 리드를 생성합니다.) 리드 길이는 애플리케이션의 요구 사항에 따라 25 bp에서 300 bp 이상까지 다양합니다.
기질에 부착된 형광체의 밝기. Sequencing by synthesis(SBS)에서는 각 사이클 동안 신호 강도 측정에서 직접 베이스 콜이 이루어집니다.
Illumina는 단일 및 이중 인덱싱을 포함한 여러 인덱싱 방법을 지원합니다. 단일 인덱싱을 사용하면 최대 48개의 고유한 6-염기 인덱스를 사용하여 최대 48개의 고유한 태그가 지정된 라이브러리를 생성할 수 있습니다. 이중 인덱싱을 사용하면 최대 24개의 고유한 8-염기 인덱스 1 시퀀스와 최대 16개의 고유한 8-염기 인덱스 2 시퀀스를 조합하여 최대 384개의 고유한 태그가 지정된 라이브러리를 생성할 수 있습니다.
이중 가닥 DNA가 동시에 절편화되고 Illumina 어댑터 시퀀스와 PCR 프라이머 결합 부위에 태그가 지정되는 빠른 효소 반응. 이 결합 반응은 라이브러리 준비 과정에서 별도의 기계적 절단 단계가 필요하지 않습니다.
새 창에서 보기
표적 재시퀀싱 실험에서 모든 표적 영역의 총 크기. 표적 크기는 사전 설계된 패널 또는 맞춤형 패널에 따라 달라집니다. (예를 들어, 각 표적 영역이 100 kb인 22개의 표적 영역으로 구성된 패널의 총 표적 크기는 2200 kb입니다.)
차세대 시퀀싱 기기에서 생성되는 데이터의 양. 일반적으로 메가베이스(Mb) 또는 기가베이스(Gb) 단위로 정의됩니다.
1메가베이스(Mb) = 1M 개 염기
1기가베이스(Gb) = 1B 개 염기

모든 i5 인덱스와 모든 i7 인덱스가 한 번만 사용되도록 구성한 인덱스 페어. 고유한 듀얼 인덱스를 사용하면 인덱싱된 호핑된 리드를 식별하고 필터링할 수 있어 멀티플렉스 샘플에 대한 신뢰도를 높일 수 있습니다.

게시판 읽어보기

유전체의 단백질 코딩 영역(엑솜)만 표적으로 삼는 널리 사용되는 시퀀싱 방법.

더 알아보기

전체 유전체를 염기별로 볼 수 있는 포괄적인 방법.

더 알아보기

NGS 실험 디자인

 

첫 번째 시퀀싱 런에 필요한 리드 길이, 시퀀싱 커버리지 등 모든 것에 대해 알아보세요.

계획 시작하기

문의하기

Illumina의 제품 또는 NGS 시작 방법에 대해 질문이 있으신가요? Illumina 담당자에게 문의해 보세요.

추가 리소스

NGS 심층 소개

상세한 개요는 Illumina 시퀀싱 chemistry의 기본, 기술의 주요 발전 사항 등을 설명합니다.

온라인 교육

Illumina의 모든 교육 과정을 보거나 새로운 웨비나에 등록하세요.

기술 게시판

기술 지원 팀에서 더 많은 시퀀싱 팁과 요령을 찾아보세요.