차세대 시퀀싱 용어의 정의

NGS 용어의 정의

차세대 시퀀싱(next-generation sequencing, NGS) 용어 가이드

차세대 시퀀싱 용어의 가이드를 사용하여 주요 용어의 정의를 확인하고 시퀀싱 프로젝트를 계획할 때 중요한 개념을 명확히 파악하세요.

Sanger 시퀀싱과 NGS 사이의 중요한 차이점은 시퀀싱 볼륨입니다. Sanger 방법은 한 번에 하나의 DNA 절편 만을 시퀀싱하는 반면, NGS는 런당 수백만개의 절편을 대규모 병렬형으로 동시에 시퀀싱합니다. 이 프로세스를 통해 한 번에 수백 내지 수천개의 유전자를 시퀀싱합니다. NGS는 또한 딥 시퀀싱을 통해 새로운 변이 또는 희귀 변이를 검출할수 있는 더 큰 발견 역량을 제공합니다.

일반적인 NGS 용어의 정의

NGS 라이브러리 준비의 과정에서, 시퀀싱 라이브러리의 각 DNA 절편 5'와 3'말단에 라이게이션된 짧은 시퀀스 특이적 올리고. 어댑터는 Illumina 플로우 셀 표면에 존재하는 짧은 시퀀스와 상보적인 서열을 가지고 있습니다.
시퀀싱 리드를 참조 유전체(reference genome)와 일치시키는 과정.
Illumina 플로우 셀의 표면에서 일어나는 증폭 반응. 제조 과정에서 플로우 셀 표면은 ‘P5’와 ‘P7’이라고 하는 두 가지 다른 올리고뉴클레오티드의 얇은 층으로 코팅됩니다. 브리지 증폭의 첫 번째 단계에서는 단일 가닥 시퀀싱 라이브러리(상보적인 서열의 어댑터 말단이 있는)를 플로우 셀에 로드합니다. 라이브러리의 개별 분자는 얇은 올리고 층을 가로질러 ‘흐르면서’ 상보적인 서열의 올리고에 결합합니다. 프라이밍은 라이게이션된 절편의 반대쪽 말단이 구부러져, 표면에서 다른 상호보완적인 올리고에 ‘브리지’되면서 발생합니다. PCR과 유사하게 denature 및 extension 사이클을 반복하면서 단일 분자가 국소적인 자리에 수백만 개의 고유한 클론 클러스터로 증폭되며, 이 과정은 플로우 셀 전체에 걸쳐 이루어집니다. ‘클러스터링’이라고도 하는 이 과정은 NGS 기기 내의 온보드 클러스터 모듈에서 발생합니다.
새 창에서 보기
플로우 셀 표면에 결합된 템플릿 DNA의 클론 그룹. 각 클러스터는 단일 템플릿 DNA 가닥으로 시드(seed)되며, 클러스터가 최대 1000개의 복제본을 가질 때까지 브리지 증폭을 통해 복제됩니다. 플로우 셀의 각 클러스터는 단일 시퀀싱 리드를 생성합니다. 예를 들어, 플로우 셀에 10,000개의 클러스터가 있다면 10,000개의 싱글 리드와 20,000개의 페어드 엔드 리드(paired-end read)를 생성할 수 있습니다.
새 창에서 보기
모든 i5 인덱스가 매트릭스의 각 i7 인덱스와 짝을 이루어 고유한 인덱스 쌍을 생성하지만, 단측(single-sided) 인덱스는 고유하지 않은 인덱스 페어.
중복되는 시퀀싱 리드를 정렬하여 생성된 인실리코의 연속적인 시퀀스 확장.
새 창에서 보기

알려진 참조 염기에 정렬되거나 ‘커버’하는 시퀀싱 된 염기의 평균 수. 예를 들어, 전장 유전체가 30배 커버리지로 시퀀싱되었다는 것은 유전체의 각 염기가 평균적으로 30번 시퀀싱되었다는 것을 의미합니다. 커버리지 수준이 높을수록 베이스 콜의 신뢰 수준이 더 높아질 수 있습니다.

더 알아보기
유전체 또는 표적 영역에 걸쳐 기준 뎁스 이상으로 시퀀싱된 염기의 정도를 백분율로 설명하는 지표(예: 최소 10배 커버리지로 커버된 염기가 95%). 평균 또는 중간 시퀀싱 뎁스 자체(예: 평균 커버리지 30배)는 허용 임계값 한계 이하로 시퀀싱된 염기 또는 전혀 시퀀싱되지 않은 염기의 비율을 고려하지 않습니다. 예를 들어, 데이터 세트의 보고된 ‘최소 10배 커버리지 뎁스의 커버리지 분포가 95% 인 경우,’ 이는 염기의 5%가 10배 임계값 미만으로 커버되었거나 전혀 커버되지 않았음을 나타냅니다. 이러한 이유로, 커버리지 분포는 일반적으로 평균 커버리지와 함께 시퀀싱 결과를 설명하는 데 사용됩니다.
새 창에서 보기
NGS 기기에서 소모품으로 사용되는 1개, 2개 또는 8개의 물리적으로 분리된 레인이 있는 유리 슬라이드 또는 기타 고체 표면. 시퀀싱 템플릿은 플로우 셀 표면에 고정되어 효소에 대한 접근을 용이하게 하는 동시에 표면 결합 템플릿의 높은 안정성과 형광 표지된 뉴클레오티드의 낮은 비특이적 결합을 보장하는 방식으로 DNA를 보여주도록 설계되었습니다. 고체상 증폭(클러스터 생성)은 각 단일 템플릿 분자의 최대 1000개의 동일한 복사본을 국소 범위 내에서 생성합니다. 평방 센티미터당 천만 개의 클러스터가 밀집되어 있습니다.
대체 텍스트 필수
라이브러리 준비 과정에서, 각 DNA 절편에 추가된 짧은 고유의 DNA 서열. 이 고유한 서열을 통해 많은 라이브러리를 함께 풀링하고 동시에 시퀀싱할 수 있습니다. 풀링된 라이브러리에서 생산된 시퀀싱 데이터는 최종 데이터 분석 전에 바코드에 의해 식별 및 분류됩니다. 라이브러리 멀티플렉싱은 소규모 유전체나 관심 유전체 영역이 표적화된 어플리케이션에서 유용한 기술입니다. 바코드를 통한 멀티플렉싱은 런(run) 비용이나 런 타임을 크게 늘리지 않고 한 번의 런으로 분석되는 샘플 수를 기하급수적으로 늘릴수 있습니다.
새 창에서 보기
i5 및 i7 시퀀싱은 관심 시퀀스를 포함하는 R1 및 R2 리드의 업스트림(i5) 및 다운스트림(i7)에서 발견되는 Illumina 시퀀싱 런의 인덱스 리드입니다. 짧은 어댑터가 뉴클레오타이드 절편에 추가되어 Illumina 시퀀서와의 호환성을 부여합니다. 이러한 어댑터 시퀀스는 시퀀서의 플로우 셀에 있는 상보적인 시퀀스에 결합합니다.
라이브러리 준비 과정에서 샘플 DNA가 절편화되고, 특정 크기(일반적으로는 200~500 bp이지만 더 클 수 있음)의 절편이 두 올리고 어댑터 사이에 라이게이션되거나 ‘삽입’됩니다. 원본 샘플 DNA 절편은 ‘삽입’이라고도 합니다.

유전체 DNA 샘플(또는 cDNA 샘플)을 시퀀싱 라이브러리로 변환하는 분자 생물학 프로토콜로, 그 후 NGS 기기에서 시퀀싱할 수 있습니다. 라이브러리 준비의 첫 번째 단계는 DNA 샘플을 무작위로 절편화한 다음, 각 DNA 절편에 5′ 및 3′ 어댑터를 라이게이션하는 것입니다. 또는 ‘태그멘테이션’은 절편화 및 라이게이션 반응을 단일 단계로 결합하여 라이브러리 준비 과정의 효율성을 크게 높입니다.

더 알아보기
차세대 시퀀싱의 또 다른 이름.

라이브러리 준비 과정에서 고유한 짧은 DNA 시퀀스 또는 ‘인덱스’를 각 DNA 절편에 추가하는 과정. 이 고유한 시퀀스를 통해 많은 라이브러리를 함께 풀링하고 동시에 시퀀싱할 수 있습니다. 풀링된 라이브러리에서 읽은 시퀀싱 리드는 최종 데이터 분석 전에 식별 및 분류됩니다. 라이브러리 멀티플렉싱은 소규모 유전체나 관심 유전체 영역이 표적화된 어플리케이션에서 유용한 기술입니다. 멀티플렉싱은 런 비용이나 런 타임을 크게 늘리지 않고 한 번의 런으로 분석되는 샘플 수를 기하급수적으로 늘릴 수 있습니다.

더 알아보기
새 창에서 보기

시퀀싱 라이브러리의 모든 DNA 절편에 걸쳐 각 염기 위치에 동일한 비율의 A, C, G, T 뉴클레오티드가 존재하는 것. Illumina 시퀀싱 시스템에서 효과적인 이미지 분석을 위해서는 색상 균형이 필요합니다. 따라서 대부분의 Illumina 라이브러리 준비 워크플로우에는 라이브러리의 각 염기 위치에 필요한 시퀀스 다양성을 생성하는 무작위 절편화 단계가 포함되어 있습니다.

Illumina 지식
새 창에서 보기

동일한 런에서 DNA 절편의 양쪽 말단에서 시퀀싱하는 과정.

더 알아보기
새 창에서 보기

베이스 콜링에서 오류가 발생할 확률을 예측하거나 추정하는 NGS의 메트릭스. 품질 점수(Q-score)는 매우 작은 오류 확률을 간결하게 전달하는 역할을 합니다. Q-score가 높을수록 베이스 콜이 더 안정적이며 오류 가능성이 적다는 뜻입니다.

더 알아보기
하나의 ‘리드(read)’는 Illumina 플로우 셀에서 브리지 증폭 과정을 통해 얻은 뉴클레오티드 절편의 순방향 및 역방향 시퀀스를 의미합니다.
참조 유전체는 완전히 시퀀싱되고 조립된 유전체로, 새로운 시퀀스 리드를 정렬하고 비교할 수 있는 발판 역할을 합니다. 일반적으로, 시퀀싱 런에서 생성된 리드는 데이터 분석의 첫 단계로 참조 유전체에 정렬됩니다. 참조 유전체의 예로는 hg19 및 hg38이 있습니다.
SBS 기술은 형광 표지된 4개의 뉴클레오티드를 사용하여 플로우 셀 표면의 수천만 개의 클러스터를 병렬로 시퀀싱합니다. 각 시퀀싱 주기 동안, 형광 표지된 데옥시뉴클레오티드 삼인산(dNTP) 단일 분자가 핵산 사슬에 추가됩니다. 뉴클레오티드 라벨은 중합을 위한 ‘가역적 종결자(reversible terminator)’ 역할을 합니다. dNTP 포합 후 레이저 여기 및 이미징을 통해 형광 염료를 식별한 다음 효소적으로 절단하여 다음 단계의 포합을 가능하게 합니다. 베이스 콜은 각 주기 동안 신호 강도 측정을 통해 직접 이루어집니다. 가역적 종결자에 결합된 네 가지 dNTP(A, C, T, G)는 모두 하나의 개별 분자로 존재하기 때문에 자연적인 경쟁이 포합 편향을 최소화합니다.
새 창에서 보기
주어진 샘플에서 특정 변이를 검출하는 능력을 말합니다. 대립 유전자 빈도가 낮을수록 이를 검출하는 데 필요한 민감도가 높아집니다. 차세대 시퀀싱은 모세관 전기영동보다 더 높은 민감도를 제공하여 희귀 돌연변이를 검출할 수 있는 능력을 제공합니다.
시퀀싱 리드의 시작점을 나타내는 어댑터 시퀀스에 인접한 PCR 프라이머. 시퀀싱 과정에서 프라이머는 템플릿 가닥에 있는 시퀀싱 어댑터의 일부에 결합됩니다. DNA 중합효소는 이 부위에 결합하여 상호보완적인 뉴클레오티드를 염기별로 성장하는 반대쪽 가닥에 포합합니다.
시퀀싱 라이브러리에서 각 DNA 절편에 해당하는 A, T, C, G 염기의 데이터 문자열. Illumina 기술에서는 라이브러리가 시퀀싱될 때 각 DNA 절편이 플로우 셀 표면에 클러스터를 생성하고 각 클러스터가 단일 시퀀싱 리드를 생성합니다. (예를 들어, 플로우 셀의 클러스터 100만 개는 100만 개의 싱글 리드와 200만 개의 페어링 엔드 리드를 생성합니다.) 리드 길이는 애플리케이션의 요구 사항에 따라 25 bp에서 300 bp 이상까지 다양합니다.
기질에 부착된 형광체의 밝기. Sequencing by synthesis(SBS)에서는 각 사이클 동안 신호 강도 측정에서 직접 베이스 콜이 이루어집니다.
Illumina는 단일 및 이중 인덱싱을 포함한 여러 인덱싱 방법을 지원합니다. 단일 인덱싱을 사용하면 최대 48개의 고유한 6-염기 인덱스를 사용하여 최대 48개의 고유한 태그가 지정된 라이브러리를 생성할 수 있습니다. 이중 인덱싱을 사용하면 최대 24개의 고유한 8-염기 인덱스 1 시퀀스와 최대 16개의 고유한 8-염기 인덱스 2 시퀀스를 조합하여 최대 384개의 고유한 태그가 지정된 라이브러리를 생성할 수 있습니다.
이중 가닥 DNA가 절편화되며 동시에 Illumina 어댑터 시퀀스와 PCR 프라이머 결합 부위에 태그가 지정되는 빠른 효소 반응. 이 결합 반응은 라이브러리 준비 과정에서 별도의 기계적 절단 단계가 필요하지 않습니다.
새 창에서 보기
표적 재시퀀싱 실험에서 모든 표적 영역의 총 크기. 표적 크기는 사전 설계된 패널 또는 맞춤형 패널에 따라 달라집니다. (예를 들어, 각 표적 영역이 100 kb인 22개의 표적 영역으로 구성된 패널의 총 표적 크기는 2200 kb입니다.)
차세대 시퀀싱 기기에서 생성되는 데이터의 양. 일반적으로 메가베이스(Mb) 또는 기가베이스(Gb) 단위로 정의됩니다.
1메가베이스(Mb) = 1M 개 염기
1기가베이스(Gb) = 1B 개 염기

모든 i5 인덱스와 모든 i7 인덱스가 한 번만 사용되도록 구성한 인덱스 페어. 고유한 듀얼 인덱스를 사용하면 호핑된 인덱싱 리드를 식별하고 필터링할 수 있어 멀티플렉스 샘플에 대한 신뢰도를 높일 수 있습니다.

게시판 읽어 보기

유전체의 단백질 코딩 영역(엑솜)만 표적으로 삼는 널리 사용되는 시퀀싱 방법.

더 알아보기

전체 유전체를 염기별로 볼 수 있는 포괄적인 방법.

더 알아보기
NGS 첫 사용 eBook 커버
NGS 시작하기 eBook

연구에 NGS를 사용하는 것에 대해 궁금하신가요? 새로운 기술을 도입하는 것이 두렵게 느껴질 수 있기 때문에 NGS를 검사실에 도입하기 위한 포괄적이면서도 따라 하기 쉬운 가이드를 만들었습니다. NGS 방법, 워크플로우, 데이터 분석 솔루션, 추가 용어의 정의에 대해 알아보고 NGS를 시작하기 위한 단계별 가이드를 찾아볼 수 있습니다.

ebook 다운로드
추가 리소스
초보자를 위한 NGS 기본 사항

NGS에 대해 더 자세히 알고 싶으신가요? 이 페이지에서는 차세대 시퀀싱(next-generation sequencing, NGS)에 대한 간단하고 명확한 설명과 기존 방법 대비 다양한 이점을 제시합니다.

NGS 튜토리얼

차세대 시퀀싱의 주요 개념을 이해하는 데 도움이 되도록 설계된 포괄적인 튜토리얼 목록을 살펴보세요. 라이브러리 준비, 시퀀싱 및 데이터 분석에 대한 모범 사례를 안내해 드립니다.

온라인 교육

기기, Library Prep Kit, 소프트웨어 등에 대한 온디맨드 트레이닝에 액세스하세요.