고유한 분자 식별자(Unique molecular identifier, UMI)는 시퀀싱 중에 오류 수정과 정확도 향상을 제공하는 일종의 분자 바코드입니다.
이러한 분자 바코드는 샘플 라이브러리에서 각 분자를 고유하게 태그하는 데 사용되는 짧은 시퀀스입니다. UMI는 광범위한 시퀀싱 애플리케이션에 사용되며, 대부분 DNA 및 cDNA의 PCR 중복을 중심으로 사용됩니다. UMI 중복 제거는 RNA-seq 유전자 발현 분석 및 기타 정량적 시퀀싱 방법에도 유용합니다.
UMI를 사용한 시퀀싱은 위양성(false-positive) 변이 검출 비율을 줄이고 변이 검출 민감도를 높일 수 있습니다. 출발 물질(starting material)의 각 핵산에는 고유한 분자 바코드가 태그되어 있기 때문에 바이오인포매틱스 소프트웨어는 높은 수준의 정확도로 중복 판독과 PCR 오류를 걸러내고 고유한 판독을 보고하여 최종 데이터 분석 전에 식별된 오류를 제거할 수 있습니다.
두 기술 모두 다운스트림 데이터 분석 중 멀티플렉싱(multiplexing) 및 디멀티플렉싱(demultiplexing)에 유용하지만, 주요 차이점은 UMI 시퀀싱은 PCR 증폭 전에 샘플의 각 분자에 고유한 시퀀스로 라벨을 붙인다는 점입니다.
고유한 이중 인덱스(UDI)를 사용하면 각 샘플 인덱스는 특정 샘플 라이브러리에만 적용됩니다. 샘플의 모든 핵산은 동일한 시퀀스 태그로 라벨링되며, 결과 라이브러리는 다른 라이브러리와 풀링되어 단일 런(run)으로서 병렬로 시퀀싱됩니다.
UMI는 주어진 샘플 라이브러리 내의 각 분자에 고유한 바코드를 통합합니다. 각 원래 DNA 절편에 개별 바코드를 통합하면 원래 샘플에 존재하는 변이 대립유전자(실제 변이)를 라이브러리 준비, 표적 인리치먼트(enrichment) 또는 시퀀싱 중에 발생한 오류와 구별할 수 있습니다.
Illumina가 귀하의 요구 사항을 살펴보고 추천해 드리겠습니다.