시퀀스 파일 형식

다양한 데이터 분석 옵션을 위한 시퀀스 파일 형식

시퀀싱 데이터의 다운스트림 분석을 위해 선호하는 형식을 선택하세요.

Illumina 시퀀싱을 위한 파일 형식

데이터를 FASTQ 파일과 같은 호환 가능한 시퀀스 파일 형식으로 변환하고 시퀀싱 데이터의 다운스트림 분석을 수행하는 데 다양한 옵션을 사용할 수 있습니다. Illumina 시퀀서는 클라우드 기반 데이터 관리, 분석 및 협업을 위해 데이터를 Illumina Connected Analytics 및 BaseSpace Sequence Hub로 쉽게 스트리밍할 수 있도록 설계되었습니다.

원시 데이터 파일은 대규모 코호트의 간소화된 집계와 마이닝을 위해 표준화된 데이터 형식과 호환되거나 쉽게 변환되는 시퀀스 파일 형식으로 제공됩니다. DRAGEN Bio-IT Platform을 사용하면 최신 파일 형식인 FASTQ.ORA를 사용할 수 있습니다. FASTQ.ORA는 크기, 전송 시간 및 스토리지 비용을 줄이는 무손실 압축(lossless compression) 파일입니다.

FASTQ 시퀀스 파일 형식

FASTQ는 원시 시퀀스 데이터와 품질 점수를 모두 저장하는 텍스트 기반 시퀀싱 데이터 파일 형식입니다. FASTQ 파일은 Illumina 시퀀싱 시스템의 NGS 데이터를 저장하기 위한 표준 형식이 되었으며 다양한 보조 데이터 분석 솔루션의 입력으로 사용할 수 있습니다.

MiniSeq 및 MiSeq 시퀀싱 시스템은 데이터를 BCL에서 FASTQ 형식으로 자동 변환하는 옵션을 제공하므로 별도의 변환 소프트웨어가 필요하지 않습니다.

FASTQ 파일에 대해 더 알아보기

FASTQ ORA 시퀀스 파일 형식

FASTQ ORA는 텍스트 기반 FASTQ 시퀀싱 데이터 파일 형식의 이진 압축 파일 형식입니다. fastq.ora 파일은 데이터 무결성을 손상시키지 않으면서 해당 fastq.gz 파일보다 최대 5배 작습니다. 여기에서 무료로 제공되는 압축 해제 소프트웨어를 사용하면 모든 fastq.ora 파일을 읽을 수 있습니다. 소프트웨어를 설치하면 간단한 명령을 사용하여 즉시 압축 해제 출력을 BWA1, STAR2 및 Bowtie3와 같이 널리 사용되는 광범위한 매핑 도구로 직접 보낼 수 있습니다. DRAGEN ORA 압축은 DRAGEN Server 및 온보드 NextSeq1000/2000에서 사용할 수 있습니다.

BCL 시퀀스 파일 형식

BCL(Binary base call) 시퀀스 파일 형식은 사용자가 개발한 데이터 분석 도구 또는 타사 데이터 분석 도구와 함께 사용하기 위해 FASTQ 형식으로 변환해야 합니다. NextSeq 및 HiSeq 시퀀싱 시스템과 NovaSeq 6000은 BCL 형식의 원시 데이터 파일을 생성합니다.

DRAGEN Bio-IT Platform은 파이프라인 제품군의 일부로 BCL을 FASTQ 파일로 신속하게 변환합니다.

Illumina는 BCL 파일을 FASTQ 파일로 변환하는 독립형 BCL Convert 소프트웨어도 제공합니다. BCL Convert는 다운스트림 분석을 위해 데이터를 디멀티플렉싱하고 BCL 파일을 표준 FASTQ 파일 형식으로 변환하는 독립형 변환 소프트웨어 솔루션입니다.

기타 시퀀스 파일 형식

FASTQ 파일은 시퀀싱 데이터 분석을 위한 일반적인 시작 형식입니다. 그러나 BaseSpace Sequence Hub는 2차 및 3차 분석 프로그램에 공통적인 다른 파일 형식을 생성할 수 있습니다.

NGS 데이터의 2차 또는 3차 분석 중에 Illumina 인포매틱스 플랫폼에 있는 소프트웨어 플랫폼과 앱은 종종 분석 워크플로우의 일환으로 FASTQ 파일의 원시 시퀀스 파일을 다른 시퀀스 파일 형식(예: .vcf, .bam)으로 변환합니다.

뉴스레터, 사례 연구 및 유전체 분석 기법에 대한 정보를 받고 싶으신가요?

이메일 주소를 입력해 주세요.

추가 자료

개발자 포털

사용자 가이드, 릴리즈 노트 및 추가 기술 정보를 열람해 보세요.

온라인 교육

이러한 무료 온라인 과정은 라이브러리 준비, 시퀀싱 및 데이터 분석에서 공통 주제를 다룹니다.

Illumina DRAGEN Bio-IT Platform 교육

정확하고 매우 신속한 2차 분석 플랫폼 및 동반 파이프라인에 대해 더 알아보세요.

엔터프라이즈급 보호

가장 엄격한 보안 요구 사항을 충족하기 위해 Illumina Connected Analytics Platform 구축의 핵심을 보안과 규정 준수에 두었습니다.

참고 문헌
  1. Li H. and Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform. Bioinformatics. 2009 Jul 15; 25(14): 1754–1760.
  2. Dobin A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013 Jan; 29(1): 15–21.
  3. Langmead B. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology 2009 10:R25