초심자를 위한 바이오인포매틱스

초심자를 위한 바이오인포매틱스

Illumina는 더 빠르고, 더 쉽고, 더 저렴합니다

NGS 데이터와 바이오인포매틱스

NGS 데이터 분석이 쉬워집니다

바이오인포매틱스는 생물학자들에게 부담스럽게 느껴질 수 있습니다. 최근까지 시퀀서에서 데이터를 분석하려면 바이오인포매틱스에 대한 숙련된 경험이 필요했습니다. 많은 검사실에서 제한된 사내 또는 외부 생물정보학자에게 의존했기 때문에 처리 시간이 오래 걸렸습니다. NGS 데이터의 분석과 해석은 여전히 많은 검사실에서 인사이트를 얻는 데 가장 큰 걸림돌로 작용하고 있습니다. 다행히도 사용하기 쉽고 상업적으로 이용 가능한 분석 및 해석 도구가 많이 나와 있어 생물학자들이 NGS 데이터 분석에 쉽게 접근할 수 있습니다.

바이오인포매틱스 시작하기

바이오인포매틱스 솔루션 평가에는 다음과 같은 몇 가지 고려 사항이 포함됩니다.

  • 통합 및 호환성: 시퀀싱 기기, 소프트웨어, 워크플로우와의 원활한 통합은 데이터 전송 문제를 줄여 분석 및 발견 프로세스를 간소화합니다. 업계 표준 형식 및 프로토콜과의 호환성은 다른 도구 및 리소스와의 상호 운용성을 보장합니다.
  • 정확성과 혁신: 상용 소프트웨어를 구매하든, 자체 인포매틱스 워크플로우를 구축하든, 알고리즘, 데이터베이스, 파이프라인이 포괄적이고 견고한지 확인하세요. 유전체 발견 속도가 빠르게 증가함에 따라 최신 파이프라인과 혁신으로 워크플로우를 쉽게 업데이트할 수 있어야 고품질의 결과를 일관되게 얻을 수 있습니다. 상용 솔루션을 선택할 때는 출판물, 고객 추천, 독립적인 평가를 통해 데이터 정확성에 대한 증거를 찾아보세요.
  • 다양한 애플리케이션 및 사용 사례 지원: 특정 연구 요건을 충족하는 소프트웨어의 능력을 평가하세요. 여러 연구 분야의 애플리케이션을 지원할 수 있는 능력, 구성 가능한 워크플로우, 데이터 형식, 다양한 배포 옵션은 프로젝트의 고유한 과제를 해결하는 데 필수적입니다.
  • 확장성: 바이오인포매틱스 인프라가 현재 데이터 볼륨을 수용하고 필요에 따라 원활하게 확장할 수 있는지 확인하세요. 확장 가능한 플랫폼은 대규모 데이터 세트를 적시에 분석하고 처리하는 데 매우 중요합니다.

바이오인포매틱스에 대해 더 자세히 알아보려면 유전자 발현 및 조절 eBook을 다운로드하세요.

Illumina 데이터 분석 도구의 이점

Illumina는 직관적이고 사용이 용이한 소프트웨어를 제공하여 귀하의 시퀀서를 쉽게 연결할 수 있습니다. 이제 막 시작하는 실험실을 위해 Illumina는 단일 샘플 보고서 작성, 바이오마커 발견, 인구집단 연구에 맞춤화된 솔루션을 제공합니다. Illumina의 도구는 시퀀싱 런이 완료된 후 즉시 실행되도록 설정할 수 있으므로, 자동화된 인사이트 또는 보고서로 돌아갈 수 있습니다. Illumina는 사용하기 쉬운 시각화 도구와 가장 정확한 2차 분석¹을 제공하여 신뢰할 수 있는 인사이트를 더 빠르게 얻을 수 있도록 지원합니다. 

수상 경력에 빛나는 정확성

Illumina의 분석 소프트웨어는 데이터 정확도에 대한 새로운 기준을 제시하며, PrecisionFDA 진실성 챌린지에서 보듯이 최고의 정밀도와 전반적인 정확도에 대한 업계 챌린지에서 우승했습니다.1 Illumina 시퀀서와 결합된 Illumina Genome은 시장에서 가장 정확합니다.

포괄성

연구 및 임상 실험실을 위한 다양한 사용 사례 및 애플리케이션을 지원하는 디지털 솔루션 제품군을 확장합니다.

연결된 전체적인 워크플로우

Illumina Connected Software는 검사실 및 샘플 관리부터 해석에 이르기까지 NGS 워크플로우의 모든 단계를 위한 통합 솔루션을 제공합니다. 수동 처리점을 줄임으로써 보다 심층적인 인사이트를 더 빠르게 얻을 수 있습니다.

쉬운 사용

선별된 포괄적인 포인트 앤 클릭 분석 애플리케이션 메뉴와 사용자 친화적인 그래픽 인터페이스를 활용하여 직관적이고 가이드에 따라 분석을 수행할 수 있습니다.

보안 및 공유 가능

보안과 프라이버시는 Illumina 소프트웨어의 핵심입니다. 엔터프라이즈 클라우드와 온프레미스 솔루션 모두 글로벌 및 지역 규정을 염두에 두고 구축되었습니다. 민감도가 높은 유전체 데이터에 관해서는 Illumina가 신뢰할 수 있는 파트너입니다.

연구와 함께 확장

Illumina의 솔루션은 단일 샘플 분석 지원부터 인구집단 전체 분석에 이르기까지 연구자가 성장함에 따라 확장할 수 있도록 지원합니다. 연구자들은 단일 샘플을 해석하거나 여러 소스의 데이터를 집계하여 유전적 추세를 이해하고 인구집단 규모의 발견을 할 수 있습니다.

"BaseSpace Sequence Hub는 바이오인포매틱스 직원이나 서버 없이도 데이터를 분석, 저장, 배포할 수 있게 해 줍니다. BaseSpace가 없었다면 이 수준의 데이터 생성 및 운영 효율성을 달성하는 데 더 오랜 시간이 걸리고 더 많은 비용이 들었을 것입니다."

주요 Illumina 소프트웨어
주요 소프트웨어 도구 연구 유형 및 규모 바이오인포매틱스 경험
Clarity LIMS
자동화된 샘플 추적, 워크플로우, 데이터 관리를 위한 실험실 정보 관리 시스템.

확장을 원하는 규제 대상 실험실

초심자부터 전문가까지

BaseSpace Sequence Hub
간소화된 런 관리, 모니터링, 바이오인포매틱스 분석.

소규모 연구: 발견 연구

초심자

Illumina Connected Analytics
Illumina 시퀀싱 시스템에서 NGS 데이터의 매우 정확하고 포괄적이며 매우 효율적인 2차 분석을 제공하는 고성능 바이오인포매틱스 소프트웨어 제품군입니다.

인구집단 연구 또는 임상 연구와 같은 대규모 연구

중급자부터 전문가까지

DRAGEN 2차 분석
DRAGEN 플랫폼은 NGS 데이터를 처리하고 인사이트를 도출하기 위한 3차 분석을 가능하게 하는 2차 분석 소프트웨어 제품군입니다.

소규모부터 대규모 발견 연구, 임상 연구, 인구집단 연구까지 가능

초심자부터 전문가까지

Emedgene
WGS, WES, 가상 패널 및 표적 패널을 위한 분석 연구실 워크플로우를 간소화할 수 있는 AI 우선순위 지정 기능을 갖춘 자동화된 인사이트 솔루션입니다.

생식세포 연구를 위한 샘플 분석을 위해 운영화된 워크플로우를 원하는 소규모 및 대규모 검사실 지원

초심자부터 전문가까지

Illumina Connected Insights
다양한 애플리케이션과 대규모 변이 유형에 대한 변이 해석을 지원하는 포괄적인 인사이트와 자동화.

종양학 연구를 위한 샘플 분석을 위해 운영화된 워크플로우를 원하는 소규모 및 대규모 실험실 지원

초심자부터 전문가까지

저처리량 및 중간 처리량 기기를 사용하는 인기 애플리케이션을 위한 소프트웨어 분석 파이프라인
주요 DRAGEN 파이프라인 및 소프트웨어 도구 주요 애플리케이션 추천 기기
DRAGEN RNA
RNA 판독의 매핑 및 정렬, RNA 정량화, 유전자 융합 검출, 작은 변이 검출(variant calling)을 수행합니다.

유전자 발현 프로파일링

차등 발현 분석

바이오마커 발견

저처리량 및 중간 처리량 벤치탑 시퀀서. NextSeq 1000 및 2000은 온보드 데이터 분석이 주요 특징입니다.
MiSeq® System
NextSeq 1000 및 2000 시스템

DRAGEN Targeted Microbial
BaseSpace에서 몇 번의 클릭만으로 Illumina 바이러스 인리치먼트 패널 또는 타일형 앰플리콘 키트(COVIDSeq, IMAP)를 분석합니다. 공통 유전체 및 커버리지 플롯과 최상의 일치/식별을 제공합니다.

미생물/바이러스 시퀀싱

저처리량 벤치탑 시퀀서.
iSeq 100
MiniSeq
MiSeq System*

DRAGEN Enrichment
DRAGEN Enrichment Pipeline은 인리치먼트 샘플 분석을 위해 특별히 설계된 파이프라인에 DRAGEN의 생식세포 및 체세포 콜러를 결합합니다. 전체 인리치먼트 지표 및 보고 기능이 포함되어 있습니다.

엑솜 시퀀싱

온보드 데이터 분석 기능을 갖춘 중간 처리량 벤치탑 시퀀서.
NextSeq 1000 및 2000 시스템

Partek Flow
모든 수준의 연구자들이 자신 있게 데이터 분석을 수행할 수 있도록, 사용하기 쉬운 인터페이스, 강력한 통계 알고리즘, 정보가 풍부한 시각화, 유전체학 도구를 제공하는 접근 가능한 멀티오믹 분석 솔루션.

멀티오믹스

온보드 데이터 분석 기능을 갖춘 중간 처리량 벤치탑 시퀀서.
NextSeq 1000 및 2000 시스템

Correlation Engine
Correlation Engine은 고도로 엄선된 공개 데이터로 생물학적인 맥락에 사적 오믹스 데이터를 포함시키는 상호적 오믹스 지식베이스입니다.

멀티오믹스

온보드 데이터 분석 기능을 갖춘 중간 처리량 벤치탑 시퀀서.
NextSeq 1000 및 2000 시스템

*온보드 데이터 분석 기능은 기기에 따라 다릅니다.

바이오인포매틱스 FAQ

NGS 데이터 분석 소프트웨어를 확립하고 유지하려면 상당한 전문성과 노력이 필요한데, 많은 사람들이 이를 비용 계산에 포함시키는 것을 잊어버립니다. 대개 이 비용은 상당한 액수이며 소프트웨어 라이선스나 정기 구독 가격을 능가합니다.
고품질의 상용 소프트웨어에는 가장 정확한 분석을 위해 파이프라인을 지속적으로 개선, 테스트, 업데이트하는 전문가 팀이 있습니다. 또한 상업적으로 유지 관리되는 소프트웨어를 통해 명확한 문서 및 전담 지원 팀에 액세스가 가능해 가장 필요할 때 지원을 받을 수 있습니다. 그래픽 사용자 인터페이스(GUI) 같은 기능이 결합되어 있어 바이오인포매틱스의 복잡성을 없애 주므로 일관된 결과에 빠르게 액세스할 수 있습니다.
라이브러리가 준비되고 시퀀싱된 후, 시퀀싱 시스템에 탑재된 실시간 분석(RTA) 소프트웨어는 베이스 콜 및 관련 quality score를 제공합니다.

그런 다음, 시퀀싱 판독을 정렬하고 조립하는 2차 분석을 통해 시퀀서에서 나오는 데이터를 처리하여, 샘플에 대한 전체 시퀀스를 제공하고 DNA 변이 콜(variant call) 또는 RNA 전사물(transcript) 카운트를 제공합니다.

DNA 변이 콜(variant call)을 생성하는 과정은 일반적으로 수천 내지 수백만 개의 변이체를 밝혀낸 다음, 3차 분석이라고 알려진 NGS 워크플로우의 최종 단계에서 해석되어 생물학적 인사이트를 도출합니다. 3차 분석 또는 변이 해석을 통해 사용자는 VCF(변이 콜 파일)를 수집하고 애플리케이션에 따른 다운스트림 분석을 수행할 수 있습니다. 유전체 발현/정량 프로파일, 히트맵, 생체표지자 발견을 위한 시각화, 연구 목적의 단일 샘플 보고서가 여기에 포함됩니다.
데이터 분석 비용은 선택하는 인프라 및 전개 옵션 외에 소프트웨어 선택에 따라 달라질 수 있습니다. 예를 들어, 오픈 소스 소프트웨어를 사용하는 경우 대개 라이선스나 구독이 필요하지 않지만, 클라우드나 온프레미스에서, 그리고 파이프라인 개발 및 유지 관리와 관련된 리소스에서 더 높은 컴퓨팅 비용이 발생할 수 있습니다. 상업용 분석 소프트웨어는 소프트웨어 라이선스 및/또는 구독을 구매해야 하지만 대개 정확도가 더 높고, 런타임이 더 빠르며, 컴퓨팅을 줄일 수 있고, 더 나은 지원이 제공됩니다.
Illumina DRAGEN 2차 분석은 Illumina 시퀀싱 데이터에 대해 가장 정확하고 가장 포괄적인 2차 분석을 제공합니다1. 각 30~35배 인간 전체 유전체 분석은 일반적으로 (Illumina BaseSpace Sequence Hub 또는 Illumina Connected Analytics) 클라우드에서 $6~10의 비용이 들 수 있으나, 컴퓨팅 집약적인 파이프라인 구성의 경우에는 더 많은 비용이 들 수 있습니다. 각 인간 전체 엑솜 또는 전사체 샘플에 대해 약 $1.5~2.5의 비용이 듭니다. 데이터가 많은 프로젝트의 경우, (DRAGEN Server 및 DRAGEN 온보드 기기에서 사용 가능한) DRAGEN ORA 무손실 압축은 데이터 전송 및 저장 비용을 최대 80%까지 낮출 수 있습니다1.

클라우드에 데이터를 분석해 저장하려는 고객을 위해 Illumina는 계정 정보에의 명확하고 투명한 액세스를 제공하여 컴퓨팅 및 스토리지 비용을 추적하고 모니터합니다. 시간 경과에 따라 데이터를 보관하는 조직의 경우, 수개월 이상 액세스할 계획이 없는 데이터는 보관하고 오래된 데이터는 삭제함으로써 데이터 보관 비용을 낮출 수 있습니다.

1Data on file, Illumina Inc., 2024
LIMS, 즉 검사실 정보 관리 시스템(Laboratory Information Management System)은 검사실 및 샘플 데이터를 효과적으로 관리하기 위해 사용하는 도구입니다. 유전체학 검사실의 경우, 유전체학에 특정된 LIMS가 시퀀싱 데이터의 양과 복잡성을 관리하는 데 특히 중요합니다. 검사실에서 더 많은 샘플을 다룰수록 정확하고 효율적이며 규정을 준수하는 습식 검사실 데이터 관리를 위해 유전체학 LIMS 사용이 더 중요해집니다. LIMS를 구현하면 워크플로우의 표준화, 자동화, 접근성을 통해 데이터 무결성을 향상시켜 다운스트림 분석에 상당한 영향을 미칠 수 있습니다. 또한 검사실의 정확한 기록 유지, 워크플로우 간소화, 품질 관리 보장, 팀 간의 협업 향상에 도움이 됩니다.

LIMS가 귀하의 검사실을 위해 무엇을 할 수 있는지 여기에서 자세히 알아보세요.
예. Illumina는 고객을 위해 다양한 교육 옵션을 제공합니다. 귀하의 애플리케이션 및 테스트 메뉴에 가장 적합한 소프트웨어 솔루션을 선택하시면 Illumina가 그 구현 및 교육 필요사항을 파악합니다. 교육은 Illumina의 소프트웨어 구현 패키지의 일부로 포함되어 있으며, 단계별 컨설팅, 플랫폼과 필터 설정, 데이터 수신 설정, 프로젝트 관리, 보고서 맞춤 지정, 그리고 기타 주요 소프트웨어 기능에 대해 이루어집니다. 또한 고객은 Illumina 지원 사이트에 접속하여 온라인 과정 및 강사가 설명해 주는 교육을 통해 모범 사례와 최신 기법을 배울 수 있습니다.
데이터 보안 및 프라이버시는 NGS 실험을 설정하기 전에 고려해야 할 필수 요소입니다. 귀하만이 데이터를 로컬에 저장할지 클라우드에 저장할지 가장 잘 알 수 있습니다. 어떤 선택을 하시든 Illumina는 두 가지 전개 옵션이 모두 가능한 소프트웨어를 제공합니다. 귀하의 지역이나 조직에 데이터 보관 요구사항 또는 엄격한 준법 정책이 있는지, 반드시 고려해 결정하시기 바랍니다. 데이터를 로컬에 저장하기로 결정하는 경우, 조직이 데이터를 어떻게 보호하고 지킬 것인지 고려하는 것이 중요합니다. 프로젝트 규모와 데이터 양에 따라, 대부분의 조직은 초기 자본 투자가 요구되는 전용 시설과 스토리지가 필요함을 실감하게 됩니다.

AWS (Amazon Web Services) 또는 GCP (Google Cloud Provider) 같은 엔터프라이즈 클라우드에 데이터를 저장하면 클라우드 보안 및 프라이버시 전문가로 구성된 전담 팀에 액세스하여, 클라우드 환경 안에서 저장되고 접속되는 데이터의 암호화 및 비공개와 안전성을 보장할 수 있습니다. 데이터가 이미 클라우드에 존재하므로 동료와의 안전한 협업도 능률적으로 이루어집니다.

자세한 내용을 보려면 유전체 데이터 보관 및 보안을 방문하세요.
인포매틱스 자료
고객 비디오 Helix의 인포매틱스 간편화 사례
Helix의 인포매틱스 간편화 사례

Helix의 바이오인포매틱스 부문 부사장인 William Lee와 Illumina의 소프트웨어 엔지니어링 책임자인 Jessica Gordon이 Helix가 BaseSpace Sequence Hub를 사용하여 세계에서 가장 큰 인간 엑솜 시퀀싱 작업 중 하나로 규모를 신속하게 확장한 방법에 대해 설명해 드립니다.

고객 비디오 신약 개발에서 인포매틱스와 유전체학의 역할
신약 개발에서 인포매틱스와 유전체학의 역할

아스트라제네카의 유전체학 연구센터, 디스커버리 사이언스(Discovery Sciences), R&D 책임자인 Slavé Petrovski가 Illumina와 함께 신약 개발에서 인포매틱스와 유전체학의 역할에 대해 이야기를 나눴습니다.

DRAGEN variant calling
DRAGEN을 통한 생식세포 작은 변이 검출의 정확도 향상

이 애플리케이션 노트에서는 진리 집합에 대한 측정치를 기준으로 DRAGEN 플랫폼의 생식세포 작은 변이 검출 정확도의 최근 발전을 설명합니다.

사례 연구
간소화된 워크플로우 관리로 대량 시퀀싱 지원

Rapid Novor에서 BaseSpace Clarity LIMS 소프트웨어를 구현하여 성장하는 검사실 운영의 미래에 대비할 수 있게 된 사례를 알아보세요.

바이오인포매틱스에 대한 추가 질문이 있으신가요?

저희가 도와드리겠습니다. 문의하시면 저희 전문가가 바이오인포매틱스 및 데이터 분석 관련 질문에 기꺼이 답변해 드릴 것입니다.

전문가와 상담하기

참고 문헌
  1. Illumina의 DRAGEN 2차 분석은 PrecisionFDA v2 Truth Challenge Benchmark Data를 기반으로 99.83%의 정확도를 달성한 최초의 단일 플랫폼입니다. 자세한 내용은 여기에서 확인하세요.