BaseSpace CLI를 사용하여 FASTQ를 BaseSpace Sequence Hub에 업로드하는 방법

03/23/22


BaseSpace Sequence Hub(BSSH)는 데이터 관리, 저장 및 분석을 위한 Illumina 클라우드 기반 플랫폼입니다. 기기 런 데이터를 업로드하는 것 외에도 파일 업로드 요구 사항을 충족하는 역다중화 FASTQ의 형태로 로컬에서 생성된 샘플 데이터를 데이터 분석 애플리케이션의 입력으로 사용하기 위해 프로젝트로 가져올 수도 있습니다. BSSH 웹 임포터는 최대 250 GB의 단일 샘플 업로드와 업로드당 16개의 파일을 허용합니다. 여러 샘플 또는 더 큰 파일을 업로드하려면 BSSH API를 통해 직접 통신하기 위해 BaseSpace CLI 도구가 필요합니다. BaseSpace CLI를 사용하려면 명령줄 환경에서의 작동에 익숙해야 합니다.

BaseSpace Command Line Interface(CLI)

Linux, Windows 및 Mac OS X에서 사용할 수 있는 이 도구를 사용하면 명령줄에서 기존 프로젝트에 직접 데이터를 업로드할 수 있습니다. 프로젝트 ID 번호는 필수이며 BSSH 웹 사용자 인터페이스의 프로젝트 URL(예: https://basespace.illumina.com/projects/53489437, 여기서 53489437은 프로젝트 ID 번호) 또는 BaseSpace CLI를 사용하여 다음 명령을 사용하여 프로젝트 목록을 생성하여 얻을 수 있습니다. bs 목록 프로젝트

설치 참고 사항: 시스템에 wget 다운로드 도구가 설치되어 있지 않은 경우, 적절한 플랫폼 Linux , Mac 또는 Windows 에 대해 다음 링크를 사용하여 직접 다운로드 링크를 사용하여 bs 실행 파일을 수동으로 다운로드할 수 있습니다.

모든 플랫폼에서 기본 FASTQ 업로드 명령은 다음과 같습니다.

bs 데이터 세트 업로드 -p {ProjectIDNumber} --recursive {PathToFiles}

파일 경로에는 여러 폴더가 포함될 수 있습니다. 업로드할 모든 FASTQ가 포함된 폴더 내에서 업로드하는 경우, 다음 명령의 기간이 “이 폴더”를 의미하는 경우, 예시 명령은 다음과 같습니다.

bs 데이터 세트 업로드 -p 53489437 --recursive .

참고:

  • --no-lane-splitting 명령줄 옵션을 사용하여 bcl2fastq에 의해 생성된 병합 레인 FASTQ는 즉시 업로드할 수 없습니다. 병합된 레인 파일을 업로드하려면 파일 이름이 SampleName_SampleNumber_Lane_Read_FlowCellIndex .fastq.gz의 형식과 일치하도록 레인 번호를 포함하도록 파일 이름을 변경하고 --allow-invalid-readnames 옵션을 CLI 업로드 명령에 추가합니다. 병합된 레인 파일은 BaseSpace Sequence Hub 웹 임포터로 업로드할 수 없습니다.
  • Illumina 명명 규칙과 일치하지 않는 파일에 대해 오류가 발생하는 경우, 파일 이름이 위의 예와 정확하게 일치하는지 확인하십시오. SampleName의 추가 밑줄은 파일 이름의 나머지 부분에 대한 구분 기호이므로 업로드 실패를 유발합니다.
  • CLI 업로드는 파일 유형으로 FASTQ로 기본 설정됩니다. BAM, VCF 및 BED와 같은 기타 파일 유형은 명령줄에 추가하여 CLI로 업로드할 수 있습니다.  --type common.files
    FASTQ는 common.files 옵션으로 업로드할 수 없으므로 다른 파일 유형과 별도로 업로드해야 합니다.
  • 기타 특수 업로드 시나리오는 CLI 예제 페이지에서 설명합니다.