서비스 소개

    국가생명연구자원정보센터(KOBIC)에서는 대용량 분석 서버나 분석 기술이 필요한 연구자들을 위하여 Bio-Express 대용량 유전체 데이터 분석 클라우드 서비스를 제공합니다.
    Bio-Express는 다음과 같이 구성됩니다.
  • (1) 대용량 바이오데이터를 효율적으로 저장, 관리 및 활용 하기 위한 빅데이터 플랫폼
  • (2) 편리한 인터페이스와 분석 환경을 제공하는 CLOSHA 통합 자동 분석 시스템
  • (3) 대용량 데이터를 고속 전송하는 고속 전송 시스템 KoDS
  • 자체 기술로 구축된 빅데이터 플랫폼은 분산 파일 시스템(HDFS)을 기반으로 현재 많이 사용되는 일반 분석 프로그램과 Hadoop 기반의
    빅 데이터 분석 프로그램을 동시에 사용할 수 있습니다. 또한 연구자들이 최신의 공용 유전체 데이터를 곧바로 이용할 수 있도록 1000 Genomes 데이터, TCGA 데이터 등을 포함한 다양한 공용 데이터를 함께 제공하고 있습니다.

CLOSHA 통합 자동 분석 시스템

  • 간단한 워크플로우 모델링을 통하여 분석 작업 수행
  • Drag&Drop 기반의 편리한 사용자 인터페이스
  • 일반 분석 프로그램과 Hadoop 기반의 빅데이터 분석 프로그램을 동시 사용 가능
  • 분석 결과 다운로드 및 가시화 기능
  • 파이프라인 실행 상태 및 결과 모니터링 기능
  • 고성능 인프라 시스템을 활용한 고속/대용량 분석 서비스 제공
  • 다양한 종류의 분석 프로그램/파이프라인 제공

고속 전송 시스템 KoDS

  • 대용량 바이오데이터의 고속 전송
  • 높은 신뢰성과 안정성 제공
  • 편리한 사용자 인터페이스
  • 네트워크 대역폭의 효율적인 사용
  • 재전송 기능/전송이력 제공

디스크 캐싱을 이용한 빅데이터 플랫폼

  • 일반 Linux/Unix 분석 프로그램과 Hadoop용 빅데이터 분석 프로그램 동시 사용 가능
  • Hadoop 분산파일 시스템을 사용하여 구축 비용이 싸고 안정성이 높음
  • 고속의 대용량 처리를 위하여 최적화된 작업 스케줄링
  • 대용량 인프라 시스템/고속 네트워크 망에 최적화된 서비스 제공