등록 파이프라인

No 분석 분야 파이프라인 이름 설명 상세 정보
1 Whole Exome Analysis Pipeline COLLECTIVE_GENOME_BETWEEN_GROUPS_GENE_FLOW_CALCULATION_PIPING Treemix software를 이용하여 WG 다 그룹간의 Maximum likelihood tree를 계산 하고 recent gene flow를 시각화하는 Pipe 라인은 총 8단계에 걸쳐서 진행되며, 우선 Pipe의 Output 디렉토리를 생성한 후, 첫 째로 전체 VCF 파일을 Plink format으로 변환 및 동시에 각 샘플에 대한 Clust 파일을 생성한 후, 둘째로, 생성된 각 샘플에 대한 Clust 파일을 그룹이 명시되게 재조정한다. 그리고 셋째, 재조정된 Clust파일과 1단계에서 생성된 파일을 이용하여, VCF의 각 SNP에서 어떤 Allele이 각 그룹에서 우세한지를 나타내는 Allele frequency file을 생성한다. 넷째, 이 이 Allele frequency 파일을 이용하여 treemix를 통해 ML tree와 recent gene flow를 나타내는 파일을 생성한다. 다섯 째, 생성된 파일을 통해 시각화 하는 그림을 도출하고, 여섯째, 네 번째에서 생성된 파일을 오차를 산출하며, 마지막으로 각 그룹에 대한 오차를 Pairwise된 Plot으로 시각화한다. 상세보기
2 Whole Exome Analysis Pipeline COLLECTIVE_GENOME_BETWEEN_GROUPS_XP_CLR_CALCULATION_PIPING XP-CLR software를 이용하여 WG 두 그룹간의 composite likelihood ratio를 이용하여 Positive selection된 부근을 통계적으로 찾고, Manhattan plot으로 시각화하는 Pipe 라인은 총 8단계에 걸쳐서 진행되며, 우선 Pipe의 Output 디렉토리를 생성한 후, 첫 째로 각 그룹의 VCF 파일과 전체 VCF파일을 Chromosome에 따라 분리 한다. 둘 재, XPCLR 계산하기 위한 Reference file(=Map file)을 생성하기 위해, Chromosome별로 분리된 전체 VCF들을 각각의 Map 파일로 생성한다. 셋 째, 첫번�에서 각 Chromosome 별로 분리된 각 그룹에 대한 VCF 파일을 각 Chromosome 별로 XPCLR input파일로 변환 한다. 넷 째, 각 그룹에 대하여 각 Chromosome 별로 분리된 XPCLR input 파일과 전체 VCF에 대하여 각 Chromosome 별로 분리된 Map 파일을 이용하여, Chromosome 별로 XPCLR을 계산한다. 다섯째, 각 Chromosome 별로 계산된 XPCLR output을 하나의 output으로 통합한다. 여섯째, 통합된 XPCLR output을 plot을 그리기 위한 파일로 변환한다. 그리고 마지막으로 두 그룹에 대한 XPECLR output을 Manhattan plot으로 시각화 한다. 상세보기
3 Whole Exome Analysis Pipeline COLLECTIVE_GENOME_BETWEEN_GROUPS_XP_EHH_CALCULATION_PIPING XP-EHH software를 이용하여 WG 두 그룹간의 haplotype 동질성을 이용하여 Positive selection된 부근을 통계적으로 찾고, Manhattan plot으로 시각화하는 Pipe 라인은 총 7단계에 걸쳐서 진행되며, 우선 Pipe의 Output 디렉토리를 생성한 후, 첫 째로 각 그룹의 VCF 파일을 Impute format으로 변환하고, 둘째, 변환된 각 그룹의 Imput 파일 중 hap 파일을 각 그룹에 대한 XPEHH input 파일로 변환한다. 셋 째, XPEHH를 계산하기위한 Reference file(=Map file)을 생성하기 위해, 전체 VCF를 이용하여 Map 파일을 생성한다. 넷 째, 두 그룹에 대한 XPEHH input 파일과 Map 파일을 이용하여 XPEHH를 계산한다. 다섯 째, 계산된 XPEHH outfile을 Plot을 그리기 위한 파일을 재조정하기 위하여 전체 VCF를 이용하여 Plot을 그리기 위한 input file을 생성한다. 그리고 마지막으로 두 그룹에 대한 XPEHH output을 Manhattan plot으로 시각화 한다. 상세보기
4 Whole Exome Analysis Pipeline COLLECTIVE_GENOME_LD_DECAY_CALCULATION_PIPING PopLDdecay software를 이용하여 각 WG 그룹의 특정 거리에 따른 LD의 평균적인 붕괴지수 산출 및 시각화하는 Pipe 라인은 총 5단계에 걸쳐서 진행되며, 우선 Pipe의 Output 디렉토리를 생성한 후, 첫 째로 그 그룹별 VCF 파일을 PopLDdecay라는 software를 이용하여 계산하고자 하는 거리에 맞게 각각 그룹에 대한 평균적인 LD의 붕괴정도를 계산하고, 둘째로 그룹별로 계산된 LD의 붕괴 값을 각각 시각화 하기위한 파일로 변환하고, 셋째, 이 각 그룹별로 변환된 파일을 시각화하기 위한 최종 input인 하나의 파일로 병합한다. 그리고 마지막으로 최종 input을 이용하여 각 그룹에 대한 거리에 따른 평균적인 LD의 붕괴정도를 시각화 한다. 상세보기
5 RNA Sequencing Pipeline RNASeq_STARFUSION_PIPING STAR_Fusion을 이용한 RNA_Seq에서의 Fusion detection pipeline은 Quality Check와 Alignment _ Fusion Prediction의 총 2단계 과정으로 구성된다_ 각 단계에서 진행되는 분석 과정은 다음과 같다_ 첫 번째 분석 단계인_ Quality Check는 입력 데이터의 sequencing quality를 FastQC로 체크한다_ Alignment _ Fusion Prediction 단계로 넘어가기 전에 reference file_reference genome fasta file_ transcriptome annotation file_ blast matching gene pair file_ fusion annotation file_을 indexing하여 reference index를 생성한다_ 이렇게 얻어진 library index 파일을 reference로 mapping을 진행하고 Fusion prediction 과정을 거치면 최종적으로 fusion_prediction_tsv 파일을 얻게 된다_ 여러 옵션을 사용해서 결과에 annotation을 포함할 수도 있으며 fusion_prediction_tsv파일은 후속 분석에 이용하게 된다. 상세보기
6 ETC Pipeline POSTECH_INFINIUM450K_RNBEADS_PIPING 각 단계에서 진행되는 분석 과정은 다음과 같다_ 우선 Infinium450K microarray 데이터를 RnBeads 분석에 맞는 RnBSet 객체로 변환한다_ Quality control 단계에서 입력 데이터의 quality를 확인 한 후 SNP_enriched site_ High coverage outlier site_ Low coverage_ Sex chromosome 등 부적합한 데이터를 필터링하고 Normalization을 진행한다_ Explorary analysis 단계에서 유전자 요소 별 메틸화 레벨 프로파일링_ Principal Component Analysis _PCA__ Multidimensional Scaling _MDS__ 클러스터링 등 다양한 글로벌 레벨 분석 수행한다_ Differential methylation analysis에서 샘플간 Methylation 관계를 계산하여 샘플 클러스터링 결과를 보여주고 통계적인 유의성을 표시해준다_ Annotation 단계에서 chromosome site_ color_ context_ GC__ SNP 개수 등의 정보를 얻는다_ Visualization 단계에서 기본적으로 bed 형식 뿐만아니라 다른 트랙허브 사용을 위해 bigbed_ bigwig 형식으로 methylation data를 출력한다_ 위 분석단계는 RnBeads를 이용해 하나의 과정으로 통합하여 진행한다_ 상세보기
7 RNA Sequencing Pipeline RNASeq_RSEM_VOOM_PIPING Quality control Adaptive trimming_ Alignment_ Filter reads_ Quantification_ Differential expression 총 6단계의 모듈로 구성된다_ 각 단계에서 진행되는 분석 과정은 다음과 같다_ 첫 번째 분석 단계인_ Quality control은 입력 데이터의 sequencing quality를 FastQC로 체크한다_ 그리고_ Adaptive trimming 단계는 Sickle를 이용하여 입력 데이터의 quality가 낮은reads와 adaptor를 제거한 후_ R1과 R2의pair를 맞춰서 공통 서열을 얻는다_ 이렇게 얻어진 R1과 R2의 공통서열을 Alignment 단계에서 입력으로 활용하여_ Bowtie1을 이용한 reference의 index를 생성하고_ MapSplice2로 mapping한다_ Filter reads 단계는 mapping된 데이터를 입력으로 활용하여 Picard를 이용하여 mapping된 bam file을 정렬한 후_ SamTools로 genomic location 별로 정렬한 후 performace 를 높여주기위해 indexing 한다_ 그 다음 perl script를 이용하여 reference의 순서와 같도록 chromosome order로 재정렬한 후_ Java scrpit를 이용하여 transcriptome을 annotation한 후 Indel_ Insert가 크거나 mapping이 잘되지 않은 read를 제거한다_ 이렇게 얻어진 bam file을 RSEM을 이용하여 Quantification하여 read를 count한다_ 이 과정에서 FPKM_ TPM_ read count값을 얻을 수 있다_ 마지막 Differential expression 단계에서는 R package Limma voom을 이용하여 유전자 transcripts의 expression levels를 비교하여 differentially expressed genes DEG를 얻는다. 상세보기
8 Whole Exome Analysis Pipeline HUMAN_CANCER_DIELECTRIC_SIMPLE_VARIATION_EXCAVATION_PIPING alignment software를 사용해 reference에 mapping된 bam file이 있는 단계부터 시작한다. strelka를 이용하기 때문에 반드시 tumor와 normal에 해당하는 데이터가 쌍으로 존재하여야 한다. HaplotypeCaller로 샘플에 존재하는 Germline mutation(+somatic)을 찾고, Mutect, Varscan2, strelka 세 가지의 소프트웨어로 각종 somatic variant에 해당하는 구조적 변이를 검출하고 종합한다. 상세보기
9 Whole Exome Analysis Pipeline COLLECTIVE_GENOME_PCA_R_PIPING 이 파이프라인은 Sample sequence data로부터 샘플 간 distance를 계산하고, 이것으로부터 주성분분석을 실행하여 PCA plot을 생성하고, neighbor-joining 방법을 이용하여 phylogenetic tree를 생성하며, R의 MST 패키지를 이용하여 bayesian tree와 VisAnt에서 tree를 편집할 수 있는 input 파일을 제공한다. 상세보기
10 Whole Exome Analysis Pipeline RARE_VARIANT_ASSOCIATION_STUDY_PIPING 이 파이프라인은 variant call format (VCF) file로부터 rare variant association tool 4가지를 연속하여 실행하는 것으로, 각 프로그램에 맞게 vcf file을 변환하고 실행하는 과정으로 구성되어 있다. Output file은 config 파일에서 설정한 directory에 저장하도록 되어 있다. 상세보기