Genomika: analýza a algoritmy - Cvičení 7

Mapování, samtools

Ze cvičení 3 použijte data, která jste rozdělili pomocí barcodů a trimovali (zbavili adaptorů). Namapujte na HIV1 sample1 v trimované a netrimované verzi. (Sekvence jsou na VM, programy bwa a bowtie2)

Porovnejte počet mapovaných sekvencí a zda-li se podařilo odstranit kompletně adaptory. Pomocí samtools odstraňte nemapované ready, setřiďte a indexujte výsledný bam file. Zobrazte lokálně pomocí tabletu a/nebo IGV.

hint (to nejsou copy/paste příklady, jenom ukázání cesty):

    bwa index -p HIV1 HIV1.fna
    bwa mem -t 2 HIV1 ex3_smpl1.fastq >ex3_smpl1-bwa.sam

    bowtie2-build HIV1.fna HIV1
    bowtie2 -p 2 -x HIV1 -U ex3_smpl1.fastq >ex3_smpl1-bowtie2.sam
    
    samtools flagstat
    samtools view -F 4
    samtools sort
    samtools index
      

Tady je sekvence a jeden seřazený a indexovaný bamfile pro kontrolu:

Time-stamp: <2023-11-29 11:51:19 (hpaces)>