Genomika: analýza a algoritmy - Seminární práce

Assembly a anotace eubakteriálního genomu

Data

viz. cvičení 8.

Data obsahují tři knihovny, paired-end z Illuminy a dvě mate-pair ze 454. Dataset z Illuminy je předzpracovaný: během kontroly kvality jsme některé ready odstranili, druhá párová sekvence pak vystupuje jako single end. Pro snížení výpočetní náročnosti jsme spojili paired-end páry, které byly tak blízko sebe, že se překrývaly (extendedFrags) a tím z nich udělali také single-end ready. Zbývající ready zůstaly párové (notCombined).

files: (GAA2022/cviceni_16_11_22/)

	trim_database.fna

single end (druhý člen páru odstraněn), MiSeq:
	Bcc7419-MiSeq-A895A-PE_1_U.fastq 
	Bcc7419-MiSeq-A895A-PE_2_U.fastq  
single end (spojené paired-end), MiSeq:
	Bcc7419-MiSeq-A895A-PE_12_JOIN_P.extendedFrags.fastq
paired-end (nespojený paired-end), 600bp, MiSeq:
	Bcc7419-MiSeq-A895A-PE_12_JOIN_P.notCombined_1.fastq
	Bcc7419-MiSeq-A895A-PE_12_JOIN_P.notCombined_2.fastq

mate pairs, 3kbp, 454:
	Bcc7419-454-HB0RHHA02-PE_3k-UNIQ.sff
	Bcc7419-454-HAV0LKU05-PE_3k-UNIQ.sff
      

Time-stamp: <2022-11-23 12:49:33 (hpaces)>