Na NCBI použijte PSI-BLAST a najděte všechny členy rodiny aquaporinů. Kolik iterací potřebujete?
PSI-BLAST je senzitivní metoda, ale můžeme ji využít jen v některých případech. Pakliže musíme použít BLAST nebo FASTA, potřebujeme vědět, jaká je jejich citlivost při menších podobnostech (při větších genetických vzdálenostech. Zkusíme pomocí simulace zjistit, při jakých vzdálenostech již programy FASTA a BLAST nejsou spolehlivé a kde jsou jejich limity.
Vytvořte program pro mutování DNA a proteinů, pro zjednodušení nemusíme uvažovat inzerce / delece. Například program na mutagenezu DNA by mohl mít jako argument název fasta souboru a počet mutací, nebo počet mutací na jednotku délky. Přepínačem by mělo být možná zajistit udržení stejné kompozice sekvence (hlavně GC obsah) a možnost zapnout nebo vypnout vícenásobné mutace. Program na mutagenezu proteinů by mohl (pomocí přepínačů) brát do úvahy genetickou příbuznost jednotlivých aminokyselin a také udržet frekvence jednotlivých aminokyselin nebo jejich skupin (přibližně) stejně. (Pro neprogramátory: použijte EMBOSS nebo SMS2.) Smyslem je, aby programy přibližně simulovaly reálné biologické procesy.
Z databáze bakteriálních genů (/data/shared/GAA2022/db/gbbct1.seq.gz
) vyberte náhodně jeden gen.
Pomocí programu na mutagenezu ho postupně mutujte a testujte, do kdy ještě budete schopni identifikovat v databázi
pomocí FASTA a BLASTN programů jeho nemutovanou verzi. (Zajímá nás hlavně, jak se mění E-value a bit-score,
jaký má odstup signál od šumu.)
Mutovaný gen přeložte do proteinu a zkuste citlivost pomocí TBLASTN a TFASTA programů.
Najděte v NCBI odpovídající proteinový produkt vašeho genu (nebo přeložte DNA), mutujte protein a otestujte senzitivitu TBLASTN a TFASTA obdobným způsobem.
Připravte stručnou, přehlednou prezentaci výsledků (powerpoint, pdf, dokument, html, podle osobních preferencí), pomocí které následujícímu ročníku předáte získanou zkušenost. Na závěr, prosím, stručně vyhodnotte, co si z cvičení odnesete do praxe (take home message).