Cvičení 10 - bioinformatika

Předpověď struktury proteinů

10.1 Předpověď sekundární struktury
Za pomocí serverů PSI-PRED, JPRED a předpovězte sekundární strukturu níže uvedeného proteinu. Výsledky predikcí porovnejte se sekundární strukturou určenou na základě krystalové struktury (viz. protein 1d07 v databázi PDBSum).

MSLGAKPFGEKKFIEIKGRRMAYIDEGTGDPILFQHGNPTSSYLWRNIMPHCAGLGRLIA
CDLIGMGDSDKLDPSGPERYAYAEHRDYLDALWEALDLGDRVVLVVHDWGSALGFDWARR
HRERVQGIAYMEAIAMPIEWADFPEQDRDLFQAFRSQAGEELVLQDNVFVEQVLPGLILR
PLSEAEMAAYREPFLAAGEARRPTLSWPRQIPIAGTPADVVAIARDYAGWLSESPIPKLF
INAEPGALTTGRMRDFCRTWPNQTEITVAGAHFIQEDSPDEIGAAIAAFVRRLRPA

Předpočítané výsledky: PSI-PRED, JPRED

10.1.1 Kolik α-šroubovic a kolik β-řetězců předpověděly servery PSI-PRED a JPRED? Odpověď: PSI-PRED: 13 α-šroubovic, 7 β-řetězců; JPRED: 11 α-šroubovic, 8 β-řetězců; [1-12-2021]
10.1.2 Jaká je předpověď serveru PSI-PRED pro následující aminokyseliny: P74, F151, Q157 a I241? Odpověď: P74: smyčka (vysoká spolehlivost predikce), F151: α-helix (vysoká spolehlivost), Q157: α-helix (nízká spolehlivost), I241: β-řetězec (vysoká spolehlivost)

10.2 Předpověď proteinového foldu
Pomocí serverů PHYRE a pGenThreader určte fold níže uvedeného proteinu

MTTDSLTTVSASETRGDHAPGGRASAAPQVHYRVEQVGDVKVFYREAGDPAAPAVLLLHG
FAASSYMWRDVIEALADGYHVIAPDLPAFGYTEAPARGQYDYTFANLTKTIERFTDQLKL
TRYAMAVHDYGAPVGWRLALAHPSRITAIISQNGNAYEEGLSAGWEPIRKYWNDPTAENR
QALSDFPTPASIKWQYVEGVSDTSLVAPDAYTLEGAQILRPGMADIQLDLLLDYATNVEQ
YPAFQAYFREYQPPLLAVWGEHDPFFLPPGAEAWKRDIPDADIRLYDTGHFALETHSEVI
IPTIRQFLDDHVSLHRQEGAHAK
Předpočítané výsledky: PHYRE, pGENthreader

10.2.1 Jaký fold byl pro daný protein předpovězen? Odpověď: hydrolase fold

10.3 Výběr templátu pro homologní modelování
Pomocí sekvenčního vyhledávání identifikujte možné templáty pro konstrukci homologního modelu halogenalkandehalogenasy z Mesorhizobium loti MAFF303099 (přístupové číslo NCBI BAB51818 , UniProt Q98C03).

Užitečné odkazy:
ENTREZ
BLAST v rámci NCBI
BLAST v rámci RCSB PDB

10.3.1 Jaká struktura představuje nejvhodnější templát pro homologní modelování daného proteinu? Odpověď: struktura divokého typu halogenalkandehalogenasy DbeA z Bradyrhizobium elkanii (PDB-ID kód: 4k2a), případně mutantů a divokého typu halogenalkandehalogenasy DbjA z Bradyrhizobium japonicum (PDB-ID kódy: 3a2l, 3a2m, 3a2n, 3afi), nebo lze použít i mutanty a divoký typ halogenalkandehalogenasy DhaA z Rhodococcus

10.4 Předpověď 3D struktury proteinu
Pomocí serverů pro homologní modelování Swiss-Model, I-TASSER předpovězte 3D strukturu halogenalkandehalogenasy z Mesorhizobium loti MAFF303099 (proteinová sekvence uvedena níže). Prostudujte strukturu homologního modelu ve vizualizačním programu (např. PyMol, VMD, Swiss-PdbViewer).

MSSKANPPQPVATAPKRSQIPILDSTMSYVEAGASGPTVLFLHGNPTSSHIWRNIIPHVA
PFGRCIAPDLIGYGQSGKPDIDYRFFDHVRYLDAFLDALDIRDVLLVAQDWGTALAFHLA
ARRPQRVLGLAFMEFIRPFERWEDFHQRPQAREMFKALRTPGVGEKLVLEDNVFVEKVLP
ASVLRAMSDDEMDVYRAPFPTPQSRKPVLRLPREMPIEGQPADVAAISAHDHRALRLSTY
PKLLFAGDPGALIGPQAAREFAAGLKNCSFINLGPGAHYLQEDHADAIGRAIASWLPEVV
LANQTDELA

Předpočítané výsledky: I-TASSER, SWISS-MODEL

10.4.1 Jaká struktura byla použita jako templát pro konstrukci modelu na serveru Swiss-Model? Odpověď: 6y9f řetězec A

10.5 Konstrukce homologního modelu - AlphaFold2
Navštivte web AlphaFold databáze a prohlédněte si záznam pro protein Free fatty acid receptor 2 (UniprotKB ID: O15552).
Cílový protein haloalkane dehalogenase z Mesorhizobium loti MAFF303099 (přístupové číslo NCBI: BAB51818, Uniprot: Q98C03) ze cvičení 10.3.
Připravte model proteinu pomocí nástroje AlphaFold2. Na webu projektu ColabFold vyberte AlphaFold2. Pro práci s Google Colab budete potřebovat účet od Googlu.
Kliknutím na play tlačítka stáhněte potřebné soubory a AlphaFold2 do Colabu, vložte sekvenci cílového proteinu, připravte vícenásobné zarovnání sekvencí a poté spočítejte model proteinu
Po dokončení výpočtu se vám objeví okno v prohlížeči pro stažení archivu se souborem modelu.
Předpočítaný model
Kvalitu nového modelu ohodnoťte pomocí serveru QMEAN
Předpočítané výsledky: QMEAN