Předpověď struktury proteinů

10.1 Předpověď sekundární struktury
Za pomocí serverů PSI-PRED, JPRED a PORTER a předpovězte sekundární strukturu níže uvedeného proteinu. Výsledky predikcí porovnejte se sekundární strukturou určenou na základě krystalové struktury (viz. protein 1d07 v databázi PDBSum).

MSLGAKPFGEKKFIEIKGRRMAYIDEGTGDPILFQHGNPTSSYLWRNIMPHCAGLGRLIA
CDLIGMGDSDKLDPSGPERYAYAEHRDYLDALWEALDLGDRVVLVVHDWGSALGFDWARR
HRERVQGIAYMEAIAMPIEWADFPEQDRDLFQAFRSQAGEELVLQDNVFVEQVLPGLILR
PLSEAEMAAYREPFLAAGEARRPTLSWPRQIPIAGTPADVVAIARDYAGWLSESPIPKLF
INAEPGALTTGRMRDFCRTWPNQTEITVAGAHFIQEDSPDEIGAAIAAFVRRLRPA

Předpočítané výsledky: PSI-PRED, PORTER, JPRED
10.1.1 Kolik α-šroubovic a kolik β-řetězců předpověděly servery PSI-PRED a JPRED? Odpověď: PSI-PRED: 13 α-šroubovic, 7 β-řetězců; JPRED: 11 α-šroubovic, 8 β-řetězců; [1-12-2021]
10.1.2 Jaká je předpověď serveru PSI-PRED pro následující aminokyseliny: P74, F151, Q157 a I241? Odpověď: P74: smyčka (vysoká spolehlivost predikce), F151: α-helix (vysoká spolehlivost), Q157: α-helix (nízká spolehlivost), I241: β-řetězec (vysoká spolehlivost)
10.2 Předpověď proteinového foldu
Pomocí serverů PHYRE a GenThreader určte fold níže uvedeného proteinu

MTTDSLTTVSASETRGDHAPGGRASAAPQVHYRVEQVGDVKVFYREAGDPAAPAVLLLHG
FAASSYMWRDVIEALADGYHVIAPDLPAFGYTEAPARGQYDYTFANLTKTIERFTDQLKL
TRYAMAVHDYGAPVGWRLALAHPSRITAIISQNGNAYEEGLSAGWEPIRKYWNDPTAENR
QALSDFPTPASIKWQYVEGVSDTSLVAPDAYTLEGAQILRPGMADIQLDLLLDYATNVEQ
YPAFQAYFREYQPPLLAVWGEHDPFFLPPGAEAWKRDIPDADIRLYDTGHFALETHSEVI
IPTIRQFLDDHVSLHRQEGAHAK
Předpočítané výsledky: PHYRE, GENthreader, pGENthreader
10.2.1 Jaký fold byl pro daný protein předpovězen? Odpověď: α/β-hydrolase fold
10.3 Výběr templátu pro homologní modelování
Pomocí sekvenčního vyhledávání identifikujte možné templáty pro konstrukci homologního modelu halogenalkandehalogenasy z Mesorhizobium loti MAFF303099 (přístupové číslo NCBI BAB51818 , UniProt Q98C03).

Užitečné odkazy:
ENTREZ
BLAST v rámci NCBI
BLAST v rámci RCSB PDB
10.3.1 Jaká struktura představuje nejvhodnější templát pro homologní modelování daného proteinu? Odpověď: struktura divokého typu halogenalkandehalogenasy DbeA z Bradyrhizobium elkanii (PDB-ID kód: 4k2a), případně mutantů a divokého typu halogenalkandehalogenasy DbjA z Bradyrhizobium japonicum (PDB-ID kódy: 3a2l, 3a2m, 3a2n, 3afi), nebo lze použít i mutanty a divoký typ halogenalkandehalogenasy DhaA z Rhodococcus
10.4 Předpověď 3D struktury proteinu
Pomocí serverů pro homologní modelování Swiss-Model, I-TASSER předpovězte 3D strukturu halogenalkandehalogenasy z Mesorhizobium loti MAFF303099 (proteinová sekvence uvedena níže). Prostudujte strukturu homologního modelu ve vizualizačním programu (např. PyMol, VMD, Swiss-PdbViewer).

MSSKANPPQPVATAPKRSQIPILDSTMSYVEAGASGPTVLFLHGNPTSSHIWRNIIPHVA
PFGRCIAPDLIGYGQSGKPDIDYRFFDHVRYLDAFLDALDIRDVLLVAQDWGTALAFHLA
ARRPQRVLGLAFMEFIRPFERWEDFHQRPQAREMFKALRTPGVGEKLVLEDNVFVEKVLP
ASVLRAMSDDEMDVYRAPFPTPQSRKPVLRLPREMPIEGQPADVAAISAHDHRALRLSTY
PKLLFAGDPGALIGPQAAREFAAGLKNCSFINLGPGAHYLQEDHADAIGRAIASWLPEVV
LANQTDELA

Předpočítané výsledky: I-TASSER, SWISS-MODEL
10.4.1 Jaká struktura byla použita jako templát pro konstrukci modelu na serveru Swiss-Model? Odpověď: 6y9f řetězec A

10.5 Konstrukce homologního modelu - AlphaFold2
Navštivte web AlphaFold databáze a prohlédněte si záznam pro protein Free fatty acid receptor 2 (UniprotKB ID: O15552).
Cílový protein haloalkane dehalogenase z Mesorhizobium loti MAFF303099 (přístupové číslo NCBI: BAB51818, Uniprot: Q98C03) ze cvičení 10.3.
Připravte model proteinu pomocí nástroje AlphaFold2. Na webu projektu ColabFold vyberte AlphaFold2. Pro práci s Google Colab budete potřebovat účet od Googlu.
Kliknutím na play tlačítka stáhněte potřebné soubory a AlphaFold2 do Colabu, vložte sekvenci cílového proteinu, připravte vícenásobné zarovnání sekvencí a poté spočítejte model proteinu
Po dokončení výpočtu se vám objeví okno v prohlížeči pro stažení archivu se souborem modelu.
Předpočítaný model
Kvalitu nového modelu ohodnoťte pomocí serveru QMEAN
Předpočítané výsledky: QMEAN

MENDELOVO CENTRUM pro vzdělávání v biologii, biomedicíně a bioinformatice CZ.1.07/2.3.00/09.0186

Aktuální cvičení:


Další informace:
Cvičení
Nukl. kyseliny
Proteiny
Struktury
Nástroje
Ke stažení
Bioinformatika - proteiny
Bioinformatika - nukl. kyseliny
Bioinformatické databáze
Manipulace se sekvenčními daty
Párové sekvenční přiložení
Mnohonásobné sekvenční přiložení
Návrh primerů
Hledání a identifikace genů
Analýza proteinových sekvencí
NGS data a lokální anotace
Strukturní databáze
Předpověď struktury proteinů
GenBank
EMBL-Bank
DDBJ
dbEST
UniGene
UniProtKB
NRDB
PIR
PROSITE
Pfam
INTERPRO
PDB
MMDB
PDBsum
CATH
SCOP
BLAST
FASTA
LALIGN
ClustalW
T-Coffee
MUSCLE
PSIPRED
JPRED
PHD
PuTTY
WinSCP
SPdbV
PyMOL
RasMol
BioEdit
MEGA3
TreeView