Bioinformatické databáze

1.1 Hledání v databázích nukleotidových sekvencí
Vyhledejte gen halogenalkandehalogenázy (anglicky haloalkane dehalogenase) dhlA z bakterie Xanthobacter autotrophicus GJ10 v databázích GenBank a EMBL-Bank.
Určete a stáhněte sekvenci kódující oblasti tohoto genu a sekvenci proteinu, který je tímto genem kódován.
1.1.1 Jaký je přístupový kód pro gen dhla v jednotlivých databázích? Odpověď: EMBL-Bank: M26950, GenBank: M26950
1.1.2 Určete kódující sekvenci genu dhla a stáhněte ji ve FASTA formátu. Nápověda: oblast 999-ATGAT..AATAG-1931
1.1.3 Stáhněte článek popisující klonování genu dhla Nápověda: PubMed; full-text
1.1.4 Jaký je přístupový kód proteinové sekvence kódované genem dhla? Odpověď: AAA88691.1
1.1.5 Stáhněte sekvenci proteinu kódovaného genem dhla ve FASTA formátu. Nápověda: MINA...AETE; přes přístupový kód proteinu se lze dostat do proteinové sekvenční databáze
1.2 Hledání v databázích proteinových sekvencí
Vyhledejte záznam o proteinu halogenalkandehalogenáze (anglicky haloalkane dehalogenase) z bakterie Sphingobium japonicum UT26 (synonymum 1,3,4,6-tetrachloro-1,4-cyclohexadiene hydrolase) v proteinové databázi UniProtKB/Swiss-Prot.
1.2.1 Jaký přístupový kód má tento protein? Odpověď: D4Z2G1
1.2.2 Jakou funkci má tento protein? Odpověď: katalyzuje hydrolýzu vazby uhlík-halogen v halogenovaných sloučeninách
1.2.3 Z kolika aminokyselin je tento protein tvořen? Odpověď: 296
1.2.4 Jaké má tento protein pH optimum? Odpověď: 8.2
1.2.5 Které reziduum plní funkci nukleofilu? Odpověď: D108
1.2.6 Jaký efekt mají mutace D108A, F151Y a H272L? Odpověď: D108A: ztráta aktivity; F151Y: zvýšení aktivity; H272L: efekt není znám
1.2.7 Stáhněte článek popisující charakterizaci mutanta D108A. Nápověda: PubMed abstract; full-text
1.2.8 Byla pro tento protein vyřešena 3D struktura? Pokud ano, uveďte přístupový kód do strukturní databáze. Odpověď: Ano, pro daný protein bylo vyřešeno 15 struktur. Přístupové kódy např. 1CV2, 1D07, 1G42, ...
1.2.9 Stáhněte sekvenci tohoto proteinu ve FASTA formátu Nápověda: použijte "FASTA" odkaz v sekci "Sequences"
1.2.10 Stáhněte z GenBank DNA sekvenci, která kóduje tento protein: Nápověda: použijte přístupový kód D14594 uvedený v sekci "Cross-references"
1.3 Informace o genomových projektech
V databázi Genomes OnLine Database (GOLD) zjistěte informace o dokončených a probíhajících genomových projektech.
1.3.1 Kolik bakteriálních a eukaryotických organizmů bylo dosud osekvenováno? Odpověď: 398 331 bakteriálních, 46 479 eukaryotických [21-09-2022]
1.3.2 Kolik genomových projektů podle databáze GOLD v současné době probíhá? Odpověď: 152 619 [21-09-2022]
1.4 Informace o bakteriálním genomu
Za pomocí databází ENTREZ Genome a BioProject. zjistěte informace o bakterii Streptococcus pyogenes MGAS315 a jejím chromozomálním genomu.
1.4.1 Jaké je teplotní optimum bakterie Streptococcus pyogenes MGAS315? Odpověď: 30 - 35°C
1.4.2 Jak velký je genom této bakterie? Odpověď: 1.9 Mb
1.4.3 Jaký je obsah G+C tohoto genomu? Odpověď: 38.6 %
1.4.4 Stáhněte sekvenci chromozomálního genomu ve FASTA formátu Nápověda: přístupový kód: NC_004070, případně AE014074
1.4.5 Kolik proteinů je tímto chromozomálním genomem kódováno? Nápověda: 1811 [21-09-2022]
1.4.6 Specifikujte segment DNA kódující protein aminoacyl-tRNA hydrolase. Nápověda: nukleotidy 4665 (start) - 5234 (stop), pozitivní řetězec
1.4.7 Stáhněte sekvenci proteinu aminoacyl-tRNA hydrolase ve FASTA formátu. Nápověda: přístupový kód WP_011054086
1.5 Vyhledání specializovaných databází
Vyzkoušejte NAR Molecular Biology Database Collection pro vyhledání specializovaných bioinformatických databází.
1.5.1 Vyhledejte genomovou databázi zaměřenou na určitou skupinu virů Nápověda: použijte "Category List" -> "Genomics Databases (non-vertebrate)" -> "Viral genome databases"
1.5.2 Vyhledejte databázi věnovanou kvasince Saccharomyces cerevisiae Nápověda klikněte na "Search Summary Papers"; jako klíčové slovo zadejte "Saccharomyces" (výsledkem např. databáze SGD, CYGD, SCMD, SCPD,...) a/nebo klíčové slovo "yeast" (výsledkem např. databáze PTM-Switchboard, Yeast snoRNA Database,...)

MENDELOVO CENTRUM pro vzdělávání v biologii, biomedicíně a bioinformatice CZ.1.07/2.3.00/09.0186

Aktuální cvičení:


Další informace:
Cvičení
Nukl. kyseliny
Proteiny
Struktury
Nástroje
Ke stažení
Bioinformatika - proteiny
Bioinformatika - nukl. kyseliny
Bioinformatické databáze
Manipulace se sekvenčními daty
Návrh primerů a restrikční analýza
Párové sekvenční přiložení
Mnohonásobné sekvenční přiložení
Hledání a identifikace genů
Analýza proteinových sekvencí
NGS data a lokální anotace
Strukturní databáze
Předpověď struktury proteinů
GenBank
EMBL-Bank
DDBJ
dbEST
UniGene
UniProtKB
NRDB
PIR
PROSITE
Pfam
INTERPRO
PDB
MMDB
PDBsum
CATH
SCOP
BLAST
FASTA
LALIGN
ClustalW
T-Coffee
MUSCLE
PSIPRED
JPRED
PHD
PuTTY
WinSCP
SPdbV
PyMOL
RasMol
BioEdit
MEGA3
TreeView