Bioinformatické databáze

1.1 Hledání v databázích nukleotidových sekvencí
Vyhledejte gen halogenalkandehalogenázy (anglicky haloalkane dehalogenase) dhlA z bakterie Xanthobacter autotrophicus GJ10 v databázích GenBank a EMBL-Bank.
Určete a stáhněte sekvenci kódující oblasti tohoto genu a sekvenci proteinu, který je tímto genem kódován.
1.1.1 Jaký je přístupový kód pro gen dhla v jednotlivých databázích? Odpověď: EMBL-Bank: M26950, GenBank: M26950
1.1.2 Určete kódující sekvenci genu dhla a stáhněte ji ve FASTA formátu. Nápověda: oblast 999-ATGAT..AATAG-1931
1.1.3 Stáhněte článek popisující klonování genu dhla Nápověda: PubMed; full-text
1.1.4 Jaký je přístupový kód proteinové sekvence kódované genem dhla? Odpověď: AAA88691.1
1.1.5 Stáhněte sekvenci proteinu kódovaného genem dhla ve FASTA formátu. Nápověda: MINA...AETE; přes přístupový kód proteinu se lze dostat do proteinové sekvenční databáze
1.2 Hledání v databázích proteinových sekvencí
Vyhledejte záznam o proteinu halogenalkandehalogenáze (anglicky haloalkane dehalogenase) z bakterie Sphingobium japonicum UT26 (synonymum 1,3,4,6-tetrachloro-1,4-cyclohexadiene hydrolase) v proteinové databázi UniProtKB/Swiss-Prot.
1.2.1 Jaký přístupový kód má tento protein? Odpověď: D4Z2G1
1.2.2 Jakou funkci má tento protein? Odpověď: katalyzuje hydrolýzu vazby uhlík-halogen v halogenovaných sloučeninách
1.2.3 Z kolika aminokyselin je tento protein tvořen? Odpověď: 296
1.2.4 Jaké má tento protein pH optimum? Odpověď: 8.2
1.2.5 Které reziduum plní funkci nukleofilu? Odpověď: D108
1.2.6 Jaký efekt mají mutace D108A, F151Y a H272L? Odpověď: D108A: ztráta aktivity; F151Y: zvýšení aktivity; H272L: efekt není znám
1.2.7 Stáhněte článek popisující charakterizaci mutanta D108A. Nápověda: PubMed abstract; full-text
1.2.8 Byla pro tento protein vyřešena 3D struktura? Pokud ano, uveďte přístupový kód do strukturní databáze. Odpověď: Ano, pro daný protein bylo vyřešeno 17 struktur + 1 AlphaFold structura. Přístupové kódy např. 1CV2, 1D07, 1G42, ...
1.2.9 Stáhněte sekvenci tohoto proteinu ve FASTA formátu Nápověda: použijte "FASTA" odkaz v sekci "Sequences"
1.2.10 Stáhněte z GenBank DNA sekvenci, která kóduje tento protein: Nápověda: použijte přístupový kód D14594 uvedený v sekci "Sequence"
1.3 Informace o genomových projektech
V databázi Genomes OnLine Database (GOLD) zjistěte informace o dokončených a probíhajících genomových projektech.
1.3.1 Kolik bakteriálních a eukaryotických organizmů bylo dosud osekvenováno? Odpověď: 440 167 bakteriálních, 56 197 eukaryotických [15-09-2025]
1.3.2 Kolik genomových projektů podle databáze GOLD v současné době probíhá? Odpověď: 43 338 [15-09-2025]
1.4 Informace o genomu a jeho vizualizace
Zjistěte, zda gen BRCA1 u myši obsahuje SNP elementy. Pokud ano, znázorněte synonymní SNP modrou barvou, nesynonymní červenou.
Postup:
1.4.1 Přistupte na Genome Browser.
1.4.2 Vyberte myš (mouse) z panelu na levé straně. Ponechte defaultní referenční genom.
1.4.3 Do kolonky pro pozici zadejte BRCA1 a vyberte z nabídky.
1.4.4 Na spodku stránky klikněte na Common SNPs(142), následně v záložce Coloring options nastavte synonymní mutace na modrou, nesynonymní na červenou. Klikněte na submit.
1.4.5 Kliknutím na stopu EVA SNP rozvinete seznam SNP mutací s RS identifikátory. Prohlédněte si detail některých z nich.
S využitím Table Browseru získejte seznam SNP elementů pro gen Clock u člověka. Postup:
1.4.6 V záložce tools vyberte položku Table browser.
1.4.7 Zvolte Mammal, Human, assembly GRCh38/hg38.
1.4.8 Vyberte skupinu Variation, zbytek ponechte v defaultním nastavení.
1.4.9 V regionu vyberte pozici a do lookup buňky zadejte CLOCK. klikněte na lookup.
1.4.10 Jako output zvolte selected fields from primary and related tables. Zobrazte položky chrom, chromStart, chromEnd, name, strand, observed, func. Klikněte na get output.
1.5 Vyhledání specializovaných databází
Vyzkoušejte NAR Molecular Biology Database Collection pro vyhledání specializovaných bioinformatických databází.
1.5.1 Vyhledejte genomovou databázi zaměřenou na určitou skupinu virů Nápověda: použijte "Category List" -> "Genomics Databases (non-vertebrate)" -> "Viral genome databases"
1.5.2 Vyhledejte databázi věnovanou kvasince Saccharomyces cerevisiae Nápověda klikněte na "Search Summary Papers"; jako klíčové slovo zadejte "Saccharomyces" (výsledkem např. databáze SGD, CYGD, SCMD, SCPD,...) a/nebo klíčové slovo "yeast" (výsledkem např. databáze PTM-Switchboard, Yeast snoRNA Database,...)

MENDELOVO CENTRUM pro vzdělávání v biologii, biomedicíně a bioinformatice CZ.1.07/2.3.00/09.0186

Aktuální cvičení:


Další informace:
Cvičení
Nukl. kyseliny
Proteiny
Struktury
Nástroje
Ke stažení
Bioinformatika - proteiny
Bioinformatika - nukl. kyseliny
Bioinformatické databáze
Manipulace se sekvenčními daty
Návrh primerů a restrikční analýza
Párové sekvenční přiložení
Mnohonásobné sekvenční přiložení
Hledání a identifikace genů
Analýza proteinových sekvencí
NGS data a lokální anotace
Strukturní databáze
Předpověď struktury proteinů
GenBank
EMBL-Bank
DDBJ
dbEST
UniGene
UniProtKB
NRDB
PIR
PROSITE
Pfam
INTERPRO
PDB
MMDB
PDBsum
CATH
SCOP
BLAST
FASTA
LALIGN
ClustalW
T-Coffee
MUSCLE
PSIPRED
JPRED
PHD
PuTTY
WinSCP
SPdbV
PyMOL
RasMol
BioEdit
MEGA3
TreeView