Přeskočit na obsah

Wikipedista:Anna Špačková/Pískoviště

Z Wikipedie, otevřené encyklopedie
SCOP databáze pro klasifikaci struktury proteinů, dostupná na stránce http://scop.mrc-lmb.cam.ac.uk/

SCOP (Structural Classification Of Protein) je sekundární databáze, která obsahuje klasifikaci strukturních domén proteinů. Je založena na klasifikaci proteinů pomocí podobné struktury a jejich aminokyselinové sekvence. Proteiny se zde řadí do rodin (families) - proteiny, které mají stejný tvar a podobnou sekvenci nebo funkci, nadrodiny (superfamileis) obsahují proteiny s příbuzným tvarem, ale rozdílnější sekvencí, nebo funkcí. Rodiny a nadrodiny se dají seskupit do příbuzných poskládání (folds) a ty následně do tříd (classes), v nichž se odráží sekundární struktura domén.

Cílem této databáze je určit evoluční vztahy mezi proteiny. U proteinů stejných, nebo velmi podobných struktur, či sekvencí se předpokládá, že mají příbuzného předka, jen málo vzdáleného. Databáze je volně přístupná na internetu http://scop.mrc-lmb.cam.ac.uk/. SCOP byla vytvořena v roce 1994 v Centru pro proteinové inženýrství a Laboratoři molekulární biologie Cambridge. Od roku 2014 se přešlo na vývoj novější databáze s jiným přístupem pro strukturní klasifikaci a to SCOP2. S narůstajícím počtem proteinových struktur v databázi se zjistilo, že vztahy mezi proteiny jsou složitější než se předpokládalo a evoluční dráhy nemusí splňovat daná pravidla.

pravidla:

1 Sekvence proteinů se stejnou funkcí se oddělily evolucí (divergence).

2 Daná sekvence tvoří jen jednu prostorovou strukturu.

3 Homologní proteiny se skládají do podobných struktur.

4 Proteinové struktury jsou evolučně konzervované více než sekvence.

5 Proteiny s nezávislým vývojem mohou mít společné poskládání.

Databáze SCOP spojuje příbuzné proteiny do stromové hierarchie, zatímco SCOP2 vytváří komplexní síť uzlů v orientovaném acyklickém grafu. Každý uzel určuje vztah jistého typu, vůči jednomu uzlu může být několik nadřazených uzlů, což ukazuje vícenásobné cesty pro určitý vztah.

hierarchie

[editovat | editovat zdroj]

rodina - skupina úzce souvisejících proteinů s jasným důkazem jejich evolučního původu. Ve většině případů jejich evoluční vztah zjistitelný současnými metodami porovnání sekvencí (BLAST, PSI-BLAST, HMMER)

nadrodina - seskupuje proteinové domény, které jsou vzdáleněji příbuzné. Jejich podobnost je často omezena na běžné strukturní rysy, které spolu se zachovanou architekturou aktivních nebo vazebných míst či podobnými způsoby oligomerizace naznačují pravěpodobný evoluční původ. Tyto vztahy mohou být určeny nad strukturálními oblastmi různé velikosti, proto SCOP poskytuje hranici domén pro úroveň rodiny i nadrodiny.

poskládání - obsahují nadrodiny skupin na základě globálních strukturálních rysů sdílených většinou proteinů z nadrodin. Tyto vlastnosti jsou složení sekundárních struktur v jádru domény, jejich architektura a topologie. Poskládání je atributem nadrodiny, ale základní rodiny některých nadrodin, u kterých se vyvinuly odlišné strukturní rysy, mohou patřit do jiného poskládání.

IUPR - (Intrinsically Unstructured Protein Region) organizuje nadrodiny proteinů nebo proteinových oblastí, které se neskládají do globulární struktury. Některé z těchto proteinů existují v souboru různých konformací nebo jsou nestrukturované ve volném stavu, ale po navázání na jiné makromolekuly přijímají uspořádanou konformaci.

třída - spojují poskládání a IUPR s různým sekundárním strukturním obsahem. Patří mezi ně proteiny tvořeny převážně α- helixy a β- skládanými listy.

typ - zahrnuje poskládání a IUPR, dělí se do čtyř skupin a to na rozpustné, membránové, vláknité a bez struktury. Každý z těchto typů do značné míry koreluje charakteristickou posloupností a strukturálními rysy.


Každý uzel v klasifikaci SCOP lze identifikovat sedmimístným identifikátorem. Identifikátory uzlu SCOP budou stabilní ve všech verzích, ale mohou bát zastaralé, pokud dojde k významným změnám v uzlu. Databáze SCOP je postavena jako klasifikace nereduntantních proteinových domén. Zástupce je vybrán na základě jeho sekvence (UniProtKB) a struktury (PDB) a je použit pro manuální klasifikaci SCOP. Hranice domény SCOP jsou přiřazeny oběma položkám PDB a UniProtKB. Manuální klasifikace tohoto zástupce se poté automaticky rozšíří na související položky SIFTS.

procházení SCOP

[editovat | editovat zdroj]

Při procházení SCOP existují dva způsoby vstupu do klasifikace: podle strukturální třídy nebo podle typu proteinu. Každá stránka třídy a typu obsahuje seznam příslušných poskládání a IUPR. Malá složka pod názvem skládání umožňuje zobrazit její hlavní uzly (nadrodiny nebo rodiny).

Stránka poskládání poskytuje SCOP anotaci pro dané poskládání a uvádí seznam uzlů, které sdílejí toto poskládání, např. Nadrodina nebo rodina. Odkazy jsou poskytovány nejprve pro jednotlivé nadrodiny a poté pro rodiny, pokud existují. Pod názvem nadrodiny umožňuje malá složka zobrazit její rodiny, které ji tvoří. Vedle názvu nadrodiny je zobrazen jedinečný identifikátor SCOP pro tento uzel následovaný malou ikonou, která umožňuje zobrazit strukturu domény superrodiny, která je vybrána tak, aby reprezentovala tuto nadrodinu.

Stránka nadrodiny zobrazuje anotaci pro danou nadrodinu SCOP. Uvádí seznam poskládíní, do kterých patří, a jejich základní rodiny. Je poskytnut odkaz na předpokládané anotace nadrodiny v databázi SUPERFAMILY. V dolní části stránky jsou uvedeny reprezentativní informace o doméně nadrodiny. Reprezentativní domény jsou uvedeny vlevo. Jejich hranice jsou definovány ručně a jsou zobrazeny pro položku PDB i UniProtKB. Poskytují se odkazy na externí databáze, jako je UniProtKB a PDB, a také odkaz na stránku domény SCOP. Malá složka pod reprezentativním identifikátorem domény nadrodiny umožňuje zobrazit reprezentované touto strukturou proteinových domén. Vedle toho malá ikona umožňuje zobrazit strukturu reprezentativní domény.

Stránka rodiny SCOP má podobný design jako stránka nadrodiny. Kromě běžných funkcí zobrazení umožňuje klikací tabulka předků procházet klasifikaci SCOP. Pokud skupina SCOP koreluje s rodinou Pfam, je poskytnut odkaz na databázi Pfam.

Stránka reprezentativní domény SCOP zobrazuje podrobnosti o její posloupnosti a struktuře. Prohlížeč sekvencí umožňuje přidělit doménu SCOP na celou proteinovou sekvenci UniProtKB a také načíst všechny domény pro tento protein klasifikované v SCOP. Kliknutím na jinou reprezentativní doménu v prohlížeči sekvencí se stránka této domény znovu načte. Struktura každé reprezentativní SCOP domény je zobrazena v kontextu dané položky PDB a zbarvena podle schématu zbarvení zobrazeného v levém horním rohu widgetu struktury. Klikací tabulka předků umožňuje prozkoumat klasifikaci domény. Sada křížových odkazů je poskytována do dalších databází a nástrojů pro analýzu a srovnání proteinové struktury.