SW-V10-Systembiology.. - Chair of Computational Biology

 Documents

 16 views
of 51
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Description
Bereich 3: V10 - Integrative Biologie 1 Protein-Netzwerke: topologische Graphen-Netzwerke Komplexität, Level an Verständnis 2 Analyse von Stoffwechselwegen…
Share
Transcript
Bereich 3: V10 - Integrative Biologie 1 Protein-Netzwerke: topologische Graphen-Netzwerke Komplexität, Level an Verständnis 2 Analyse von Stoffwechselwegen (metabolic pathways): Konzentration auf Metabolite, enzym. Reaktionen 3 Zell-Simulationen: dynamische Simulation auf Sekunden-Zeitskala, t = 0.01 s (V10 und V11) Systems Biology: Integration von genomischen und proteomischen Analysen (V12) www.systemsbiology.org 10. Vorlesung WS 2004/05 Softwarewerkzeuge 1 Protein-Netzwerke: Cytoscape The screenshot left shows the main window of Cytoscape 2.0, displaying a network of protein-protein and protein-DNA interactions among 332 yeast genes. http://www.cytoscape.org/ 10. Vorlesung WS 2004/05 Softwarewerkzeuge 2 Protein-Wechselwirkungsnetzwerke: Cytoscape You can flip through different visual styles by making a selection from the Visual Style pull down menu. "Sample2" will give gene expression values for each node will be colored along a color gradient between red and green. http://www.cytoscape.org/ 10. Vorlesung WS 2004/05 Softwarewerkzeuge 3 Protein-Wechselwirkungsnetzwerke: Cytoscape With the Cytoscape Visual Style feature, you can easily customize the visual appearance of your graph. Cytoscape can also map values such as probabilities, confidence levels, and expression values to the visualization of networks. http://www.cytoscape.org/ 10. Vorlesung WS 2004/05 Softwarewerkzeuge 4 Protein-Wechselwirkungsnetzwerke: Cytoscape The attributes window displays a summary of Gene Ontology (GO) information and expression ratios for each of ten seleted genes.Hyperlinks to the GO database are also provided. http://www.cytoscape.org/ 10. Vorlesung WS 2004/05 Softwarewerkzeuge 5 Protein-Wechselwirkungsnetzwerke: Cytoscape Cytoscape implements an algorithm for finding "active pathways", i.e., subnetworks of genes that jointly show significant differential expression over a set of experimental conditions observed by microarray experiment. The image right show the results of a run of this algorithm. Several active paths have been found; the highest scoring one has 22 genes identified as being active in three of the 20 experimental conditions. From here, one can view a graph with only these genes, display the expression data for any of the conditions, and examine Gene Ontology (GO) information available to assess the biological significance of this network. http://www.cytoscape.org/ 10. Vorlesung WS 2004/05 Softwarewerkzeuge 6 Features of Cytoscape v2.0 (July 2004) Input Input and construct molecular interaction networks from raw interaction files (SIF format) containing lists of protein-protein and/or protein-DNA interaction pairs. For yeast and other model organisms, large sources of pairwise interactions are available through the BIND and TRANSFAC databases. User-defined interaction types are also supported. Load and save previously-constructed interaction networks in GML format (Graph Markup Language). Input mRNA expression profiles from tab- or space-delimited text files. Load and save arbitrary attributes on nodes and edges. For example, input a set of custom annotation terms for your proteins, create a set of confidence values for your protein-protein interactions. Import gene functional annotations from the Gene Ontology (GO) and KEGG databases. http://www.cytoscape.org/ 10. Vorlesung WS 2004/05 Softwarewerkzeuge 7 Features of Cytoscape v2.0 (July 2004) Visualization Customize network data display using powerful visual styles. View a superposition of gene expression ratios and p-values on the network. Expression data can be mapped to node color, label, border thickness, or border color, etc. according to user-configurable colors and visualization schemes. Layout networks in two dimensions. A variety of layout algorithms are available, including cyclic and spring-embedded layouts. Zoom in/out and pan for browsing the network. Use the network manager to easily organize multiple networks. Use the bird’s eye view to easily navigate large networks. http://www.cytoscape.org/ 10. Vorlesung WS 2004/05 Softwarewerkzeuge 8 Analysis Features of Cytoscape v2.0 (July 2004) Plug-ins available for network and molecular profile analysis. E.g.: Filter the network to select subsets of nodes and/or interactions based on the current data. For instance, users may select nodes involved in a threshold number of interactions, nodes that share a particular GO annotation, or nodes whose gene expression levels change significantly in one or more conditions according to p- values loaded with the gene expression data. - Find active subnetworks / pathway modules. The network is screened against gene expression data to identify connected sets of interactions, i.e. interaction subnetworks, whose genes show particularly high levels of differential expression. The interactions contained in each subnetwork provide hypotheses for the regulatory and signaling interactions in control of the observed expression changes. - Find clusters (highly interconnected regions) in any network loaded into Cytoscape. Depending on the type of network, clusters may mean different things. For instance, clusters in a protein-protein interaction network have been shown to be protein complexes and parts of pathways. Clusters in a protein similarity network http://www.cytoscape.org/ represent protein families. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 9 Analyse von Stoffwechselwegen: Beispiel E. coli verwende Daten aus Datenbank EcoCyc (siehe auch MetaCyc: Stoffwechsel von > 150 Organismen) EcoCyc enthält 905 Reaktionen für E.coli davon gehören 161 nicht zum Stoffwechsel kleiner Moleküle, z.B. DNA Replikation, von den verbleibenden 744 wurden 569 mindestens einem Pfad zugeordnet Dagegen gibt es 607 Enzyme. Es gibt also keine 1:1 Zuordnung zwischen Enzymen und Reaktionen, denn (1) Manche Enzyme katalyiseren mehrere Reaktionen, und manche Reaktionen werden von mehreren Enzymen katalysiert (2) nicht zu allen Reaktionen sind die Enzyme bekannt, die sie katalysieren. Ouzonis, Karp, Genome Research 10, 568 (2000) 10. Vorlesung WS 2004/05 Softwarewerkzeuge 10 Beispiel: Stoffwechsel von E. coli Von den 3399 Reaktionen der Enzym-Nomenklatur (ENZYME Datenbank, Bairoch 1999) wurden in E.coli 604 gefunden. Dies bedeutet, dass 301 Reaktionen in E.coli keine E.C. Nummer besitzen.  Problem bei auf E.C. Nummern basierender Bioinformatik ... Ouzonis, Karp, Genome Research 10, 568 (2000) 10. Vorlesung WS 2004/05 Softwarewerkzeuge 11 Beispiel: Stoffwechsel von E. coli Die 744 Reaktionen enthalten Im Mittel enthält jede Reaktion 791 verschiedene Substrate. 4 Substrate. Ouzonis, Karp, Genome Research 10, 568 (2000) 10. Vorlesung WS 2004/05 Softwarewerkzeuge 12 Beispiel: Stoffwechsel von E. coli EcoCyc enthält 131 Stoffwechsel- Pfade. Die Länge der Pfade variiert von 1 bis 16. Im Mittel 5.4. Von den 607 Enzymen sind 100 multifunktional. Purin-Nukleosid-Phosphorylase und Nukleosid-Diphosphatkinase katalysieren 7 bzw. 9 Reaktionen. 483 Reaktionen gehören zu einem Pfad, 99 Reaktionen gehören zu mehreren Pfaden. Ouzonis, Karp, Genome Research 10, 568 (2000) 10. Vorlesung WS 2004/05 Softwarewerkzeuge 13 Fazit Stoffwechsel-Netzwerke von einfachen Organismen sind mittlerweile fast vollständig bekannt. Ist die Beschreibung mit einzelnen Stoffwechsel-Wegen adäquat? - Reaktionen, Enzyme und Substrate gehören oft zu mehreren Pfaden. - Die Einteilung in einzelne Stoffwechsel-Pfade ist nicht immer eindeutig. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 14 Metabolische Pfade in der post-genomischen Ära (a) klassische Biochemie bestimmt Stöchiometrien einzelner Reaktionen (b) Katalogisierung vieler Reaktionen, Gruppierung nach gemeinsamen Metaboliten führt zu traditionellen Pfaden wie Glykolyse, Pentose-Phosphat- Pfad (c) Durch komplette Information können nun die kompletten metabolischen Pfade zugeordnet werden. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 15 Metabolische Pfade in der post-genomischen Ära Traditionelle metabolische Pfade dienen als konzeptioneller Rahmen für Forschung und Lehre. Man kann dadurch Metabolismen verschiedener Organismen vergleichen. Jedoch sind sie nicht für quantitative, systemische Bewertungen biologischer Reaktionsnetzwerke geeignet, da sie nur Teile der Netzwerke darstellen. Sie wurden oft in Zelltypen entdeckt, in denen sie wichtige metabolische Funktionen übernehmen (z.G. Glykolyse in Hefe). Man kann diese Pfade jedoch nicht einfach auf andere Zelltypen mit anderen Enzymleveln und metabolischen Profilen übertragen. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 16 3 Vorgehensweisen 1 konstruiere alle Transformationswege, die von einem gegebenen Substrat zu einem gegebenen Produkt führen 2 verwende Satz von linear (systemisch) unabhängigen Basisvektoren im Raum der Reaktionsflüsse, durch Linearkombination sollen sich alle möglichen Flußverteilungen darstellen lassen. Allerdings ist die Wahl dieser Basisvektoren nicht eindeutig. 3 Konzept der elementaren (Fluss-) Moden Eine Elementarmode ist ein minimaler Satz von Enzymen, die im Gleichgewicht operieren können. Minimal heisst: falls nur die Enzyme dieser Mode operieren, führt Inhibition jedes einzelnen seiner Enzyms zum Stop aller Gleichgewichtsflüsse im System 10. Vorlesung WS 2004/05 Softwarewerkzeuge 17 Beschreibung vernetzter metabolischer Pfade Papin et al. TIBS 28, 250 (2003) (a) aus genomischen, biochemischen, physiologischen Daten wird ein Reaktionsnetzwerk aufgestellt. Es gibt interne Flüsse innerhalb der Systemgrenzen und externe Flüsse mit der Umgebung. (b) Dieses Netzwerk wird durch eine stöchiometrische Matrix dargestellt, in der Metaboliten durch Reaktionen miteinander verbunden werden. (c) Mögliche Zustände der Zelle aufgrund dieser Matrix werden mit Techniken wie „elementary modes“ oder „extreme pathways“ identifiziert. Die möglichen Zustände liegen innerhalb eines Konus im durch die verschiedenen Flüsse aufgespannten Koordinatensystem. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 18 Analyse der stöchiometrischen Matrix Darstellung des Reaktions- stöchiometrische netzwerks mit stöchiometrischer Koeffizienten der Matrix S. einzelnen Reaktionen. Metabolite Analyse der Matrix S  Pathway-Darstellung P. Deren Zeilen enthalten Darstellung der den Reaktionen Pfade ist möglich entsprechende Flüsse für einfache und die Spalten die sich Netzwerke. ergebenden Pfade. Papin et al. TIBS 28, 250 (2003) 10. Vorlesung WS 2004/05 Softwarewerkzeuge 19 Netzwerk-Analyse (a) welche Substrate (A-E) sind zur (b) Aufspüren von nicht genutzten Produktion der Biomasse erforderlich Reaktionen (F  E), Refinement (B,E), welche nicht? der Annotation von Genomen. Papin et al. TIBS 28, 250 (2003) (c) quantitative Beschreibung von (d) Reaktionen RA, RB und RC werden Pathway-Redundanz bzw. Robustheit stets gemeinsam benutzt. Ihre Gene des Netzwerks: P1 und P2 führen beide werden daher vermutlich koordiniert von A nach D. reguliert. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 20 Welche Rolle spielt Pathway-Analyse? Papin et al. TIBS 28, 250 (2003) Die auf Netzwerken basierende Analyse von Pfaden stellt eine gute Basis dar um die heutige Flut an experimentellen Daten ohne vorgefasste Meinungen in biologische Modelle zu übersetzen. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 21 konkretes Beispiel: Glykolyse Stoffwechselpfad in Lehrbuch. http://biotech.icmb.utexas.edu/ glycolysis/pathway.html 10. Vorlesung WS 2004/05 Softwarewerkzeuge 22 Glykolyse Pyr Pyk PEP Schematische Darstellung. Metabolite sind blau, Eno Enzyme rot dargestellt. 2PG Gpm 3PG Pgk Gap Glucose G6P F6P FP2 GAP 1,3BPG Hexokinase Pgi Pfk Fba TpiA 10. Vorlesung WS 2004/05 Softwarewerkzeuge DHAP 23 Pentose-Phosphat-Stoffwechsel Xyl5P Sed7P Ery4P Rpe TktI Tal Ru5P Gnd R5P GAP F6P TktII 6PG Pgl GO6P Zwf G6P F6P G6P Analoge Darstellung für PPP. G6P und F6P tauchen je zweimal auf! 10. Vorlesung WS 2004/05 Softwarewerkzeuge 24 Konkretes Beispiel: Monosaccharid-Stoffwechsel Benötigter Input: Deklaration interner und externer Substanzen, Enzymreaktionen und ihre Richtung Schuster, Fell, Dandekar, Nature Biotech 18, 326 (2000) 10. Vorlesung WS 2004/05 Softwarewerkzeuge 25 Reaktionsschema für Monosaccharid-Stoffwechsel Kopplung von Glykolyse und Pentose-Phosphat-Pfad: 15 Metabolite, 19 Reaktionen Daher besitzt die stöchiometrische Matrix die Dimension 15  19. Welche Reaktionen müssen notwendigerweise gemeinsam ablaufen? Schuster, Fell, Dandekar, Nature Biotech 18, 326 (2000) Offensichtlich {Gap, Pgk, Gpm, Eno, Pyk} und {Zwf, Pgl, Gnd}. Weiterhin auch {Fba, TpiA} und10.{2Vorlesung Rpe,WS TktI, Tal, TktII}. 2004/05 Softwarewerkzeuge 26 Reduktion(I): Reduziertes Schema Schuster, Fell, Dandekar, Nature Biotech 18, 326 (2000) Schema wurde aus vorherigem Schema erhalten indem all Enzyme kombiniert wurden, die immer gemeinsam operieren. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 27 Reduktion (II): Elementarmoden Eine Elementarmode ist ein minimaler Satz von Enzymen, die im Gleichgewicht operieren können. Minimal heisst: wenn nur die Enzyme einer Mode aktiv sind, führt Inhibition jedes einzelnen Enzyms zum Stop aller Gleichgewichtsflüsse. Identifizierung der Moden: Schuster, Fell, Dandekar, Nature Biotech 18, 326 (2000) (1) ursprünglicher Glykolyse-Stoffwechsel. Die Moden (3)-(6) stimmen mit den 4 Moden des Pentose-Phosphat-Stoffwechsels aus Stryer überein. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 28 Elementarmoden Schuster, Fell, Dandekar, Nature Biotech 18, 326 (2000) Graphische Darstellung von 7 Elementarmoden. Die Moden beinhalten unterschiedliche Anzahl an Enzymen und überlappen teilweise miteinander. Die Zahlen entsprechen den relativen Flüssen. Jeder Systemzustand im Gleichgewicht lässt sich als Linearkombination dieser Elementarmoden darstellen. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 29 Software: FluxAnalyzer, setzt auf Matlab auf Steffen Klamt. Klamt et al. Bioinformatics 19, 261 (2003) 10. Vorlesung WS 2004/05 Softwarewerkzeuge 30 Software: FluxAnalyzer, setzt auf Matlab auf Links: Network composer of the FluxAnalyzer facilitating the definition of the network structure. Mitte: Input mask for defining a new network element of type reaction Rechts: Pull-down menu of the FluxAnalyzer http://pinguin.biologie.uni-jena.de/bioinformatik/ providing an interactive use of the various functions of the toolbox. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 31 Fazit Stoffwechselpfade sind nicht isoliert voneinander, besitzen in verschiedenen Organismen verschiedene Komponenten bzw. Bedeutung. Oft sind mehrere alternative Reaktionspfade möglich. Das Program BIOMINER (Prof. Lenhof) wählt z.B. den Pfad/Graphen der geringsten Länge. Komplexe metabolische Netzwerke sind daher für uns schwer zu durchschauen. Man benötigt intelligente und robuste Algorithmen um daraus biologische Modelle abzuleiten. Diese biologischen Modelle sehen jedoch vermutlich nicht so einfach aus wie in heutigen Lehrbüchern. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 32 E-cell: Software Umgebung zur Simulation ganzer Zellen Institute for Advanced Biosciences der Keio University (existiert seit 1996) Dr. Masaru Tomita, Team enthält > 50 Mitglieder! weitere Programme für integrative Zellsimulationen: GEPASI (1993, 1997) – Simulation von Stoffwechselpfaden KINSIM (1983, 1997) METAMODEL (1991) SCAMP (1993) DBSolve (1997) V-Cell (1999) es gibt auch separate Programme, mit denen man Genregulation und –expression, sowie Signaltransduktion und Zellteilung untersuchen kann. Das allgemeine Problem sind fehlende experimentelle Daten. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 33 Implementation des E-cell Systems E-CELL wurde in C++ geschrieben, existiert nun in der Version 3. Das Modell besteht aus 3 Listen, die bei Programmstart geladen werden: substance list definiert alle Objekte, die die Zelle und das Kulturmedium enthalten rule list definiert alle Reaktionen, die in der Zelle stattfinden system list definiert die räumliche und/oder funktionelle Struktur der Zelle und ihrer Umgebung Der Zustand der Zelle zu jedem Zeitpunkt wird als Liste von Konzentrationen und globalen Parametern wie Zellvolumen, pH und Temperatur angegeben. Das Programm (simulation engine) erzeugt neue Zustände der Zelle nach Iterationsschritten von jeweils z.B. t = 1 ms. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 34 Erstes Modellsystem: Mycoplasma genitalium 1996 Veröffentlichung des Genoms von Mycoplasma genitalium Dies ist eines der kleinsten bisher bekannten Genome (580 kb). Es enthält die kleinste bisher bekannte Anzahl von Genen (ca. 480) von allen bisher bekannten lebenden Organismen. Genom ist 10  kleiner als E.coli ca. 80% der Gene sind homolog zu Proteinen mit bekannter Funktion. Intensive Gene-Knockout Untersuchungen zeigten, dass viele der 480 Gene für das Überleben von M. genitalium nicht notwendig sind. Es wurde ein minimaler Satz von 127 Genen als notwendig und hinreichend für das Überleben und einen stabilen Zustand der Zelle ausgewählt. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 35 Large-scale Organisation von metabolischen Netzwerken Modell einer Zelle, die aus eigener Kraft lebt. Diese minimale Zelle besitzt 127 Gene, gerade ausreichend um Proteingehalt und Membranstruktur aufrecht zu erhalten. Glukose wird aus der Umgebung als Energiequelle aufgenommen; ATP wird durch den Glykolyse-Pfad produziert und wird hauptsächlich zur Proteinsynthese verbraucht. Proteine und Phospholipide werden mit der Zeit spontan abgebaut. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 36 127 Gene der überlebensfähigen Zelle Anzahl der Gene in wichtigen Pfaden der hypothetischen Zelle. ‚Other‘ sind solche Gene, die in der Genliste von M. genitalium nicht gefunden wurden und daher von anderen Organismen übernommen wurden, wie z.B. E.coli. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 37 Für Proteine kodierende Gene in der hypothetischen Zelle 10. Vorlesung WS 2004/05 Softwarewerkzeuge 38 Enzyme in der hypothetischen Zelle Die Information über Pfade wurde aus 2 Datenbanken übernommen KEGG (Kanehisa, 1996): enthält eine grosse Sammlung von diagrammatischen Stoffwechselpfaden, die nicht für bestimmte Spezien spezifisch sind EcoCyc (Karp et al. 1996): Datenbank mit Pfaden mit vielen Links auf Literaturstellen  sehr nützlich um kinetische Daten für Reaktionen zu finden. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 39 KEGG: Stoffwechsel-Datenbank enthält metabolische Pfade für viele sequenzierte Organismen 10. Vorlesung WS 2004/05 Softwarewerkzeuge 40 Substanzen Kleine Moleküle in der hypothetischen Zelle: Metabolite Aminosäuren Nukleotide Kationen andere Substanzen: Proteine, DNA, RNA, Multi-Protein-Komplexe Protein-DNA Komplexe Protein-RNA Komplexe 10. Vorlesung WS 2004/05 Softwarewerkzeuge 41 Reaktionsregeln 495 Reaktionsregeln (1) enzymatische Reaktionen: erhöhen und verringern die Mengen von Substraten und Produkten (2) Komplexbildungen, bei denen mehrere Substrate Komplexe bilden (3) Transportvorgänge, bei denen Substanzen zwischen verschiedenen Kompartments ausgetauscht werden (keine Diffusion innerhalb der Kompartments) (4) stochastische Prozesse wie die Bindung eines Transkriptionsfaktors Die Reaktionen (1) – (3) werden als einfache Ratengleichungen formuliert. Alle Reaktionen werden parallel simuliert. 10. Vorlesung WS 2004/05 Softwarewerkzeuge 42 Reaktionsregeln Chemische Reaktionen können verallgemeinert werden als: v1S1  v2 S 2  ...  v j S j  ...  vn S n Sn ist die Konzentration der n ten Substanz, und n deren stöchiometrischer Koeffizient. Die Geschwindigkeit jeder Reaktion kann als Funktion von Sn und n dargestellt werden. Die meisten nicht-enzymatischen Reaktionen sind erster Ordnung. D.h. ihre Geschwindigkeiten v hängen direkt von den Konzentrationen der Substrate ab: j 1 v  k   Si  i v i Enzymatische Reaktionen mit einem Substrat und einem Produkt können durch die Michaelis-Menten-Gleichung dargestellt werden: Vmax  S  v S   K m 10. Vorlesung WS 2004/05 Softwarewerkzeuge 43 graphische Kontrolle Mit Hilfe von verschiedenen graphischen Oberflächen kann der Benutzer dyna
Related Search
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks