Powerpoint-Präsentation

 Documents

 29 views
of 115
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Description
Informationsdarstellung mit XML Klaus Becker 2007 2 Ziele und Inhalte Informationsdarstellung mit XML Einblick in XML XML - ein Thema für den…
Share
Transcript
Informationsdarstellung mit XML Klaus Becker 2007 2 Ziele und Inhalte Informationsdarstellung mit XML Einblick in XML XML - ein Thema für den Informatikunterricht Informatikunterricht am Puls der Zeit Ein Blick hinter die Kulissen Grundlagen von XML Dokumenttypen und ihre Validierung XML-basierte Sprachen Exkurs: Namensräume, Formatierung, ... Verarbeitung von XML-Dokumenten 3 Teil 1 Ein Blick hinter die Kulissen 4 Textverarbeitung Mit OpenOffice wurde ein Text über den Kölner Dom erstellt und anschließend in verschiedenen Ausgabeformaten abgespeichert ... 5 Darstellung des Textes ... als MS-Word-Datei (siehe "dom_koeln.doc"). Mit einem Text-Editor geöffnet sieht diese Datei so aus: 6 Darstellung des Textes ... als OpenOffice-Datei (siehe "dom_koeln.odt"). Mit einem Text-Editor geöffnet sieht diese Datei noch unverständlicher aus. 7 Darstellung des Textes Wenn man die von OpenOffice erzeugte Datei "dom_koeln.odt" entpackt, klärt sich einiges (siehe "content.xml"). 8 Darstellung des Textes ... als DocBook-Datei (siehe "dom_koeln.xml"). Hier kann man deutlich die Struktur des Textes ablesen. 9 Erstellung von Struktogrammen Mit Hilfe von verschiedenen Struktogramm-Editoren wurde der Algorithmus zur Berechnung des ggT in Struktogrammform dargestellt: StruktEdit NSCEdit 10 Datei-Formate zur Darstellung StruktEdit-Datei betrachtet mit einem Hex-Editor NSCEdit-Datei betrachtet mit einem Text-Editor 11 Automatensimulator Das Simulationsprogramm JFlap wurde in den letzten Jahren mehrfach überarbeitet und weiterentwickelt. Insbesondere wurde auch das Speicherformat verändert. Zunächst sah dies so aus (JFlap40b8): 12 Automatensimulator In den neueren Versionen sieht das so aus (JFlap40b14): 13 Aufgabe Viele Programme speichern Daten heute im XML-Format. Um den Speicherbedarf zu verringern, werden die Daten zusätzlich komprimiert. Beispiel: GeoGebra Benennen Sie eine mit GeoGebra erstellte Datei (z. B. grenzwert_mit_streifen.ggb) geeignet um (grenzwert_mit_streifen.zip) und entpacken Sie sie. Schauen Sie sich die entpackte Datei mit einem Editor an. 14 Aufgabe Lesen Sie den unten abgebildeten Text. Vergleichen die Situation der Baumeister mit heutigen Nutzern von digital gespeicherter Information. Welche Vorteile bietet eine XML-basierte Darstellung? Die Geschichte des Kölner Doms beginnt im Jahre 1248 mit der Grundsteinlegung für den Chor, der gigantisch war für mittelalterliche Maßstäbe. Es folgten der Abriss des alten Langhauses, die Arbeit an den Westtürmen - auch deren Ausmaße sprengten die damals üblichen Dimensionen. Allein diese Bauarbeiten dauern drei ganze Jahrhunderte, während derer man sich konsequent an die alten Baupläne hielt. Digital verschlüsselte Daten auf nicht beständigen Datenträgern wären zu dem Zeitpunkt längst unlesbar gewesen. Doch im 16. Jahrhundert kommen die Bauarbeiten am Großprojekt Dom zum Erliegen. Die genaue Ursache ist bis heute unbekannt. Der Dom bleibt unvollendet, eine Bauruine, und zwar ganze 300 Jahre lang. Erst zu Beginn des 19. Jahrhunderts kommt plötzlich wieder Bewegung in das Projekt "Dom". Und noch immer existiert der mittelalterliche Bauplan. 600 Jahre ist er mittlerweile alt. Das Pergament brüchig, die Tinte vergilbt und - uncodiert. Und damit ohne jegliche Software oder Hardware lesbar. Wäre er digital gespeichert gewesen, wohl niemand hätte nach sechs Jahrhunderten geschafft, ihn zu lesen. Doch mit einem Plan aus Tinte und Pergament war es kein Problem, den Dom bis zum Ende des 19. Jahrhunderts genau so zu vollenden, wie es sich sein visionärer mittelalterlicher Baumeister einst ausgedacht hat. (Quelle: http://www.wdr.de/tv/q21/1058.0.phtml) 15 Aufgabe Im Ordner "Material_Datenbank" finden Sie Daten aus einer Datenbank , die im XML-Format exportiert worden sind. Warum macht es Sinn, einen solchen Datenexport anzubieten? Deutschland Costa Rica 4:2 2006-06-09 Muenchen Polen Ecuador 0:2 2006-06-09 Gelsenkirchen ... 16 Aufgabe Verschaffen Sie sich einen ersten Überblick über XML. Lesen Sie sich hierzu die Seite "XML in 10 Punkten" durch. 1. XML steht für strukturierte Daten 2. XML sieht ein wenig wie HTML aus 3. XML ist Text, aber nicht zum Lesen 4. XML ist vom Design her ausführlich 5. XML ist eine Familie von Techniken 6. XML ist neu, aber nicht so neu 7. XML überführt HTML in XHTML 8. XML ist modular 9. XML ist die Basis für RDF und das Semantic Web 10. XML ist lizenzfrei, plattformunabhängig und gut unterstützt siehe: http://www.w3c.de/Misc/XML-in-10-Punkten.html 17 Datenrepräsentation bei Werkzeugen GGT Eingabe: x, y SOLANGE y > 0 h := x mod y x := y y := h Ausgabe: x Repräsentieren Interpretieren Repräsentieren Interpretieren Eingabe: x, y StruktEdit: proprietäres Format SOLANGE y > 0 NSCEdit: standardisiertes h := x mod y Format ... 18 Datenrepräsentation mit XML XML steht für Extensible Markup Language. XML wird benutzt, um Daten strukturiert darzustellen. Daten können auf ganz unterschiedliche Weise dargestellt und auch strukturiert werden. XML bietet eine Art Standard zur Strukturierung von Daten, den inzwischen sehr viele Werkzeuge nutzen. Eingabe: x, y SOLANGE y > 0 NSCEdit: standardisiertes h := x mod y Format ... 19 Teil 2 Grundlagen von XML 20 Strukturierte Darstellung v. Information XML-Dokumente werden benutzt, um Information strukturiert darzustellen. fa Eingabe: x, y 119.0 101.0 119.0 SOLANGE y > 0 101.0 h := x mod y 248.0 101.0 ... 2 ... 1 1 GGT ... 21 Aufgabe Schauen Sie sich ein XML-Dokument mit einem geeigneten Browser an. Darstellung im Editor Eingabe: x, y SOLANGE y > 0 h := x mod y ... ... GGT Anzeige mit einem Browser 22 Hierarchische Baumstruktur Die Strukturierung erfolgt in Form eines Baumes. Eingabe: x, y SOLANGE y > 0 h := x mod y ... ... GGT Anzeige mit einem Browser 23 Der Baum der Elemente  Grundbausteine eines XML- Wurzelelement Dokuments sind die XML-Elemente.  Ein (XML-) Element wird mit Hilfe von Tags (Anfangs- und Endtag) Element als markiert. Container  Ein Element kann selbst wieder Elemente enthalten (Container) oder nur noch Zeichen (eigentliche Daten). Element mit Zeicheninhalt  Das erste Element eines XML- Dokuments ist das Wurzelelement, das alle anderen Elemente in sich einschließt. Ein XML-Dokument vermischt also Inhalte mit Informationen über diese Inhalte (Meta-Information). 24 Tags  Mit Hilfe von Tags werden die verschiedenen Elemente begrenzt. Anfangstag Verschiedene Tags markieren dabei unterschiedliche Elementtypen. Endtag  Tags werden (wie bei HTML) mit leeres Element spitzen Klammern gebildet. Die Tag- Namen sind (fast) frei wählbar.  Anfangs- und Endtag müssen immer exakt zueinander passen. Dabei wird auf Groß- und Kleinschreibung geachtet.  Tags müssen korrekte geschachtelt werden.  Bei einem leeren Element wird i. d. Regel eine verkürzte Tag- Schreibweise benutzt. 25 Attribute  Elemente können mit Hilfe von Attributen näher beschrieben Attributwert werden. Attribute können dabei zusätzliche Informationen über den Attribut Inhalt eines Elements liefern, ohne selbst Teil des Inhalts zu sein. Jedem Attribut muss ein bestimmter Wert zugewiesen werden, der in Anführungszeichen geschrieben wird. 26 Kommentare  Kommentare erleichtern das Verständnis und werden vom Browser mit angezeigt. Kommentar fa 119.0 101.0 119.0 101.0 248.0 101.0 2 1 1 ... 27 Prolog  Ein XML-Dokument beginnt in der Regel mit dem Prolog . Der Prolog sollte hier stehen, um das Dokument als XML-Dokument zu kennzeichnen.  Im Prolog kann der Zeichensatz festgelegt werden, der zur fa Kodierung benutzt wird. Fehlt die Angabe des Zeichensatzes, so wird 119.0 101.0 UTF-8 als Vorgabe benutzt. Wenn deutsche Umlaute korrekt 119.0 dargestellt werden sollen, sollte 101.0 man den Zeichensatz ISO-8859-1 verwenden. 248.0 101.0 2 ... 28 Wohlgeformtheit Ein XML-Dokument, das alle syntaktischen Bedingungen erfüllt, heißt wohlgeformt. beachte: Nur wohlgeformte XML- Dokumente werden vom Browser in Baumform angezeigt. wohlgeformte XML-Dokumente 29 Aufgabe Versuchen Sie, nicht-wohlgeformte XML-Dokumente mit dem Browser anzuzeigen. Testen Sie verschiedene Fälle: - die Tag-Namen stimmen nicht exakt überein - die Klammerung ist nicht korrekt - der Attributwert fehlt / ist nicht in Anführungszeichen geschrieben ... 30 Aufgabe Was geschieht, wenn man die Elementstruktur verändert. Lassen Sie gezielt Tags weg bzw. verändern Sie gezielt die Baumstruktur, ohne gegen die Syntaxregeln von XML zu verstoßen. Eingabe: x, y SOLANGE y > 0 weglassen h := x mod y ... ... 31 Aufgabe Versuchen Sie, eine neue Anweisung im Struktogramm zur Berechnung des GGT einzufügen (z. B. die Zuweisung h := 0 nach der Eingabe). Benutzen Sie aber nicht die Struktogramm-Editoren, sondern versuchen Sie es direkt im "Quelltext". Öffnen Sie anschließend den Quelltext mit dem entsprechenden Struktogrammeditor. Welche Unterschiede zeigen sich zwischen den verschiedenen Datenformaten? Vergleichen Sie mit der Situation beim Bau des Kölner Doms. 32 Aufgabe Eine Bank möchte Daten von Überweisungen mit Hilfe von XML strukturiert darstellen. Entwerfen Sie ein passendes XML-Dokument. 33 Aufgabe Entwickeln Sie ein XML-Dokument, mit dem man Informationen über eine Schulklasse / ein Lehrerkollegium erfassen kann. 34 Aufgabe Graphen treten in sehr vielen Anwendungen auf. Entwickeln Sie ein XML- Dokument, mit dem man die Graph-Daten strukturiert darstellen kann. KO 54 128 RB 28 35 MZ BI 98 33 35 TR AZ 36 48 116 FT 48 31 KL SP 35 Teil 3 Dokumenttypen und ihre Validierung 36 Ungültige Dokumentenstruktur Wenn man das Element zur Darstellung der Struktogramm- überschrift weglässt, so wird das Dokument weiterhin vom Browser Eingabe: x, y angezeigt. Das Dokument wird aber nicht mehr vom Struktogrammeditor akzeptiert, da SOLANGE y > 0 es nicht mehr den geforderten Dokumenttyp hat. h := x mod y ... Zielsetzung: Ausgabe: x Im Folgenden sollen Verfahren vorgestellt werden, mit denen der Dokumenttyp präzise beschrieben GGT werden kann. 37 Dokumenttyp Wir betrachten als erstes Beispiel XML-Dokumente zur Meier (vereinfachten) Beschreibung Christiane eines Lehrerkollegiums. mei Deutsch Erdkunde christinemeier@gmx.de Ein Kollegium besteht aus Lehrerinnen mei.kantgymnasium@schule.de und Lehrern (mindestens eine / einer). Im Folgenden werden mit "Lehrer" auch Schmitt Lehrerinnen erfasst. Thomas sch Jeder Lehrer hat einen Namen und Latein Vornamen. Musik Philosophie Jedem Lehrer ist ein Kürzel zugeordnet. Jeder Lehrer unterrichtet mindestens ein Müller Fach. Katharina mue Ein Lehrer kann eine oder mehrere Email- Mathematik Informatik Adressen angeben. mue.kantgymnasium@schule.de Beschreibung des Kontextes 38 Dokumenttyp Das Wurzelelement hat den Namen "kollegium". Meier Ein Element vom Typ "kollegium" besteht Christiane aus mindestens einem Element vom Typ mei Deutsch "lehrer". Erdkunde christinemeier@gmx.de Ein Element vom Typ "lehrer" besteht aus mei.kantgymnasium@schule.de - einem Element vom Typ "name", - einem Element vom Typ "vorname", Schmitt - einem Element vom Typ "kuerzel", Thomas - mindestens e. Element v. Typ "fach" sch - beliebig viel. Elementen v. Typ "email". Latein Musik Zudem hat ein Element vom Typ "lehrer" Philosophie das Attribut "geschlecht". Ein Element vom Typ "name" besteht aus Müller Zeichen. Katharina mue ... Mathematik Informatik mue.kantgymnasium@schule.de informelle Beschreibung des Dokumenttyps 39 Dokumenttypdefinition Das Wurzelelement hat den Namen "kollegium". Ein Element vom Typ "kollegium" besteht aus mindestens einem Element vom Typ "lehrer". Ein Element vom Typ "lehrer" besteht aus - einem Element vom Typ "name", - einem Element vom Typ "vorname", ]> - einem Element vom Typ "kuerzel", - mindestens e. Element v. Typ "fach" - beliebig viel. Elementen v. Typ "email". Meier Zudem hat ein Element vom Typ "lehrer" Christiane das Attribut "geschlecht". mei Deutsch Ein Element vom Typ "name" besteht aus Erdkunde christinemeier@gmx.de Zeichen. mei.kantgymnasium@schule.de ... .. informelle Beschreibung des formale Beschreibung des Dokumenttyps Dokumenttyps 40 Dokumenttypdefinition Eine Dokumenttypdefinition (DTD) legt eine Klasse von Dokumenten fest, die alle vom lehrer (name, vorname, kuerzel, fach+, gleichen Typ sind. Dokumenttypdefinition ]> Eine Dokumenttypdefinition Meier Christiane beschreibt die Struktur eines mei Deutsch Dokuments mit Hilfe einer Erdkunde Grammatik, die in Form von christianemeier@gmx.de mei.kantgymnasium@schule.de Deklarationen beschrieben wird. .. 41 Einbindung einer DTD  Eine Dokumenttypdefinition nach dem XML-Prolog eingebunden werden (interne ... interne DTD DTD).  Eine Dokumenttypdefinition kann auch über eine Referenz auf ... externe DTD eine Datei mit dem XML- Dokument verbunden werden (externe DTD).  Mit dem Schlüsselwort PUBLIC ...  Als Name der DTD wird der externe DTD Name d. Wurzelelement benutzt. 42 Deklaration von Elementen Operator Bedeutung () Bildung von Elementgruppen , Trennzeichen innerhalb einer Sequenz von Elementen | Trennzeichen zwischen sich ausschließenden Alternativen * Element(gruppe) kann beliebig oft (auch gar nicht) vorkommen + Element(gruppe) muss mindestens einmal, kann mehrfach vorkommen ? Element(gruppe) kann einmal oder kein mal vorkommen ]> 43 Inhaltsmodelle Inhaltsmodell Beschreibung Elementinhalt Das Element enthält ausschließlich Unterelemente ...... #PCDATA Das Element enthält nur Zeichendaten Sport gemischter Inhalt Das Element kann Zeichendaten und Unterelemente enthalten FrauChristineMeier EMPTY Das Element hat keinen Inhalt ANY Das Element hat beliebige Inhalte haben. 44 Deklaration von Attributlisten
Related Search
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks