8. Workshop - Internetarchivierung

 Documents

 62 views
of 22
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Description
8. Workshop - Internetarchivierung Problembereiche bei der Spiegelung der Websites mit Offline 3.1. Erfassung/Bewertung/Transfer Explorer Pro: 1. Die Website…
Share
Transcript
8. Workshop - Internetarchivierung Problembereiche bei der Spiegelung der Websites mit Offline 3.1. Erfassung/Bewertung/Transfer Explorer Pro: 1. Die Website liegt nicht auf dem gedachten Server (es befindet sich dort nur eine Weiterleitung) 2. Teile der Website befinden sich auf einem zweiten Server (häufig css oder Bilddateien) 3. Mouseover-Grafiken müssen nachgeladen werden (JavaSkript-Navigation) 4. Session-Id‘s (schon vorhandene Dateien werden nicht als solche erkannt, da sie eine neue Session-ID haben) 5. Ursprüngliche xml-Dateien werden nicht als html-Dateien erkannt und „geparst“ 6. Dynamisch aufgebaute Webseiten werden in statische html-Seiten umgewandelt (großes Datenaufkommen, Interaktionsmöglichkeiten sind zum Teil auf den gespiegelten Webseiten nicht mehr möglich) 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 1 8. Workshop - Internetarchivierung 1. Die Website liegt nicht auf dem gedachten Server 3.1. Erfassung/Bewertung/Transfer Beispiel: Mögliche Lösung: Die Homepage des SPD-Unterbezirks Beide URLs werden in das Dresden-Elbe-Röder Spiegelungsprogramm eingegeben. http://www.spd-der.de/ Letztere mit der Einschränkung auf den liegt eigentlich auf Unterordner „der“. http://spdnet.sozi.info/sachsen/der/ 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 2 8. Workshop - Internetarchivierung Beispiel zu Punkt 1 http://spdnet.sozi.info/sachsen/der/ 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 3 8. Workshop - Internetarchivierung 2. Teile der Website befinden sich auf einem zweiten Server 3.1. Erfassung/Bewertung/Transfer Beispiel: Mögliche Lösung: Homepage des ehemaligen NRW- Das Spiegelungsprogramm Landtagsabgeordneten Georg Scholz „darf“ Css- und Bilddateien auch von anderen Servern http://www.georg-scholz.de/ holen. Css-Dateien und ein Teil der Bilder liegen auf der RuhrOstSPD. 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 4 8. Workshop - Internetarchivierung Beispiel zu Punkt 2 (ohne css und Bilder) 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 5 8. Workshop - Internetarchivierung Beispiel zu Punkt 2 (mit css und Bildern von anderem Server) 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 6 8. Workshop - Internetarchivierung 3. Mouseover-Grafiken müssen nachgeladen werden 3.1. Erfassung/Bewertung/Transfer Beispiel: Mögliche Lösung: Homepage des SPD-Ortsvereins Mit Hilfe des „LogWindow“ im Bad Sooden-Allendorf Spiegelungsprogramm lassen sich die Namen und http://www.badsoodenallendorf.de/ Pfade fehlender Dateien ermitteln und nachträglich JavaScript-Navigation verwendet gezielt nachladen. Buttons, die beim Mouseover ausgetauscht werden. Die Mouseover-Buttons fehlen nach der Spiegelung. 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 7 8. Workshop - Internetarchivierung Beispiel zu Punkt 3 (ohne Mouseover-Bilder) 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 8 8. Workshop - Internetarchivierung Beispiel zu Punkt 3 (mit Mouseover-Bildern) 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 9 8. Workshop - Internetarchivierung 4. Session-Id‘s 3.1. Erfassung/Bewertung/Transfer Beispiel: Mögliche Lösung: Homepage des SPD-Ortsvereins Der Offline Explorer bietet die Wulfen Möglichkeit, Teile der URL beim Spiegelungsprozess zu http://www.spd-wulfen.de/ entfernen bzw. auszutauschen Schon vorhandene Dateien werden (URL Substitutes...). nicht als solche erkannt, da sie eine In diesem Falle wurde die neue Session-ID haben. Der Session-ID entfernt. Spiegelungsprozess kommt nicht zum Ende und die Dateien sind, jeweils unter einem neuen Ordner abgelegt, mehrfach vorhanden. 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 10 8. Workshop - Internetarchivierung Beispiel zu Punkt 4 (Session-Id in rot) http://www.spd-wulfen.de/.net/DGPPKGPTGPTTVVGQGCPCQC/html/1967/welcome.html 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 11 8. Workshop - Internetarchivierung Vergleich der Dateistruktur mit (links) und ohne (rechts) Session-ID 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 12 8. Workshop - Internetarchivierung 5. Ursprüngliche xml-Dateien werden nicht als html-Dateien erkannt und 3.1. Erfassung/Bewertung/Transfer „geparst“ Beispiel: Mögliche Lösung: Homepage des SPD- Der Offline Explorer bietet die Landesverbandes Sachsen-Anhalt Möglichkeit, ein komplettes „Spiegelungsprojekt“ zu http://www.spd-sachsen-anhalt.de/ exportieren. Dabei werden die Dateien Mit Ausnahme der durch das analysiert und automatisch Spiegelungsprogramm angelegten ein Tag an den Startseite (default.htm), wird beim Anfang des Quelltextes Aufruf der Dateien mit dem Browser gesetzt. Der Browser erkennt eine Fehlermeldung ausgegeben, da dann die Datei als html. den Dateien sowohl die Dateiendung .htm als auch ein Starttag fehlt. 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 13 8. Workshop - Internetarchivierung Beispiel zu Punkt 5 (Fehlermeldung bei den gespiegelten Seiten vor dem Export) 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 14 8. Workshop - Internetarchivierung Quelltext vor dem Export 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 15 8. Workshop - Internetarchivierung Webseite nach dem Export 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 16 8. Workshop - Internetarchivierung Quelltext nach dem Export 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 17 8. Workshop - Internetarchivierung 6. Dynamisch aufgebaute Webseiten werden in statische html-Seiten umgewandelt (großes Datenaufkommen, Interaktionsmöglichkeiten sind zum Teil auf den gespiegelten Webseiten nicht mehr möglich) 3.1. Erfassung/Bewertung/Transfer Beispiel: Mögliche Lösung: Homepage der hessischen Durch URL-Substitutes, Landtagsabgeordneten Ausschluss bestimmter Heike Habermann Dateinamen oder auch durch eine Verringerung der http://www.heike-habermann.de/ Linktiefe lässt sich der Umfang einer solchen Durch das Aneinanderreihen Spiegelung verringern. verschiedener Übergabeparameter im Dennoch bleibt ein hohes Dateinamen werden im Laufe der Datenaufkommen (eventuell Spiegelung sehr viele Dateien auch mit vielen angelegt, welche sich oft nur in Redundanzen) bei relativ Nuancen unterscheiden. geringem inhaltlichen Gewinn 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 18 8. Workshop - Internetarchivierung Interaktion ohne Client-Server-Dynamik: 3.1. Erfassung/Bewertung/Transfer Statische Standard-Webseiten Clientseitige Interaktivität (JavaScript, JavaApplets, skriptfähige Animationen wie Flash) Server Vorproduzierte statische Anfragen Inhalte (html-Seiten) Client 1 Client 2 Client 3 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 19 8. Workshop - Internetarchivierung Interaktion mit Client-Server-Dynamik Dynamische Webseiten 3.1. Erfassung/Bewertung/Transfer Server 1. Serverseitiges Skripting (ASP, JSP, PHP) 2. Serverseitig installierte Zusatzprogramme (plugins, cgis) Dynamische Webseiten (zum Teil Anfragen datenbankgestützt), die beim Browser des Clients als html-Seiten ankommen Client 1 Client 2 Client 3 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 20 8. Workshop - Internetarchivierung Beispiel zu Punkt 6 (zwei Dateien einer dynamischen Webseite) • www.heike-habermann.de\ redsys\pub_content.asp@content=2&menu=01000000&y=2005&c=w&w=4&id=335 • www.heike-habermann.de\ 3.1. Erfassung/Bewertung/Transfer • redsys\pub_content.asp@content=2&menu=02000000&y=2005&c=w&w=4&id=335 „ Die Edith-Stein-Schule werde “ 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 21 8. Workshop - Internetarchivierung Die Suche in den Dateien der Spiegelung www.heike-habermann.de nach einem bestimmten Artikel ergab 50 Treffer: 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 22
Related Search
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks