Publizieren im Web - Einführung

Das World Wide Web (WWW)

WWW ist ein verteilter, Hypertext-basierter Informationsdienst im Internet. Ursprünglich enwickelt im CERN in Genf um 1990, hat er eine rasante Verbreitung erfahren. Heute bieten weltweit Universitäten, Firmen, Verlage, Institutionen Informationen im World Wide Web an. In den zahlreichen Presseveröffentlichungen zum Thema Information-Highways bzw. Datenautobahnen geht es - wenn es konkret wird - um WWW, das dann oft mit dem Internet gleichgesetzt wird.

Einige Gründe für den immensen Erfolg von WWW:

Technischer Hintergrund

Client und Server beim WWW

[Veranschaulichung der Client-Server-Beziehung bei WWW]

Hypertext - Hypermedia

Hypertext
Text, der Verweise auf andere Texte enthält, die - mit einer geeigneten graphischen Benutzeroberfläche präsentiert - durch z.B. einfaches Anklicken eines hervorgehobenen Textteils angewählt werden können.
Beispiele: Microsoft-Hilfe, Apple's Hypercard.
Hypermedia
Multimediale Dokumente (Bilder, Sound, Animationen etc.) mit Verweisen auf andere.
Anker (anchor)
Verweise (links) auf andere Dokumente; bei WWW können Nicht-Text-Dokumente nur Ziel von Ankern sein.

Hypertext Transport Protocol (HTTP)

Den Protokollablauf kann man per Telnet ausprobieren.

HTTP ist im Grunde ein reines File-Server-Protokoll unabhängig von der speziellen Anwendung im WWW; insbesondere sind die Beziehungen zwischen den von einem Server bereitgestellten Dokumenten und allgemein die Anker im Protokoll nicht sichtbar.

Uniform Resource Locator (URL)

Die Adressierung von Dokumenten und die Verweise zwischen Dokumenten im WWW werden über die sogenannten Uniform Resource Locator (URL) realisiert.

Vollständige URLs bestehen aus der Angabe des

  • Protokolls, z.B. http, gopher, ftp,
  • Trennzeichen :,
  • Hostnamen des Servers, eingeleitet durch doppelte Slashs //,
  • bei Bedarf gefolgt von :Port,
  • Pfadangabe und/oder Dateiname.
  • Partiellen URLs fehlen Bestandteile von links her, die der Client von den Angaben des aktuellen Dokumentes ergänzt. Z.B. wird im Kontext von http://www.uni-duesseldorf.de/~cappel/WebKurs/Einfuehrung.html Welcome.html ergänzt zu http://www.uni-duesseldorf.de/~cappel/WebKurs/Welcome.html.

    Beispiele für URLs:

  • http://www.uni-duesseldorf.de/WWW/URZ/RZ/Sose95termine.html
  • gopher://gopher.rz.uni-duesseldorf.de/1
  • ftp://ftp.uni-duesseldorf.de/pub/doc/rfc/RFC800-899/rfc822.txt
  • telnet://opac.ub.uni-duesseldorf.de
  • news:hhu.forum
  • news:kottwitz.58.00064A34@uni-duesseldorf.de
  • mailto:cappel@rz.uni-duesseldorf.de
  • MIME-Typen von WWW-Dokumenten

    Für die Beschreibung der Typen seiner Dokumente benutzt WWW einen etablierten Internet-Standard: MIME - Multipurpose Internet Mail Extensions. MIME-Typen werden angegeben in der Form: type/subtype, so z.B. zu finden als Wert hinter dem Header-Feld Content-Type:.

    Beispiele für häufig vorkommende MIME-Typen:

    text/plain
    Einfacher ASCII-Text.
    text/html
    Das WWW-eigene Format.
    image/gif, image/jpeg, image/pict
    Bilder im GIF-, JPEG- bzw. PICT-Format.
    video/mpeg, video/quicktime
    Video-Sequenzen im MPEG- bzw. Quicktime-Format.
    audio/basic, audio/x-wav, audio/aiff, audio/x-mpeg
    Diverse Audio-Formate für Sound-Dateien unterschiedlicher Qualität (Telefon- bis CD-Qualität).
    application/postscript
    Postscript-Dateien.
    application/x-rtf
    Rich Text Format von Word und anderen Textverarbeitungsprogrammen.
    application/x-dvi
    DVI-Files von TeX.

    Hypertext Markup Language (HTML)

    Die Hypertext Markup Language (HTML) ist die WWW-eigene Dokumentensprache, definiert als spezielle Ausprägung der Structured Generalized Markup Language (SGML). HTML enthält Sprachmittel zur logischen Strukturierung von Dokumenten ähnlich wie LaTeX und Sprachmittel für die Angabe von Ankern, den Hyperlinks auf andere Dokumente, sowie für die Einbettung von Bildern (Inline-Images).

    HTML gibt eine logische Strukturierung von Dokumenten vor; die Umsetzung in ein konkretes Layout ist Sache der WWW-Browser und kann mit unterschiedlicher Software und in unterschiedlicher Umgebung gänzlich anders aussehen.

    (Näheres folgt später.)

    HTTP-Server-Software

    CERN-httpd
    Mächtiger Server mit u.a. vielfachen Abbildungsregeln von Pfaden in URLs auf reale Dateinamen, individuellem Zugriffsschutz auf Dokumente, Skript-Fähigkeit über das Common Gateway Inerface (CGI); verfügbar als Source-Code für diverse Unix-Systeme und VMS. Spezielle Eigenschaft: Kann als Proxy- und Caching-Server eingesetzt werden wie bei uns.
    NCSA-httpd
    Mächtiger Server mit u.a. vielfachen Abbildungsregeln von Pfaden in URLs auf reale Dateinamen, individuellem Zugriffsschutz auf Dokumente, Skript-Fähigkeit über das Common Gateway Inerface (CGI); verfügbar als Source-Code für diverse Unix-Systeme.
    Information über weitere Server-Software finden Sie im Original-Dokument.

    WWW-Client-Software

    Vollständige Übersicht siehe hier.

    Die goldene Regel, die ich gelernt habe, für alle, die Dokumente für WWW (in HTML) erstellen: Sehen Sie sich Ihre Dokumente nicht nur mit einem Browser an! Optimieren Sie sie nicht z.B. für z.B. Netscape, u.U. noch mit einer bestimmten Fenster- und Font-Größe! Testen Sie mit so vielen verschiedenen Browsern, wie Ihnen zur Vefügung stehen, und auch mit mindestens einem Linemode-Browser wie Lynx!

    (Dies ist der Grund, warum dieser Abschnitt hierhin gehört.)


    Bernd Cappel, 24.4.1995
    Erstellt für eine Lehrveranstaltung des URZ der HHU im Sommersemester 1995