Logfiles - Informationen vom Baumstamm
Serversoftware ist normalerweise einfach ein Programm, das im Hintergrund auf einem Rechner läuft. Dadurch wird dieser Rechner zu einem "Server" - ein Rechner, der nach außen hin "Services" (Dienste) anbietet. Um die Arbeit der Serversoftware kontrollieren und auswerten zu können, schreibt diese in eine Datei brav mit, was sie gemacht und was sie an Fehlern bemerkt hat. Auf die Logfiles haben normalerweise nur die technischen Betreuer (Administratoren) eines Servers Zugriff, bei "gemieteten" Servern auch der Kunde. Als einfacher Benutzer eines Onlinedienstes wie T-Online oder AOL hat man normalerweise keinen Zugriff auf die Logfiles des Webservers, ebenso kann man als "anonymer Surfer" nicht einfach fremde Logfiles einsehen, da diese mit Passwort und Benutzernamen in einem geheimen Verzeichnis auf dem Server außer Reichweite liegen. Was in einem Logfile steht, ist eine Sache des jeweiligen Servers. Hier gibt es als Beispiel einfach eine einzelne Zeile aus dem Logfile eines Webservers:
IP-Adresse192.168.1.52
Die IP-Adresse ist die technische Adresse des Rechners, der diese Information ausgelöst hat. Im einfachsten Fall ist dies der Rechner, an dem der Browser dieses Seite oder diese Datei haben wollte. Fragt man einen Nameserver (DNS) nach dieser Zahlenkombination, so kann dieser einem darauf einen "Hostnamen" wie z.B. powerbook.ista.infra.de heraussuchen und man weiss, daß die Anfrage aus dem Netzwerk "ista.infra.de" bzw. "infra.de" kam. Benutzername- Der "authentifizierte Benutzername" steht da, wenn man sich als Benutzer mit Passwort anmelden muß. In den meisten Fällen ist dieses Feld leer. Üblicherweise wird die Benutzerauthentifizierung genutzt, um einen Serverbereich nur bestimmten Personen zugänglich zu machen. In so einem Fall steht dann an dieser Stelle der Benutzername, der zur Anmeldung am Server nötig ist. Uhrzeit[25/Jan/1999:17:12:08 +0100] Die Uhrzeit ist als "Greenwich Mean Time" angegeben, die Angabe "+0100" muß man noch dazuaddieren, um auf die lokale Uhrzeit zu kommen. Browser-Befehl"GET /grafix/logo.gif HTTP/1.0" Der vollständige Browser-Befehl ist wichtig, um Fehler nachvollziehen zu können. "GET" bezeichnet hierbei das Anfordern einer Datei, "HEAD" das Anfordern von Informationen wie z.B. Änderungsdatum der Datei. Am Ende steht noch, nach welcher Version des HyperTextTransportProtocol der Befehl formuliert wurde. Mit der Information des Browserbefehls kann man auch herausfinden, welche Datei auf dem Webserver wie oft abgerufen wurde - man muß nur zählen, wie oft sie angefordert wurde. Ergebnismeldung des Webservers200 Einfach das Ergebnis des Befehls:
Einige der Codes sind recht bekannt, weil auch einfache Benutzer auf sie stossen können - 200 für "alles ok" oder 404 für "nicht gefunden". Eine vollständige Auflistung findet sich im RFC 1945. Traffic des Objekts2820 Hier steht einfach, wie viele Byte an Information übertragen wurden. Da Provider unter sich mit "Traffic" (Datenmenge pro Woche oder Monat) abrechnen, kann man anhand dieser Angabe herausfinden, ob ein bestimmter Teil eines Webangebotes besonders "kostenintensiv" ist. Referenz"http://www.sysiphus.de/intro.html" Hier steht, von welcher Seite aus die Anfrage gestellt wurde. Bei HTML-Seiten ist das üblicherweise die Seite, die darauf einen Verweis hinterlegt hat, bei Grafiken oder anderen Elementen die Seite, von der aus das angeforderte Objekt angefordert wurde. Das klingt recht harmlos, ist aber die Basis vieler Statistiksoftware und noch mehr überzogener Marketingaussagen und Befürchtungen halbinformierter Benutzer.
Der Referenz-Eintrag ist eine Angabe, die der Webbrowser liefert, der Benutzer kann sie bei den üblichen Browsern nicht verhindern. Ein Gegenbeispiel ist der Browser iCab für den Macintosh - da kann die Referer-Angabe ausgeschaltet werden, ebenso kann bei der Browserkennung zwischen mehreren Varianten gewählt werden, um gegenüber dem Webserver als "bekannter" Browser zu erscheinen. Browser-Kennung"Mozilla/4.07 (Macintosh; I; PPC, Nav)"
Der Webbrowser identifiziert sich gegenüber dem Server mit einer "Client-Kennung", damit z.B. der Serveradministrator herausfinden kann, ob es nur mit bestimmten Webbrowsern ein bestimmtes Problem gibt.
Diese Client-Kennung kann ein Produktname sein, eine Version beinhalten oder einfach sonst etwas, anhand dessen man den Browser identifizieren kann. Im Beispiel meldet sich ein Browser namens "Mozilla". Mozilla ist der Spitzname der Entwickler für den Netscape Navigator/Communicatior und bezeichnet einen feuerspeienden Drachen einer alten Geschichte (letzterer Link funktioniert nur im Netscape Navigator und dient gleichzeitig als abschreckendes Beispiel für schlecht geschriebenes HTML). |
||||||||||||||||||||||||||||||
|