Webseitenaufruf – was passiert im Hintergrund?
Tagtäglich rufen Sie in Ihrem Webbrowser informative oder unterhaltende Internetangebote auf, verschaffen sich einen Überblick über Produkte und Dienstleistungen oder nutzen Social-Media-Plattformen, um mit Freunden und Bekannten in Kontakt zu treten. Der Aufruf einer Webseite mag für Sie lediglich aus der Eingabe der Internetadresse in die Adressleiste bestehen, doch der eigentliche Prozess des Webseitenaufrufs wird dadurch erst in Gang gesetzt. Unbemerkt und in Sekundenbruchteilen tritt Ihr Browser mit weltweit verstreuten Webservern in Kontakt, fragt dort hinterlegte Datenpakete ab und setzt aus diesen die Webseite auf Ihrem Bildschirm zusammen. Wie das funktioniert und welche Stationen dabei durchlaufen werden, erfahren Sie im Folgenden.
Von der URL zur IP-Adresse
Die einfachste Möglichkeit, eine Webseite aufzurufen, ist die Eingabe einer entsprechenden Internetadresse in die Adresszeile des Browsers. Man spricht hier von einem Ressourcenanzeiger (Uniform Resource Locator, kurz: URL). Jede Webseite im World Wide Web ist über eine eindeutige URL (Internetadresse) erreichbar. Diese besteht aus mehreren Teilabschnitten, die jeweils eigene Funktionen aufweisen. Webseiten-URLs entsprechen in der Regel folgendem Schema:
Protokoll | Dienst | Second-Level-Domain | Top-Level-Domain | (Pfad) | (Datei) |
---|---|---|---|---|---|
http:// | www. | beispieldomain | .de | /verzeichnis | /index.html |
Das Hypertext-Übertragungsprotokoll HTTP wird im World Wide Web (WWW), einem System aus elektronisch gespeicherten Hypertext-Dokumenten, eingesetzt, um Webseitendaten vom Webserver zum Browser zu übertragen. Neben HTTP existiert auch eine verschlüsselte Übertragungsvariante via HTTPS ( Hypertext Transfer Protocol Secure). Auf das Übertragungsprotokoll und die Angabe des gewünschten Internetdienstes folgt im Standardaufbau einer Webseiten-URL der Hostname (die eindeutige Bezeichnung eines Rechners im Netz), bestehend aus Top-Level-Domain und Second-Level-Domain. Der Second-Level-Domain kann zudem eine Third-Level-Domain (Subdomain) untergeordnet sein. Soll mit der URL ein bestimmtes Verzeichnis oder eine Datei auf einer Webpräsenz angesteuert werden, folgen nach dem Hostnamen die entsprechenden Angaben.
Die buchstabenbasierte Darstellungsform einer URL ist meist so gewählt, dass Menschen sie sich gut einprägen können. Computer hingegen arbeiten mit Zahlenkombination, sogenannten IP-Adressen, um Ressourcen im Internet zuzuordnen. Damit Webseiteninhalte von einem bestimmten Webbrowser abgerufen werden können, ist daher ein zusätzlicher Schritt erforderlich, bei dem die URL einer Webseite in die entsprechende IP-Adresse übersetzt wird. Diese Aufgabe übernehmen sogenannte DNS-Server, die für die Verwaltung des Domain-Name-Systems zuständig sind.
DNS-Server: Ein Telefonbuch für IP-Adressen
Wird eine Internetadresse in die Suchmaske des Webbrowsers eingegeben, leitet dieser die URL an einen Router weiter. Der Router hat nun die Aufgabe, die entsprechende IP-Adresse für die gewünschte Webseite ausfindig zu machen. Die notwendige Auskunft erteilt ein DNS-Server. Dabei handelt es sich um einen speziellen Webserver, der mit der Namensauflösung betraut ist. Welcher DNS-Server angesteuert wird, kann sowohl im Betriebssystem als auch im Router konfiguriert werden. Die Standardeinstellung sieht hier den DNS-Server des jeweiligen Internetanbieters vor. Da die Abfrage im Domain-Name-System Zeit in Anspruch nimmt, werden die IP-Adressen bereits besuchter Seiten in der Regel im DNS-Cache des Betriebssystems abgelegt. Dieser Zwischenspeicher hält die IP-Adresse für spätere Besuche der entsprechenden Webseite vor. Dies entlastet den DNS-Server und beschleunigt den Webseitenaufruf.
Der Router als Bindeglied zwischen Rechner und Server
Die Schnittstelle zwischen Internet und Heimnetzwerk ist der Router. Dieser fordert Daten aus dem Internet an und verteilt diese auf Netzwerkgeräte wie Desktoprechner, Laptops oder Tablets. Der Router wird als Bindeglied benötigt, da Endgeräte im Heimnetzwerk untereinander mit lokalen IP-Adressen kommunizieren, sich nach außen hin jedoch die öffentliche IP-Adresse des Routers teilen. Die Übersetzung der Netzwerkadressen erfolgt mit einem Verfahren, das Network-Adress-Translation (NAT) genannt wird. Bei modernen IPv6-Internetanschlüssen erübrigt sich eine Übersetzung via NAT in der Regel, da jedes Gerät im Netzwerk eine öffentliche IP-Adresse zugewiesen bekommt.
Datenaustausch via HTTP
Hat der Router die IP-Adresse der gewünschten Webseite ermittelt, fragt er die benötigten Daten für den Seitenaufbau beim entsprechenden Webserver an. Diese Anfrage erfolgt via HTTP in Form eines Datenpakets, das alle Informationen beinhaltet, die der Webserver benötigt, um die Webseitendaten auszuliefern. Neben der IP-Adresse der gewünschten Webseite teilt der Router seine eigene IP-Adresse als Absender mit und gibt Auskunft über das Betriebssystem, den Browser sowie die Art des Geräts, auf dem die Webseite angezeigt werden soll. Der Webserver wertet die entsprechenden Informationen aus und übermittelt einen HTTP-Status-Code. Ist die Anfrage erfolgreich, versendet der Server seinerseits ein Datenpaket mit allen für den Seitenaufbau nötigen Informationen an den Webbrowser. Sollte der Server die Webseite unter der angefragten Adresse nicht finden, übermittelt er entweder den Fehler-Code 404 oder leitet per Redirect auf die neue URL um, sofern diese bekannt ist.
- Verschlüsselt Webseiten-Kommunikation
- Verhindert Sicherheits-Warnungen
- Verbessert Google-Platzierung
Seitenaufbau im Webbrowser
Eingehende Datenpakete aus dem Internet werden vom Router schließlich an den Rechner weitergeleitet, über den der Webseitenaufruf gestartet wurde. Dann übernimmt der Webbrowser die Aufgabe, die Datenpakete zu analysieren. In der Regel bestehen Webseiten aus HTML-, CSS- und JavaScript-Dateien, deren Codezeilen detaillierte Informationen beinhalten, wie der Browser die Webseite darstellen soll. Während HTML-Dokumente die Struktur- und Bedienelemente einer Webseite definieren, lassen sich in Cascading Style Sheets (CSS-Dateien) Gestaltungsanweisungen festlegen. Elemente, die der Benutzerinteraktion mit der Webseite dienen, werden in der Regel mit JavaScript umgesetzt. Wie die vordefinierten Codezeilen interpretiert werden, hängt dabei von der Rendering-Engine des Webbrowsers ab. Ein und dieselbe Webseite kann in verschiedenen Webbrowsern daher deutliche Unterschiede zeigen. Auch der Webbrowser verfügt über einen Cache, in dem Daten beim Seitenaufruf temporär zwischengespeichert werden. Bei einem erneuten Aufruf einer bereits besuchten Webseite müssen somit nicht alle Daten vom Webserver angefordert werden. Der Webbrowser lädt nur die Dateien nach, die sich seit dem letzten Besuch geändert haben. So lässt sich der Seitenaufruf deutlich beschleunigen.