Ein Data-URL ist ein URI-Schema, das es ermöglicht, Daten in (HTML-)Quelltext so einzubetten, als wären es externe Ressourcen. Damit können die Daten, beispielsweise für eine Grafik, innerhalb eines HTML-Dokuments direkt im HTML-Quelltext untergebracht werden, statt sie, wie sonst üblich, aus einer Datei anzufordern.
Obwohl die IETF die Data-URL-Spezifikation 1998 veröffentlichte,[2] wurde diese niemals formell zum Standard erhoben.[3] Die Spezifikation von HTML 4.01 (Dezember 1999) verweist jedoch auf die Definition des Data-URL,[4] und die meisten aktuellen Webbrowser unterstützen Data-URLs.
MicrosoftInternet Explorer bis einschließlich Version 7 unterstützt Data-URLs nicht. Internet Explorer 8 begrenzt die Unterstützung aus Sicherheitsgründen auf nicht navigierbaren Inhalt, wie in <img>-Tags und CSS-Regeln, damit in Data-URLs eingebettetes JavaScript nicht trotz Scriptfilter, wie sie bei Webmail-Clients verwendet werden, ausführbar ist.[5] Data-URLs müssen kleiner als 32 Kilobytes sein. Die Einschränkung wurde im IE9 aufgehoben.[6]
Die Kodierung wird durch ;base64 gekennzeichnet. Wenn vorhanden, bedeutet das, dass die nachfolgenden Daten Base64-kodiert sind. Anderenfalls, bei Fehlen des base64-Parameters, werden die Daten durch URL-Encoding kodiert. Wenn die Angabe des MIME-Typs fehlt, wird als MIME-Typ text/plain;charset=US-ASCII angenommen. Bei abweichendem Zeichensatz kann als Abkürzung der MIME-Typ bei Plain text weggelassen, aber der Zeichensatz-Parameter benutzt werden.
Vorteile
Eingebettete Daten benötigen keinen HTTP-Request und sparen Traffic und Bandbreite, wenn der Overhead der Kodierung kleiner ist als der HTTP-Overhead. Beispielsweise ist ein 600 Byte großes Bild Base64-kodiert 800 Bytes groß (wenn es unkomprimiert übertragen wird; HTML und CSS werden zumeist komprimiert übertragen). Wenn nun der HTTP-Overhead mehr als 200 Bytes beträgt, ist die Data-URL effizienter.
Für das Transportieren von vielen kleinen Dateien kann die Data-URL im Transport schneller sein. TCP-Verbindungen tendieren zu langsamem Start. Wenn jede Datei eine neue TCP-Verbindung benötigt, ist die Transportgeschwindigkeit mehr durch die Laufzeit begrenzt als durch die verfügbare Bandbreite. Das Benutzen von HTTP-Keepalive verbessert die Situation, beseitigt aber den Engpass nicht völlig.
Wenn die Webseite über HTTPS aufgerufen wird, erwarten die meisten Webbrowser, dass alle Elemente dieser Webseite ebenfalls über eine sichere Verbindung nachgeladen werden, ansonsten wird der Benutzer benachrichtigt, dass durch die Mischung von sicheren und unsicheren Elementen die Sicherheit reduziert ist. HTTPS hat einen signifikant höheren Overhead als normales HTTP, somit erhöht die Einbettung von Webseitenelementen in Data-URLs die Geschwindigkeit in diesem Fall und verhindert, dass Sicherheitswarnungen ausgegeben werden.
Webbrowser sind gewöhnlich so konfiguriert, dass nur eine bestimmte Maximalanzahl an HTTP-Verbindungen zum gleichen Webserver aufgebaut werden,[7] somit sparen eingebettete Daten zu Gunsten anderer Inhalte HTTP-Verbindungen ein.
Umgebungen mit eingeschränktem oder gesperrten Zugang zu externen Ressourcen können Inhalte einbetten, wenn es nicht erlaubt oder unpraktisch ist, diese extern zu referenzieren. Zum Beispiel könnte ein erweitertes HTML-Editorfeld ein eingefügtes Bild akzeptieren und es zu einer Data-URL umwandeln, um die Komplexität der externen Referenzierung vor dem Benutzer zu verstecken.
Eine Multimediaseite kann als eine einzige Datei verwaltet werden.
Obwohl es selten passiert, kann es vorkommen, dass die Integrität der Dateien verletzt wird, wenn sie hochgeladen werden. Das kann Data-URLs nur passieren, wenn die Integrität der gesamten Seite verletzt ist.
Nachteile
Data-URLs können nicht separat von den sie enthaltenden Dokumenten (beispielsweise HTML- oder CSS-Dateien) gecacht werden, somit werden die Daten erneut heruntergeladen, wenn (je nach Einbettungsort) entweder das Dokument neu geladen wird oder sich die CSS-Datei an anderer Stelle geändert hat.
Die Data-URL muss erneut kodiert und eingebettet werden, wenn eine Änderung durchgeführt wurde.
Base64-kodierte Daten sind um ein Drittel größer als ihr binäres Äquivalent. Dieser Nachteil relativiert sich, wenn der Server die Antwort mit Hilfe des Content-Encoding-HTTP-Headers komprimiert.
Webbrowser auf mobilen Geräten (z. B. Smartphones) haben in der Regel eine Funktion, mit der das Laden von Bildern deaktiviert werden kann, um Datenvolumen zu sparen. Das direkte Einbetten in das Dokument verhindert die Nutzung einer solchen Funktion.
Beispiele
HTML
Der rote Punkt aus dem Beispiel links
Ein HTML-Fragment, welches das Bild eines kleinen roten Punktes einbindet:
Wie oben gezeigt, kann die Data-URL Whitespace zur besseren Lesbarkeit enthalten. Der geneigte Leser kann den zwischen den Gänsefüßchen stehenden Text ausschneiden und in die Adresszeile eines unterstützenden Browsers eingeben.
CSS
Eine CSS-Regel, welche ein Hintergrundbild einbindet:
Dieses Beispiel funktioniert nicht im Internet Explorer 8. Seine Sicherheitseinstellungen verbieten navigierbare Dateitypen in Data-URLs.[5]
Einfügen in HTML oder CSS mit PHP
Weil Base64-kodierte Data-URLs nicht menschenlesbar sind, könnte ein Webseitenersteller kodierte Daten vorzugsweise mit einer Skriptsprache wie PHP einfügen. Das hat den Vorteil, dass bei einer Änderung der eingebundenen Datei der HTML-Quelltext nicht geändert werden muss sowie binäre Daten vom Text getrennt werden. Der Nachteil ist eine höhere Belastung der Server-CPU, wenn kein serverseitiger Cache benutzt wird.
alles2DataURL ist ein kostenloses Online-Werkzeug für die Umwandlung beliebiger Dateiformate (bis zu einer Maximalgröße von ca. 3 MB) in eine Data-URL.[8]
DataURL2Text ist ein kostenloses Online-Werkzeug für die Rückumwandlung einer beliebigen Data-URL in die Originaldaten.[9]
Clipboard Observer ist ein kostenloses Java-Werkzeug für einfaches Konvertieren von PNG-Dateien zu einer Data-URL.[10]
Siehe auch
Ein alternatives Verfahren für das Einbetten von Ressourcen ist MHTML, meist benutzt in HTML-E-Mails.