IDN-Domains: So funktionieren Sonderzeichen in deiner Webadresse
Laut der International Telecommunication Union (ITU) nutzen weltweit über drei Milliarden Menschen das World Wide Web – und das immer häufiger in ihrer eigenen Muttersprache. Ermöglicht wird dies durch internationale Domain-Namen (IDN), die seit 2003 zur Verfügung stehen. Wir zeigen dir, wie IDN-Domains funktionieren und was du darüber wissen musst.
Was ist ein internationalisierter Domain-Name (IDN)?
Die IETF (Internet Engineering Task Force) definiert IDNs als Domain-Namen, die über das standardmäßige lateinische Alphabet hinausgehen und Sonderzeichen wie Umlaute oder Schriftzeichen anderer Alphabete enthalten. Das Problem: Das Domain Name System (DNS), das URLs in IP-Adressen übersetzt, versteht diese Zeichen ursprünglich nicht. Das DNS nutzt nämlich den begrenzten Zeichensatz ASCII.
Damit IDNs trotzdem im Web funktionieren, wurde 2003 der Standard „Internationalizing Domain Names in Applications“ (IDNA) eingeführt. Dieser sorgt für eine einheitliche Übersetzung von Unicode in ASCII, sodass du auch Domains mit Sonderzeichen problemlos nutzen kannst.
So funktioniert IDNA
Damit internationalisierte Domains von allen Systemen im Netz verarbeitet werden können, wird jeder IDN in einen sogenannten ACE-String umgewandelt. Während du im Browser die URL mit Umlauten siehst, arbeitet der Server im Hintergrund mit einer ASCII-kompatiblen Version. Dieses Verfahren ist in den Standards IDNA2003 und der aktualisierten Version IDNA2008 festgelegt. Die Umwandlung passiert direkt bei dir im Webbrowser oder E-Mail-Programm mithilfe des Kodierungsverfahrens Punycode.
Punycode
Der im RFC 3492 definierte Punycode übersetzt Unicode-Zeichenketten präzise in ASCII. Dabei werden Sonderzeichen entfernt, kodiert und mit einem Bindestrich am Ende angehängt. Dieser Code speichert, um welches Zeichen es sich handelt und wo es im Namen steht. Jeder so erstellte ACE-String beginnt mit dem Präfix xn–, damit das System sofort erkennt, dass es sich um einen kodierten IDN handelt. In unserem Beitrag zu Punycode erklären wir dir das Verfahren und zeigen dir praktische Beispiele.
Mit einem Online-IDN-Converter kannst du deine Wunschdomain ganz einfach in den passenden ACE-String umwandeln.
Unterschiede zwischen IDNA2003 und IDNA2008
Früher wurde beim IDNA2003-Verfahren das Nameprep-Verfahren zur Normalisierung genutzt. Großbuchstaben wurden dabei zu Kleinbuchstaben, und verschiedene Zeichenvarianten wurden vereinheitlicht. Seit IDNA2008 ist Nameprep kein fixer Bestandteil mehr. Es gibt zwar keine strikte Normalisierung mehr vor, empfiehlt aber weiterhin einen Algorithmus, um Großbuchstaben umzuwandeln.
Das ist besonders für den deutschsprachigen Raum wichtig: Das „ß“ wurde unter IDNA2003 automatisch zu „ss“ umgewandelt. Domains wie www.fußball-ergebnisse.de wurden also zu www.fussball-ergebnisse.de. Seit IDNA2008 wird das „ß“ korrekt als eigenes Zeichen erkannt und kann eigenständig als IDN-Domain registriert werden.
Allerdings werden seit der Umstellung auf IDNA2008 rund 8 000 Zeichen nicht mehr unterstützt, die früher möglich waren. Details zu den technischen Abweichungen findest du im Unicode Technical Standard #46. Hier siehst du die wichtigsten Unterschiede auf einen Blick:
| IDNA2003 | IDNA2008 |
|---|---|
| Nameprep-Verfahren ist Pflicht | Keine feste Normalisierung |
| Basis: Unicode 3.2 | Basis: Unicode ab Version 5.2 |
| Strenge Regeln für linksläufige Schriften | Optimierte Regeln für linksläufige Schriften |
| Unterscheidung von Groß- und Kleinschreibung | Automatische Umwandlung in Kleinbuchstaben |
| Verbot vieler Symbole (z. B. Emojis oder manche Satzzeichen) | |
| Kein „Remapping“ mehr zur Vermeidung von Fehlern |
Mögliche Hürden bei IDNs
Die meisten modernen Programme kommen bestens mit IDNs zurecht. Probleme treten oft nur auf, weil der Wechsel von IDNA2003 zu IDNA2008 im Web noch nicht überall abgeschlossen ist. Ein Klassiker ist das „ß“: Während moderne Systeme die ß-Domain finden, landen Nutzer:innen bei veralteten Systemen oft auf der „ss“-Variante. Unser Tipp für maximale Sorgenfreiheit: Registriere am besten beide Schreibweisen und richte für die sekundäre Adresse eine einfache Domain-Weiterleitung auf deine Hauptseite ein.