Laut der In­ter­na­tio­nal Te­le­com­mu­ni­ca­ti­on Union (ITU) nutzen weltweit über drei Mil­li­ar­den Menschen das World Wide Web – und das immer häufiger in ihrer eigenen Mut­ter­spra­che. Er­mög­licht wird dies durch in­ter­na­tio­na­le Domain-Namen (IDN), die seit 2003 zur Verfügung stehen. Wir zeigen dir, wie IDN-Domains funk­tio­nie­ren und was du darüber wissen musst.

Was ist ein in­ter­na­tio­na­li­sier­ter Domain-Name (IDN)?

Die IETF (Internet En­gi­nee­ring Task Force) definiert IDNs als Domain-Namen, die über das stan­dard­mä­ßi­ge la­tei­ni­sche Alphabet hin­aus­ge­hen und Son­der­zei­chen wie Umlaute oder Schrift­zei­chen anderer Alphabete enthalten. Das Problem: Das Domain Name System (DNS), das URLs in IP-Adressen übersetzt, versteht diese Zeichen ur­sprüng­lich nicht. Das DNS nutzt nämlich den be­grenz­ten Zei­chen­satz ASCII.

Damit IDNs trotzdem im Web funk­tio­nie­ren, wurde 2003 der Standard „In­ter­na­tio­na­li­zing Domain Names in Ap­pli­ca­ti­ons“ (IDNA) ein­ge­führt. Dieser sorgt für eine ein­heit­li­che Über­set­zung von Unicode in ASCII, sodass du auch Domains mit Son­der­zei­chen pro­blem­los nutzen kannst.

So funk­tio­niert IDNA

Damit in­ter­na­tio­na­li­sier­te Domains von allen Systemen im Netz ver­ar­bei­tet werden können, wird jeder IDN in einen so­ge­nann­ten ACE-String um­ge­wan­delt. Während du im Browser die URL mit Umlauten siehst, arbeitet der Server im Hin­ter­grund mit einer ASCII-kom­pa­ti­blen Version. Dieses Verfahren ist in den Standards IDNA2003 und der ak­tua­li­sier­ten Version IDNA2008 fest­ge­legt. Die Um­wand­lung passiert direkt bei dir im Web­brow­ser oder E-Mail-Programm mithilfe des Ko­die­rungs­ver­fah­rens Punycode.

Punycode

Der im RFC 3492 de­fi­nier­te Punycode übersetzt Unicode-Zei­chen­ket­ten präzise in ASCII. Dabei werden Son­der­zei­chen entfernt, kodiert und mit einem Bin­de­strich am Ende angehängt. Dieser Code speichert, um welches Zeichen es sich handelt und wo es im Namen steht. Jeder so erstellte ACE-String beginnt mit dem Präfix xn–, damit das System sofort erkennt, dass es sich um einen kodierten IDN handelt. In unserem Beitrag zu Punycode erklären wir dir das Verfahren und zeigen dir prak­ti­sche Beispiele.

Tipp

Mit einem Online-IDN-Converter kannst du deine Wunsch­do­main ganz einfach in den passenden ACE-String umwandeln.

Un­ter­schie­de zwischen IDNA2003 und IDNA2008

Früher wurde beim IDNA2003-Verfahren das Nameprep-Verfahren zur Nor­ma­li­sie­rung genutzt. Groß­buch­sta­ben wurden dabei zu Klein­buch­sta­ben, und ver­schie­de­ne Zei­chen­va­ri­an­ten wurden ver­ein­heit­licht. Seit IDNA2008 ist Nameprep kein fixer Be­stand­teil mehr. Es gibt zwar keine strikte Nor­ma­li­sie­rung mehr vor, empfiehlt aber weiterhin einen Al­go­rith­mus, um Groß­buch­sta­ben um­zu­wan­deln.

Das ist besonders für den deutsch­spra­chi­gen Raum wichtig: Das „ß“ wurde unter IDNA2003 au­to­ma­tisch zu „ss“ um­ge­wan­delt. Domains wie www.fußball-ergebnisse.de wurden also zu www.fussball-ergebnisse.de. Seit IDNA2008 wird das „ß“ korrekt als eigenes Zeichen erkannt und kann ei­gen­stän­dig als IDN-Domain re­gis­triert werden.

Al­ler­dings werden seit der Um­stel­lung auf IDNA2008 rund 8 000 Zeichen nicht mehr un­ter­stützt, die früher möglich waren. Details zu den tech­ni­schen Ab­wei­chun­gen findest du im Unicode Technical Standard #46. Hier siehst du die wich­tigs­ten Un­ter­schie­de auf einen Blick:

IDNA2003 IDNA2008
Nameprep-Verfahren ist Pflicht Keine feste Nor­ma­li­sie­rung
Basis: Unicode 3.2 Basis: Unicode ab Version 5.2
Strenge Regeln für links­läu­fi­ge Schriften Op­ti­mier­te Regeln für links­läu­fi­ge Schriften
Un­ter­schei­dung von Groß- und Klein­schrei­bung Au­to­ma­ti­sche Um­wand­lung in Klein­buch­sta­ben
Verbot vieler Symbole (z. B. Emojis oder manche Satz­zei­chen)
Kein „Remapping“ mehr zur Ver­mei­dung von Fehlern

Mögliche Hürden bei IDNs

Die meisten modernen Programme kommen bestens mit IDNs zurecht. Probleme treten oft nur auf, weil der Wechsel von IDNA2003 zu IDNA2008 im Web noch nicht überall ab­ge­schlos­sen ist. Ein Klassiker ist das „ß“: Während moderne Systeme die ß-Domain finden, landen Nutzer:innen bei ver­al­te­ten Systemen oft auf der „ss“-Variante. Unser Tipp für maximale Sor­gen­frei­heit: Re­gis­trie­re am besten beide Schreib­wei­sen und richte für die sekundäre Adresse eine einfache Domain-Wei­ter­lei­tung auf deine Haupt­sei­te ein.

Zum Hauptmenü