Konverter
Text ↔ Unicode
Der Text-Unicode-Konverter wandelt beliebigen Text in Unicode-Codepunkte um und konvertiert Codepunkte zurück in lesbaren Text. Das Tool unterstützt verschiedene Ausgabeformate: U+XXXX-Notation, JavaScript-Escapes (\uXXXX), HTML-Entities (&#xXXXX;) und CSS-Escapes (\XXXX). Die Konvertierung erfolgt bidirektional und in Echtzeit.
Was ist Unicode?
Unicode ist ein internationaler Zeichenkodierungsstandard, der jedem Zeichen – unabhängig von Sprache, Schrift oder Plattform – einen eindeutigen numerischen Code zuordnet, den sogenannten Codepunkt. Der aktuelle Unicode-Standard umfasst über 140.000 Zeichen aus nahezu allen Schriftsystemen der Welt, darunter Lateinisch, Arabisch, Chinesisch, Japanisch, aber auch Emojis und historische Schriften. Unicode-Codepunkte werden üblicherweise in hexadezimaler Notation mit dem Präfix U+ angegeben, z. B. U+0041 für den Buchstaben 'A'. UTF-8 ist die weitverbreitetste Kodierung, die Unicode-Zeichen als 1 bis 4 Bytes speichert.
Wie funktioniert das Tool?
Gib Text in das Eingabefeld ein, und das Tool gibt sofort die Unicode-Codepunkte jedes Zeichens aus. Du kannst zwischen verschiedenen Ausgabeformaten wählen: der Standard-U+-Notation, JavaScript-Escapesequenzen (\uXXXX oder \u{XXXXX} für Zeichen außerhalb der Basic Multilingual Plane), HTML-Entities (&#xXXXX;) und CSS-Escapes. Für die Rückkonvertierung gibst du Codepunkte im gewählten Format ein, und das Tool dekodiert sie zum entsprechenden Text.
Typische Anwendungsfälle
- Ermittlung des Unicode-Codepunkts eines unbekannten Zeichens oder Emojis
- Erstellung von JavaScript-Escape-Sequenzen für Sonderzeichen in Quellcode
- Generierung von HTML-Entities für Sonderzeichen in HTML-Dokumenten
- Debugging von Encoding-Problemen in Webanwendungen und Datenbanken
Schritt-für-Schritt-Anleitung
- Schritt 1: Gib den Text oder das Zeichen in das linke Eingabefeld ein.
- Schritt 2: Wähle das gewünschte Ausgabeformat (U+, JavaScript, HTML-Entity, CSS).
- Schritt 3: Die Codepunkte werden sofort im rechten Feld angezeigt.
- Schritt 4: Kopiere das Ergebnis per Klick in die Zwischenablage oder konvertiere Codepunkte zurück in Text.
Beispiel
Eingabe
Hä?
Ausgabe
U+0048 U+00E4 U+003F
Tipps & Hinweise
- Emojis und viele asiatische Schriftzeichen liegen außerhalb der Basic Multilingual Plane (BMP) und benötigen in JavaScript die Syntax \u{XXXXX} statt \uXXXX.
- Mit HTML-Entities lassen sich Sonderzeichen sicher in HTML-Quellcode einbetten, ohne Encoding-Probleme zu riskieren.
- Das Zeichen U+FEFF ist das Byte Order Mark (BOM) und kann am Anfang von Textdateien unsichtbar vorhanden sein – ein häufiger Fehler beim Einlesen von Dateien.
Häufige Fragen
Was ist der Unterschied zwischen Unicode und UTF-8?
Unicode ist der Standard, der jedem Zeichen einen eindeutigen Codepunkt zuweist. UTF-8 ist eine Kodierung, die beschreibt, wie diese Codepunkte als Bytes gespeichert werden. UTF-8 ist rückwärtskompatibel mit ASCII und kodiert die ersten 128 Zeichen mit nur einem Byte.
Warum haben manche Zeichen mehrere Bytes in UTF-8?
UTF-8 ist eine variable Kodierung. Zeichen mit kleinen Codepunkten (0–127) benötigen 1 Byte, Zeichen bis U+07FF benötigen 2 Bytes, bis U+FFFF 3 Bytes und alles darüber 4 Bytes. Das erlaubt eine effiziente Speicherung bei gleichzeitiger voller Unicode-Unterstützung.
Kann das Tool auch Emojis konvertieren?
Ja. Emojis haben Unicode-Codepunkte wie normale Zeichen, liegen aber meistens im Bereich U+1F300 bis U+1FAFF. Das Tool gibt ihre Codepunkte korrekt aus und kann sie auch rückkonvertieren.
Text ↔ Unicode
Konvertiere Text in Unicode-Codepunkte und zurück. Unterstützt U+XXXX, JavaScript-Escapes, HTML-Entities und mehr.
Tool öffnen