Home/ Glossar/ Text ↔ Unicode
Konverter

Text ↔ Unicode

Der Text-Unicode-Konverter wandelt beliebigen Text in Unicode-Codepunkte um und konvertiert Codepunkte zurück in lesbaren Text. Das Tool unterstützt verschiedene Ausgabeformate: U+XXXX-Notation, JavaScript-Escapes (\uXXXX), HTML-Entities (&#xXXXX;) und CSS-Escapes (\XXXX). Die Konvertierung erfolgt bidirektional und in Echtzeit.

Was ist Unicode?

Unicode ist ein internationaler Zeichenkodierungsstandard, der jedem Zeichen – unabhängig von Sprache, Schrift oder Plattform – einen eindeutigen numerischen Code zuordnet, den sogenannten Codepunkt. Der aktuelle Unicode-Standard umfasst über 140.000 Zeichen aus nahezu allen Schriftsystemen der Welt, darunter Lateinisch, Arabisch, Chinesisch, Japanisch, aber auch Emojis und historische Schriften. Unicode-Codepunkte werden üblicherweise in hexadezimaler Notation mit dem Präfix U+ angegeben, z. B. U+0041 für den Buchstaben 'A'. UTF-8 ist die weitverbreitetste Kodierung, die Unicode-Zeichen als 1 bis 4 Bytes speichert.

Wie funktioniert das Tool?

Gib Text in das Eingabefeld ein, und das Tool gibt sofort die Unicode-Codepunkte jedes Zeichens aus. Du kannst zwischen verschiedenen Ausgabeformaten wählen: der Standard-U+-Notation, JavaScript-Escapesequenzen (\uXXXX oder \u{XXXXX} für Zeichen außerhalb der Basic Multilingual Plane), HTML-Entities (&#xXXXX;) und CSS-Escapes. Für die Rückkonvertierung gibst du Codepunkte im gewählten Format ein, und das Tool dekodiert sie zum entsprechenden Text.

Typische Anwendungsfälle

  • Ermittlung des Unicode-Codepunkts eines unbekannten Zeichens oder Emojis
  • Erstellung von JavaScript-Escape-Sequenzen für Sonderzeichen in Quellcode
  • Generierung von HTML-Entities für Sonderzeichen in HTML-Dokumenten
  • Debugging von Encoding-Problemen in Webanwendungen und Datenbanken

Schritt-für-Schritt-Anleitung

  1. Schritt 1: Gib den Text oder das Zeichen in das linke Eingabefeld ein.
  2. Schritt 2: Wähle das gewünschte Ausgabeformat (U+, JavaScript, HTML-Entity, CSS).
  3. Schritt 3: Die Codepunkte werden sofort im rechten Feld angezeigt.
  4. Schritt 4: Kopiere das Ergebnis per Klick in die Zwischenablage oder konvertiere Codepunkte zurück in Text.

Beispiel

Eingabe
Hä?
Ausgabe
U+0048 U+00E4 U+003F

Tipps & Hinweise

  • Emojis und viele asiatische Schriftzeichen liegen außerhalb der Basic Multilingual Plane (BMP) und benötigen in JavaScript die Syntax \u{XXXXX} statt \uXXXX.
  • Mit HTML-Entities lassen sich Sonderzeichen sicher in HTML-Quellcode einbetten, ohne Encoding-Probleme zu riskieren.
  • Das Zeichen U+FEFF ist das Byte Order Mark (BOM) und kann am Anfang von Textdateien unsichtbar vorhanden sein – ein häufiger Fehler beim Einlesen von Dateien.

Häufige Fragen

Was ist der Unterschied zwischen Unicode und UTF-8?
Unicode ist der Standard, der jedem Zeichen einen eindeutigen Codepunkt zuweist. UTF-8 ist eine Kodierung, die beschreibt, wie diese Codepunkte als Bytes gespeichert werden. UTF-8 ist rückwärtskompatibel mit ASCII und kodiert die ersten 128 Zeichen mit nur einem Byte.
Warum haben manche Zeichen mehrere Bytes in UTF-8?
UTF-8 ist eine variable Kodierung. Zeichen mit kleinen Codepunkten (0–127) benötigen 1 Byte, Zeichen bis U+07FF benötigen 2 Bytes, bis U+FFFF 3 Bytes und alles darüber 4 Bytes. Das erlaubt eine effiziente Speicherung bei gleichzeitiger voller Unicode-Unterstützung.
Kann das Tool auch Emojis konvertieren?
Ja. Emojis haben Unicode-Codepunkte wie normale Zeichen, liegen aber meistens im Bereich U+1F300 bis U+1FAFF. Das Tool gibt ihre Codepunkte korrekt aus und kann sie auch rückkonvertieren.
Text ↔ Unicode
Konvertiere Text in Unicode-Codepunkte und zurück. Unterstützt U+XXXX, JavaScript-Escapes, HTML-Entities und mehr.
Tool öffnen