Home/ Glossar/ URL-Parser
Analyse

URL-Parser

Der URL-Parser zerlegt eine beliebige URL nach RFC 3986 in alle ihre Bestandteile: Schema (Protokoll), Benutzerinformation, Host (Domain oder IP), Port, Pfad, Query-String mit einzelnen Parametern und Fragment. Zusätzlich werden URL-kodierte Zeichen dekodiert, der Hostname in Labels aufgeteilt und die URL nach RFC 3987 (IRI) auf Unicode-Zeichen geprüft. Das Tool ist unverzichtbar für API-Entwickler, Web-Sicherheitsexperten und alle, die mit URL-Manipulation arbeiten.

Was ist die Anatomie einer URL?

Eine URL (Uniform Resource Locator) nach RFC 3986 folgt dem Schema: scheme://userinfo@host:port/path?query#fragment. Das Schema definiert das Protokoll (https, http, ftp, mailto, tel, data etc.). Host kann ein Domainname (example.com), eine IPv4-Adresse (192.0.2.1) oder eine in eckige Klammern gesetzte IPv6-Adresse ([2001:db8::1]) sein. Der Pfad ist hierarchisch strukturiert (durch '/' getrennte Segmente). Query-Parameter folgen dem Fragezeichen als Schlüssel-Wert-Paare (key=value), getrennt durch '&' oder ';'. Das Fragment (nach '#') wird nur clientseitig verarbeitet und nie an den Server gesendet.

Wie funktioniert das Tool?

Das Tool nutzt die native URL-API des Browsers (WHATWG URL Standard) für das grundlegende Parsing, ergänzt durch eigene Logik für die Analyse von Query-Parametern, TLD-Erkennung und URL-Encoding. Jeder Query-Parameter wird einzeln dekodiert (percent-decoding nach RFC 3986) und tabellarisch dargestellt. Der Hostname wird in Subdomain, registrierbare Domain und TLD (Top-Level-Domain) aufgeteilt, wobei die Public Suffix List (Mozilla PSL) zur korrekten TLD-Erkennung verwendet wird. IDN-Hostnamen (Internationalized Domain Names) werden in Punycode-Darstellung (xn--...) und Unicode-Form angezeigt.

Typische Anwendungsfälle

  • API-Debugging – Query-Parameter aus komplexen API-URLs extrahieren und prüfen
  • URL-Manipulation in Skripten – korrekte Handhabung von Sonderzeichen und Encoding
  • Sicherheitsanalyse – verdächtige URLs auf versteckte Parameter und Encoding-Tricks untersuchen
  • Webhook-Konfiguration – URL-Bestandteile für Routing-Regeln extrahieren

Schritt-für-Schritt-Anleitung

  1. Schritt 1: Vollständige URL in das Eingabefeld einfügen.
  2. Schritt 2: Das Tool zerlegt die URL automatisch in alle Bestandteile.
  3. Schritt 3: Query-Parameter in der Tabelle ablesen – sowohl URL-kodiert als auch dekodiert.
  4. Schritt 4: Fragment, Port und Schema für Konfigurationszwecke notieren.

Beispiel

Eingabe
https://api.example.com:8443/v2/search?q=hello+world&lang=de&limit=10#results
Ausgabe
Schema: https
Host: api.example.com
Port: 8443
Pfad: /v2/search
Query: q=hello world, lang=de, limit=10
Fragment: results
TLD: com
Subdomain: api

Tipps & Hinweise

  • Tipp: Das Fragment (#) wird nie an den Server gesendet und ist nur für clientseitige Navigation (Anchor-Links, SPA-Routing) relevant – Server-Logs enthalten es daher nie.
  • Tipp: Ein nicht angegebener Port bedeutet den Standardport des Schemas: 80 für http, 443 für https, 21 für ftp.
  • Tipp: Achten Sie auf doppelt URL-kodierte Zeichen (%2526 statt %25 für %) – das kann ein Hinweis auf URL-Injection-Versuche sein.

Häufige Fragen

Was ist der Unterschied zwischen URL und URI?
URI (Uniform Resource Identifier) ist der Oberbegriff: Er identifiziert eine Ressource. URL (Locator) gibt zusätzlich an, wie man die Ressource erreicht (Protokoll, Host). URN (Name) identifiziert ohne Zugriffsweg (z. B. urn:isbn:...). In der Praxis werden URL und URI oft synonym verwendet, da die meisten URIs gleichzeitig URLs sind.
Was ist Punycode und wann wird es verwendet?
Punycode (RFC 3492) ist eine Kodierung für Unicode-Hostnamen im ASCII-kompatiblen Format. Domains mit Sonderzeichen (ä, ö, ü, kyrillisch, arabisch etc.) werden als 'xn--'-Präfix-Strings kodiert: 'münchen.de' → 'xn--mnchen-3ya.de'. Das DNS-System arbeitet intern immer mit Punycode.
URL-Parser
Zerlege eine URL in ihre einzelnen Bestandteile – Protokoll, Host, Pfad, Query-Parameter, Fragment und mehr.
Tool öffnen