Sprache : en | de | fr | es
Zurück zu den Blogs

Was ist URL-Kodierung und wozu wird sie verwendet?

Erklärung der zulässigen Zeichen in URLs

Eine URL ist nicht nur eine Textzeile. Es handelt sich um einen strukturierten Bezeichner mit Regeln darüber, welche Symbole direkt verwendet werden dürfen, welche kodiert werden müssen und welche bei unachtsamer Verwendung zu Fehlern bei der Auswertung führen können. Wenn Entwickler, Content-Manager und SEO-Spezialisten diese Regeln ignorieren, kommt es zu defekten Links, Weiterleitungsfehlern, fehlerhaften Parametern und Seiten, die sich in verschiedenen Browsern, auf verschiedenen Servern und in verschiedenen Analysetools unterschiedlich verhalten.

Dieser Artikel erklärt, welche Symbole sicher sind, welche eine Prozent-Kodierung erfordern und wie man saubere Links erstellt, die lesbar und technisch gültig bleiben. Der Fokus liegt auf der Praxis: echte Beispiele, häufige Fehler und ein klares Rahmenwerk für die Erstellung von Adressen, die zuverlässig funktionieren.

Welche Zeichen sind in einer Webadresse erlaubt

Wenn Menschen nach erlaubten Zeichen in einer URL fragen, wollen sie meist eine einfache Antwort. Die Kurzfassung lautet: Buchstaben, Ziffern und eine begrenzte Menge an Trennzeichen sind in der Regel sicher, aber die genaue Regel hängt vom jeweiligen Teil der URL ab.

Eine Standardadresse kann folgende Komponenten enthalten:

  • scheme: https
  • host: example.com
  • path: /blog/url-rules
  • query: ?page=2&sort=asc
  • fragment: #section-1

Jeder Abschnitt folgt seiner eigenen Syntax. Ein Slash ist im Pfad normal, aber dasselbe Symbol innerhalb eines Parameterwerts muss je nach Kontext möglicherweise kodiert werden.

Sichere Zeichen, die Sie meist lesbar lassen können

Diese werden häufig als gültige Zeichen in Webadressen betrachtet, wenn sie an der richtigen Stelle verwendet werden:

  • Groß- und Kleinbuchstaben: A–Z, a–z
  • Ziffern: 0–9
  • Bindestrich: -
  • Unterstrich: _
  • Punkt: .
  • Tilde: ~

Diese Zeichen sind weit verbreitet, da sie in der Regel nicht mit Parsing-Regeln kollidieren.

Praktisches Beispiel

Diese URL ist sauber und vorhersehbar:

https://example.com/guides/url-format-basics

Sie verwendet gut lesbare Trennzeichen, keine Leerzeichen und einen Pfad, der sowohl für Nutzer als auch für Server leicht zu verarbeiten ist.

Reservierte Zeichen und warum der Kontext wichtig ist

Einige Zeichen haben eine strukturelle Rolle. Diese werden als reservierte URL-Zeichen bezeichnet, da Parser ihnen bereits eine Bedeutung zuweisen.

Häufige Beispiele sind:

Zeichen

Typische Bedeutung

:

trennt das Schema vom Rest

/

teilt Pfadsegmente

?

beginnt den Query-String

&

trennt Query-Parameter

=

weist Parameterwerte zu

#

beginnt das Fragment

@

kann Zugangsdaten trennen oder in anderen Kontexten erscheinen

Diese Zeichen sind an sich nicht „schlecht“. Das Problem entsteht, wenn Sie sie als normalen Text innerhalb eines Wertes verwenden, ohne sie zu kodieren.

Beispiel: gleiches Zeichen, unterschiedliche Rolle

Vergleichen Sie diese beiden Fälle:

https://example.com/search?q=red&blue

https://example.com/search?q=red%26blue

In der ersten Zeile trennt das kaufmännische Und die Parameter. In der zweiten bedeutet %26, dass das Zeichen & wörtlich zum Suchbegriff gehört.

Warum Percent-Encoding existiert

Percent-Encoding ersetzt ein Zeichen durch % gefolgt von seinem hexadezimalen Bytewert. Dadurch können Sie Symbole einfügen, die sonst den Parser verwirren würden.

Beispiele:

  • Leerzeichen → %20

  • & → %26

  • → %23

  • % → %25

Dies ist der Schlüssel zum korrekten Umgang mit Sonderzeichen in URL-Werten.

Zeichen, die oft zu fehlerhaften Links führen

Einige Zeichen sind technisch in bestimmten Fällen möglich, verursachen jedoch häufig praktische Probleme in CMS-Plattformen, Routing-Systemen, Proxys oder Analyse-Tools. Deshalb sprechen Teams von ungültigen URL-Zeichen, auch wenn der strenge Standard differenzierter ist.

Beispiele für riskante Eingaben

Die folgenden Zeichen sollten vor der Verwendung sorgfältig geprüft oder kodiert werden:

  • Leerzeichen
  • Anführungszeichen
  • spitze Klammern
  • Backslash
  • geschweifte Klammern
  • Pipe
  • Zirkumflex
  • Backtick

Ein rohes Leerzeichen im Pfad ist ein klassischer Fehler:

https://example.com/my file.pdf

Eine sicherere Version ist:

https://example.com/my-file.pdf

oder, wenn die ursprüngliche Zeichenfolge erhalten bleiben muss:

https://example.com/my%20file.pdf

Zeichen, die nicht blind in Slugs eingefügt werden sollten

Viele Systeme lehnen diese als ungültige URL-Zeichen bei der Slug-Erstellung ab oder normalisieren sie:

  1. Leerzeichen
  2. wiederholte Satzzeichen
  3. nicht kodiertes %
  4. rohes # in Dateinamen
  5. rohes ? in Ressourcennamen

Eine Route kann lokal funktionieren und in der Produktion fehlschlagen, weil Reverse Proxy, Framework und Browser nicht gleich normalisieren.

Wie man lesbare und sichere URL-Slugs erstellt

Das stabilste Muster besteht darin, kurze Wörter in Kleinbuchstaben zu verwenden und sie mit Bindestrichen zu verbinden. Dies sind die gebräuchlichsten URL-freundlichen Zeichen für Artikel-Slugs, Produktseiten und Kategoriepfade.

Empfohlene Slug-Regeln

  • verwenden Sie Kleinbuchstaben
  • verwenden Sie Ziffern nur, wenn sie Bedeutung hinzufügen
  • trennen Sie Wörter mit Bindestrichen
  • vermeiden Sie Leerzeichen und gemischte Trennzeichen
  • entfernen Sie dekorative Satzzeichen
  • halten Sie Slugs kurz

Beispiel:

https://example.com/blog/how-routing-works

Weniger konsistente Version:

https://example.com/Blog/How_Routing!Works?

Die zweite Version führt zu uneinheitlicher Groß-/Kleinschreibung, gemischter Zeichensetzung und einem abschließenden Symbol mit Parsing-Bedeutung.

Bessere Beispiele für Slug-Umwandlung

Roh-Titel

Besserer Pfad

URL Rules for Beginners

/url-rules-for-beginners

Price List: 2026 Edition

/price-list-2026-edition

C# vs. C++ Guide

/c-sharp-vs-c-plus-plus-guide

Summer Sale 50% Off

/summer-sale-50-percent-off

Dies ist eine sicherere Strategie, als zu versuchen, jedes ursprüngliche Symbol beizubehalten

Den Unterschied zwischen gültigen, reservierten und unsicheren Zeichen verstehen

Viel Verwirrung entsteht dadurch, dass drei Kategorien vermischt werden:

Direkt verwendbare Zeichen

Diese sind in vielen Kontexten als Klartext meist sicher:

  • Buchstaben
  • Ziffern
  • Bindestrich
  • Unterstrich
  • Punkt
  • Tilde

Strukturelle Zeichen

Diese haben eine Bedeutung für den Parser und sollten nur dann wörtlich erscheinen, wenn Sie genau diese Struktur beabsichtigen:

  • :
  • /
  • ?
  • &
  • =

Eingaben, die kodiert oder normalisiert werden sollten

Diese verursachen oft Probleme in Links, die aus nutzergenerierten Inhalten kopiert werden:

  • Leerzeichen
  • Anführungszeichen
  • Klammern in bestimmten Kontexten
  • rohe Prozentzeichen
  • nicht standardisierte Satzzeichen

Diese Unterscheidung hilft Teams, Verwirrung zu vermeiden, wenn sie über erlaubte Zeichen in URL-Richtlinien in Entwicklung, SEO und Content-Workflows sprechen.

Häufige technische Fehler in realen Projekten

Viele fehlerhafte Links entstehen durch gewöhnliche Workflow-Fehler und nicht durch tiefgehende Protokollprobleme.

1. Vermischen von Pfadregeln mit Query-Regeln

Ein Slash ist im Pfad normal:

https://example.com/docs/setup/install

Aber derselbe Slash innerhalb eines Parameterwerts muss möglicherweise überprüft werden, je nachdem, wie das Backend ihn interpretiert.

2. Doppelte Kodierung

Falsch:

name=red%2520car

Wenn %20 zu %2520 wird, wurde das Prozentzeichen selbst erneut kodiert.

3. Rohes Benutzereingaben in URLs zulassen

Wenn ein Titelfeld ohne Normalisierung zu einem Pfadsegment wird, kann ein Artikel versehentlich Leerzeichen, Anführungszeichen und Fragmente erzeugen.

4. Alle Browser und Server als identisch behandeln

Eine Plattform kann eine fehlerhafte Adresse stillschweigend korrigieren. Eine andere kann sie ablehnen, unerwartet weiterleiten oder einen anderen Wert protokollieren.

Praktische Checkliste für saubere URL-Erstellung

Verwenden Sie diesen Ablauf, wenn Sie Links manuell erstellen oder im Code generieren:

  1. entscheiden Sie, welchen Teil der URL Sie bearbeiten
  2. halten Sie Pfade lesbar und minimal
  3. verwenden Sie Kleinbuchstaben-Slugs mit Bindestrichen
  4. kodieren Sie Benutzereingaben, bevor Sie sie in Parameter einfügen
  5. vermeiden Sie dekorative Satzzeichen in Pfaden
  6. testen Sie die endgültige URL im Browser, in Server-Logs und in Analyse-Tools

Beispiel für eine gut strukturierte Adresse

https://shop.example.com/products/wireless-keyboard?color=space-gray&layout=us

Warum es funktioniert:

  • der Pfad ist lesbar
  • die Query-Struktur ist eindeutig
  • Trennzeichen werden für ihre vorgesehenen Rollen verwendet
  • es gibt keine mehrdeutigen Leerzeichen oder fehlerhafte Satzzeichen im Slug

Fazit

Eine zuverlässige URL basiert auf Struktur, nicht auf Vermutungen. Der sicherste Ansatz ist, Pfade einfach zu halten, lesbare Trennzeichen zu verwenden, Daten zu kodieren, wenn Zeichen eine besondere Bedeutung haben, und rohe Eingaben zu vermeiden, die Parser verwirren können. Sobald Sie sichere Textzeichen von strukturellen Trennzeichen trennen, wird der Umgang mit URLs deutlich vorhersehbarer.

Für die tägliche Arbeit gilt eine einfache, aber äußerst praktische Regel: Halten Sie Pfade übersichtlich, verwenden Sie Sonderzeichen nur für ihren technischen Zweck und kodieren Sie alles, was falsch interpretiert werden könnte. Das führt zu weniger defekten Links, übersichtlicheren Protokollen, weniger Routing-Fehlern und einem stabileren Verhalten über Browser, Frameworks und Server hinweg.