Kostenloser HTML-Entity-Decoder Online

HTML-Entities zurück in ihre ursprünglichen Zeichen dekodieren.

0 Zeichen

Was ist HTML-Entity-Dekodierung?

HTML-Entity-Dekodierung wandelt HTML-Entities (wie <, >, &) zurück in ihre ursprünglichen Zeichen um. Dies ist nützlich, wenn Sie kodiertes HTML zurück in lesbaren Text oder tatsächlichen HTML-Code konvertieren müssen.

Häufige Anwendungen der HTML-Entity-Dekodierung

  • Web-Scraping und Datenextraktion: Beim Scraping von Webseiten oder Parsen von HTML-Dokumenten enthält extrahierter Text manchmal HTML-Entities. Dekodieren Sie diese Entities, um sauberen, lesbaren Text für Analyse, Such-Indexierung oder Speicherung zu erhalten. Zum Beispiel sollte das Scraping einer Produktbeschreibung, die "5" screen" enthält, zu "5" screen" dekodiert werden.
  • API-Antwortverarbeitung: Einige APIs geben HTML-entity-kodierte Daten in JSON- oder XML-Antworten zurück. Beim Konsumieren dieser APIs dekodieren Sie die kodierten Strings, um verwendbaren Text zu erhalten. Zum Beispiel könnte eine API {"title": "Q&A Session"} zurückgeben, was zu "Q&A Session" für Anzeige oder weitere Verarbeitung dekodiert werden muss.
  • Content-Migration und Datenimport: Bei der Migration von Inhalten zwischen Systemen (Umzug von WordPress zu einem anderen CMS, Import von Blog-Posts aus XML, Konvertierung von Legacy-Datenbanken) werden Inhalte oft mit HTML-Entities gespeichert. Die Dekodierung dieser Entities zu Klartext oder ordnungsgemäß formatiertem HTML ist für die Migration notwendig. Zum Beispiel müssen Blog-Titel, die als "How to Use &lt;div&gt; Tags" gespeichert sind, zu "How to Use <div> Tags" für Anzeige oder Such-Indexierung dekodiert werden.
  • seo.html_decode.use_debugging seo.html_decode.use_debugging_desc

Wie funktioniert HTML-Entity-Dekodierung?

HTML-Entity-Dekodierung kehrt den Kodierungsprozess um, indem Entity-Referenzen zurück in ihre ursprünglichen Zeichen konvertiert werden. Der Dekoder erkennt sowohl benannte Entities (wie &amp;) als auch numerische Entities (wie &#38; oder &#x26;). Hier ist der technische Prozess:

  • Schritt 1 - Nach Entity-Referenzen scannen: Der Dekoder liest den Text auf der Suche nach Ampersand-Zeichen (&), die Entity-Referenzen beginnen und mit einem Semikolon (;) enden.
  • Schritt 2 - Entity-Typ identifizieren: Benannte Entities (z.B. &, <, >) werden in der HTML-Entity-Tabelle nachgeschlagen. Numerische Entities, die mit &# beginnen, werden als Dezimal geparst; diejenigen, die mit &#x beginnen, werden als Hexadezimal geparst.
  • Schritt 3 - In Zeichen konvertieren: Jede Entity wird durch ihr entsprechendes Unicode-Zeichen ersetzt. Zum Beispiel wird & zu &, < wird zu <, é wird zu é.
  • Schritt 4 - Nicht-Entities durchlassen: Text, der keinem Entity-Muster entspricht, bleibt unverändert. Ungültige oder unbekannte Entities können unverändert gelassen oder gemäß HTML-Parsing-Regeln behandelt werden.

Beispiel: "<p>Hello & welcome</p>" dekodiert zu "

Hello & welcome

". Die benannten Entities werden durch ihre entsprechenden Zeichen ersetzt.

HTML-Entity-Dekodierung verstehen

HTML-Entity-Dekodierung interpretiert sowohl benannte Entities (< > &) als auch numerische Entities (< > & in Dezimal, < > & in Hexadezimal). Der Dekoder erkennt Entity-Muster (& gefolgt von Entity-Name oder -Nummer, beendet durch ;), schlägt das entsprechende Zeichen in der HTML-Entity-Tabelle nach und ersetzt die Entity durch das tatsächliche Zeichen. Benannte Entities sind durch HTML-Spezifikationen definiert (über 2.000 Entities einschließlich mathematischer Symbole, griechischer Buchstaben und Sonderzeichen). Numerische Entities können jedes Unicode-Zeichen durch Codepoint darstellen.

Sicherheitswarnungen für HTML-Dekodierung

HTML-Dekodierung konvertiert Entities zurück in Sonderzeichen. Dekodieren und zeigen Sie niemals nicht vertrauenswürdige Inhalte ohne Neu-Kodierung an, da dies XSS-Angriffe ermöglichen kann. Erfahren Sie mehr über Kodierungssicherheit

HTML-Entity-Dekodierung in Programmiersprachen

HTML-Entity-Dekodierung ist in allen wichtigen Programmiersprachen verfügbar. Hier sind umfassende Beispiele:

// html_entity_decode() - Standard-Dekodierung
$decoded = html_entity_decode($encoded, ENT_QUOTES, 'UTF-8');

// htmlspecialchars_decode() - dekodiert nur grundlegende Entities
$decoded = htmlspecialchars_decode($encoded, ENT_QUOTES);

// Beispiel: API-Antwort verarbeiten
$apiData = json_decode($response, true);
$title = html_entity_decode($apiData['title'], ENT_QUOTES, 'UTF-8');
// Sichere Dekodierung mit DOMParser
function htmlDecode(str) {
    const parser = new DOMParser();
    const doc = parser.parseFromString(str, 'text/html');
    return doc.documentElement.textContent;
}

// WARNUNG: Vorsicht mit nicht vertrauenswürdigen Daten
import html

# html.unescape() - dekodiert alle HTML-Entities
decoded = html.unescape(encoded)

# Beispiel: API-Antwort verarbeiten
import json
data = json.loads(response)
title = html.unescape(data['title'])
import "html"

// html.UnescapeString() - dekodiert HTML-Entities
decoded := html.UnescapeString(encoded)

// Beispiel: XML-Feed verarbeiten
item.Title = html.UnescapeString(item.Title)
// Apache Commons Text (empfohlen)
import org.apache.commons.text.StringEscapeUtils;
String decoded = StringEscapeUtils.unescapeHtml4(encoded);

// Jsoup (für HTML-Parsing mit Auto-Dekodierung)
import org.jsoup.Jsoup;
String decoded = Jsoup.parse(encoded).text();
require 'cgi'

# CGI.unescapeHTML() - dekodiert HTML-Entities
decoded = CGI.unescapeHTML(encoded)

# Nokogiri (für HTML-Parsing mit Auto-Dekodierung)
require 'nokogiri'
doc = Nokogiri::HTML(html_content)
text = doc.text
using System.Web;
using System.Net;

// HttpUtility.HtmlDecode() - dekodiert HTML-Entities
string decoded = HttpUtility.HtmlDecode(encoded);

// WebUtility (keine System.Web-Abhängigkeit)
string decoded = WebUtility.HtmlDecode(encoded);

Verwandte Tools

Müssen Sie Text in HTML-Entities kodieren? Verwenden Sie unseren HTML-Entity-Encoder, um < > & in < > & zu konvertieren.

URL-kodierte Strings dekodieren? Probieren Sie unseren URL-Decoder aus, um %XX-Sequenzen zurück in Zeichen zu konvertieren.

Base64-Daten dekodieren? Verwenden Sie unseren Base64-Decoder, um Base64-Strings in ursprünglichen Text zu konvertieren.