Kostenloser HTML-Entity-Decoder Online
HTML-Entities zurück in ihre ursprünglichen Zeichen dekodieren.
Was ist HTML-Entity-Dekodierung?
HTML-Entity-Dekodierung wandelt HTML-Entities (wie <, >, &) zurück in ihre ursprünglichen Zeichen um. Dies ist nützlich, wenn Sie kodiertes HTML zurück in lesbaren Text oder tatsächlichen HTML-Code konvertieren müssen.
Häufige Anwendungen der HTML-Entity-Dekodierung
- Web-Scraping und Datenextraktion: Beim Scraping von Webseiten oder Parsen von HTML-Dokumenten enthält extrahierter Text manchmal HTML-Entities. Dekodieren Sie diese Entities, um sauberen, lesbaren Text für Analyse, Such-Indexierung oder Speicherung zu erhalten. Zum Beispiel sollte das Scraping einer Produktbeschreibung, die "5" screen" enthält, zu "5" screen" dekodiert werden.
- API-Antwortverarbeitung: Einige APIs geben HTML-entity-kodierte Daten in JSON- oder XML-Antworten zurück. Beim Konsumieren dieser APIs dekodieren Sie die kodierten Strings, um verwendbaren Text zu erhalten. Zum Beispiel könnte eine API {"title": "Q&A Session"} zurückgeben, was zu "Q&A Session" für Anzeige oder weitere Verarbeitung dekodiert werden muss.
- Content-Migration und Datenimport: Bei der Migration von Inhalten zwischen Systemen (Umzug von WordPress zu einem anderen CMS, Import von Blog-Posts aus XML, Konvertierung von Legacy-Datenbanken) werden Inhalte oft mit HTML-Entities gespeichert. Die Dekodierung dieser Entities zu Klartext oder ordnungsgemäß formatiertem HTML ist für die Migration notwendig. Zum Beispiel müssen Blog-Titel, die als "How to Use <div> Tags" gespeichert sind, zu "How to Use <div> Tags" für Anzeige oder Such-Indexierung dekodiert werden.
- seo.html_decode.use_debugging seo.html_decode.use_debugging_desc
Wie funktioniert HTML-Entity-Dekodierung?
HTML-Entity-Dekodierung kehrt den Kodierungsprozess um, indem Entity-Referenzen zurück in ihre ursprünglichen Zeichen konvertiert werden. Der Dekoder erkennt sowohl benannte Entities (wie &) als auch numerische Entities (wie & oder &). Hier ist der technische Prozess:
- Schritt 1 - Nach Entity-Referenzen scannen: Der Dekoder liest den Text auf der Suche nach Ampersand-Zeichen (&), die Entity-Referenzen beginnen und mit einem Semikolon (;) enden.
- Schritt 2 - Entity-Typ identifizieren: Benannte Entities (z.B. &, <, >) werden in der HTML-Entity-Tabelle nachgeschlagen. Numerische Entities, die mit beginnen, werden als Dezimal geparst; diejenigen, die mit beginnen, werden als Hexadezimal geparst.
- Schritt 3 - In Zeichen konvertieren: Jede Entity wird durch ihr entsprechendes Unicode-Zeichen ersetzt. Zum Beispiel wird & zu &, < wird zu <, é wird zu é.
- Schritt 4 - Nicht-Entities durchlassen: Text, der keinem Entity-Muster entspricht, bleibt unverändert. Ungültige oder unbekannte Entities können unverändert gelassen oder gemäß HTML-Parsing-Regeln behandelt werden.
Beispiel: "<p>Hello & welcome</p>" dekodiert zu "
Hello & welcome
". Die benannten Entities werden durch ihre entsprechenden Zeichen ersetzt.HTML-Entity-Dekodierung verstehen
HTML-Entity-Dekodierung interpretiert sowohl benannte Entities (< > &) als auch numerische Entities (< > & in Dezimal, < > & in Hexadezimal). Der Dekoder erkennt Entity-Muster (& gefolgt von Entity-Name oder -Nummer, beendet durch ;), schlägt das entsprechende Zeichen in der HTML-Entity-Tabelle nach und ersetzt die Entity durch das tatsächliche Zeichen. Benannte Entities sind durch HTML-Spezifikationen definiert (über 2.000 Entities einschließlich mathematischer Symbole, griechischer Buchstaben und Sonderzeichen). Numerische Entities können jedes Unicode-Zeichen durch Codepoint darstellen.
Sicherheitswarnungen für HTML-Dekodierung
HTML-Dekodierung konvertiert Entities zurück in Sonderzeichen. Dekodieren und zeigen Sie niemals nicht vertrauenswürdige Inhalte ohne Neu-Kodierung an, da dies XSS-Angriffe ermöglichen kann. Erfahren Sie mehr über Kodierungssicherheit
HTML-Entity-Dekodierung in Programmiersprachen
HTML-Entity-Dekodierung ist in allen wichtigen Programmiersprachen verfügbar. Hier sind umfassende Beispiele:
// html_entity_decode() - Standard-Dekodierung
$decoded = html_entity_decode($encoded, ENT_QUOTES, 'UTF-8');
// htmlspecialchars_decode() - dekodiert nur grundlegende Entities
$decoded = htmlspecialchars_decode($encoded, ENT_QUOTES);
// Beispiel: API-Antwort verarbeiten
$apiData = json_decode($response, true);
$title = html_entity_decode($apiData['title'], ENT_QUOTES, 'UTF-8');
// Sichere Dekodierung mit DOMParser
function htmlDecode(str) {
const parser = new DOMParser();
const doc = parser.parseFromString(str, 'text/html');
return doc.documentElement.textContent;
}
// WARNUNG: Vorsicht mit nicht vertrauenswürdigen Daten
import html
# html.unescape() - dekodiert alle HTML-Entities
decoded = html.unescape(encoded)
# Beispiel: API-Antwort verarbeiten
import json
data = json.loads(response)
title = html.unescape(data['title'])
import "html"
// html.UnescapeString() - dekodiert HTML-Entities
decoded := html.UnescapeString(encoded)
// Beispiel: XML-Feed verarbeiten
item.Title = html.UnescapeString(item.Title)
// Apache Commons Text (empfohlen)
import org.apache.commons.text.StringEscapeUtils;
String decoded = StringEscapeUtils.unescapeHtml4(encoded);
// Jsoup (für HTML-Parsing mit Auto-Dekodierung)
import org.jsoup.Jsoup;
String decoded = Jsoup.parse(encoded).text();
require 'cgi'
# CGI.unescapeHTML() - dekodiert HTML-Entities
decoded = CGI.unescapeHTML(encoded)
# Nokogiri (für HTML-Parsing mit Auto-Dekodierung)
require 'nokogiri'
doc = Nokogiri::HTML(html_content)
text = doc.text
using System.Web;
using System.Net;
// HttpUtility.HtmlDecode() - dekodiert HTML-Entities
string decoded = HttpUtility.HtmlDecode(encoded);
// WebUtility (keine System.Web-Abhängigkeit)
string decoded = WebUtility.HtmlDecode(encoded);
Verwandte Tools
Müssen Sie Text in HTML-Entities kodieren? Verwenden Sie unseren HTML-Entity-Encoder, um < > & in < > & zu konvertieren.
URL-kodierte Strings dekodieren? Probieren Sie unseren URL-Decoder aus, um %XX-Sequenzen zurück in Zeichen zu konvertieren.
Base64-Daten dekodieren? Verwenden Sie unseren Base64-Decoder, um Base64-Strings in ursprünglichen Text zu konvertieren.