html_entity_decode

(PHP 4 >= 4.3.0, PHP 5)

html_entity_decode — Converte le entità HTML nei corrispondenti caratteri

Descrizione

string html_entity_decode ( string $string [, int $quote_style [, string $charset ]] )

La funzione html_entity_decode() è l'opposto di htmlentities() converte tutte le entità HTML presenti nel parametro string nel corrispondente carattere.

Il secondo parametro, quote_style, opzionale, indica cosa occorre fare per gli apici 'singoli' e "doppi". Sono possibili tre scelte indicate da tre costanti con default ENT_COMPAT:

**Costanti disponibili per `quote_style`**
Nome della costante	Descrizione
`ENT_COMPAT`	Converte gli apici doppi e lascia inalterati gli apici singoli.
`ENT_QUOTES`	Converte sia gli apici doppi sia gli apici singoli.
`ENT_NOQUOTES`	Lascia entrambi i tipi di apici inalterati.

Per il terzo parametro opzionale, charset, si utilizza come default il set di caratteri ISO-8859-1. Questo parametro indica quale set di caratteri utilizzare per la conversione.

Elenco dei set di caratteri supportati:

**Set di caratteri supportati**
Set di caratteri	Alias	Descrizione
ISO-8859-1	ISO8859-1	Western European, Latin-1.
ISO-8859-5	ISO8859-5	Il charset cirillico poco utilizzato (Latin/Cyrillic).
ISO-8859-15	ISO8859-15	Western European, Latin-9. Con in più il simbolo dell'Euro e i caratteri francesi e finnici mancanti in Latin-1 (ISO-8859-1).
UTF-8		Set ASCII compatibile con il set multi-byte Unicode su 8-bit.
cp866	ibm866, 866	Set di caratteri cirillico specifico del Dos.
cp1251	Windows-1251, win-1251, 1251	Set di caratteri cirillico specifico di Windows.
cp1252	Windows-1252, 1252	Set di caratteri specifico di Windows per l'Europa occidentale.
KOI8-R	koi8-ru, koi8r	Russo.
BIG5	950	Cinese tradizionale, usato principalmente a Taiwan.
GB2312	936	Cinese semplificato, set di caratteri nazionale standard.
BIG5-HKSCS		Big5 con estensioni per Hong Kong, cinese tradizionale.
Shift_JIS	SJIS, SJIS-win, cp932, 932	Giapponese.
EUC-JP	EUCJP, eucJP-win	Giapponese.
MacRoman		Charset che veniva utilizzato dal Mac OS.
''		Una stringa vuota attiva il rilevamento della codifica dallo script (Zend multibyte), default_charset e l'attuale locale (guarda nl_langinfo() e setlocale()), in quest'ordine. Non consigliato.

Nota: Ogni altro set di caratteri non è riconosciuto. Sarà invece utilizzata la codifica predefinita e verrà mostrato un avviso.

Example #1 Decodifica delle entità HTML


<?php
$orig = "I'll \"walk\" the <b>dog</b> now";

$a = htmlentities($orig);

$b = html_entity_decode($a);

echo $a; // I'll &quot;walk&quot; the &lt;b&gt;dog&lt;/b&gt; now

echo $b; // I'll "walk" the <b>dog</b> now


// Per utilizzatori di versioni di PHP antecedenti alla 4.3.0:
function unhtmlentities($string) 
{
    $trans_tbl = get_html_translation_table(HTML_ENTITIES);
    $trans_tbl = array_flip($trans_tbl);
    return strtr($string, $trans_tbl);
}

$c = unhtmlentities($a);

echo $c; // I'll "walk" the <b>dog</b> now

?>

Nota:
Ci si può chiedere come mai la sequenza trim(html_entity_decode(' ')); non produca una stringa vuota; questo accade perché l'intità ' ' non corrisponde al codice ASCII 32 (che verrebbe rimosso da trim()), ma, nella codifica di default ISO-8859-1, corrisponde al carattere ASCII 160 (0xa0).

Vedere anche htmlentities(), htmlspecialchars(), get_html_translation_table(), and urldecode().