(PHP 5 >= 5.0.1, PHP 7)
tidyNode::isText — Проверяет, является ли текущий узел обычным текстом (не разметкой)
Проверяет, является ли текущий узел обычным текстом (без какой-либо разметки).
Возвращает TRUE
, если узел представляет собой текст, FALSE
- в противном случае.
Пример #1 Извлечение обычного текста из смешанного HTML-документа
<?php
$html = <<< HTML
<html><head>
<?php echo '<title>заголовок</title>'; ?>
<#
/* JSTE код */
alert('Привет Мир');
#>
</head>
<body>
<?php
// PHP код
echo 'привет мир!';
?>
<%
/* ASP код */
response.write("Привет Мир!")
%>
<!-- Комментарии -->
Привет Мир
</body></html>
За пределами HTML кода
HTML;
$tidy = tidy_parse_string($html);
$num = 0;
get_nodes($tidy->html());
function get_nodes($node) {
// проверяет текущий узел на соответствие требуемому типу
if($node->isText()) {
echo "\n\n# текстовый узел #" . ++$GLOBALS['num'] . "\n";
echo $node->value;
}
// проверяет существование потомков у текущего узла
if($node->hasChildren()) {
foreach($node->child as $child) {
get_nodes($child);
}
}
}
?>
Результат выполнения данного примера:
# текстовый узел #1 Привет Мир # текстовая нода #2 За пределами HTML кода