(PHP 5 >= 5.0.1, PHP 7)
tidyNode::isText — Проверяет, является ли текущий узел обычным текстом (не разметкой)
Проверяет, является ли текущий узел обычным текстом (без какой-либо разметки).
   Возвращает TRUE, если узел представляет собой текст, FALSE - в противном случае.
  
Пример #1 Извлечение обычного текста из смешанного HTML-документа
<?php
$html = <<< HTML
<html><head>
<?php echo '<title>заголовок</title>'; ?>
<#
  /* JSTE код */
  alert('Привет Мир');
#>
</head>
<body>
<?php
  // PHP код
  echo 'привет мир!';
?>
<%
  /* ASP код */
  response.write("Привет Мир!")
%>
<!-- Комментарии -->
Привет Мир
</body></html>
За пределами HTML кода
HTML;
$tidy = tidy_parse_string($html);
$num = 0;
get_nodes($tidy->html());
function get_nodes($node) {
    // проверяет текущий узел на соответствие требуемому типу
    if($node->isText()) {
        echo "\n\n# текстовый узел #" . ++$GLOBALS['num'] . "\n";
        echo $node->value;
    }
    // проверяет существование потомков у текущего узла
    if($node->hasChildren()) {
        foreach($node->child as $child) {
            get_nodes($child);
        }
    }
}
?>
Результат выполнения данного примера:
# текстовый узел #1 Привет Мир # текстовая нода #2 За пределами HTML кода