Archives Posts
August 15th, 2008 by pilot
Во время web 2.0 валидность документов стандартрам w3.org xhtml, html, css является неотемлемой частью любого проекта
Осообенно трепетно к этому относятся заказчики за пределами СНГ
Валидатор от w3.org, конечно хорошо, но как всегда хочеться большего.
В нашем случае “большее” - это живой валидатор в реальном времени, автор живого валидатора (Validator.nu) Henri Sivonon взял Hixie’s Live DOM Viewer, и на его основе собрал свой парсер DOM.
Получилось я вам скажу очень даже неплохо.

Archives Posts
August 11th, 2008 by pilot
Очень полезный класс для разборки DOM модели веб документа с селектора в jQuery стиле.
Это просто незаменимая вещь если вы любитель обдирать чужие сайты )). А вообще одно из основных применений - это к примеру брать котировки валют прям со страницы банка и тд.
Почему собственно PHP Simple HTML DOM Parser:
- Написан на PHP5+ и позволяет легко управлять HTML
- Поддерживает не валидный HTML
- Поиск тагов в HTML с селекторами в jQuery стиле
- Может разложить все содержимое HTML в строку
Скачать последнюю версию с Sourceforge.
Онлайн документация.
Небольшой пример, как извлеть HTML элемент:
// Create DOM from URL or file$html = file_get_html('http://www.google.com/');
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';
// Find all links
foreach($html->find('a') as $element)
echo $element->href . '<br>';