Html DOM parser на PHP
August 11th, 2008 by pilot |
Очень полезный класс для разборки DOM модели веб документа с селектора в jQuery стиле.
Это просто незаменимая вещь если вы любитель обдирать чужие сайты )). А вообще одно из основных применений - это к примеру брать котировки валют прям со страницы банка и тд.
Почему собственно PHP Simple HTML DOM Parser:
- Написан на PHP5+ и позволяет легко управлять HTML
- Поддерживает не валидный HTML
- Поиск тагов в HTML с селекторами в jQuery стиле
- Может разложить все содержимое HTML в строку
Скачать последнюю версию с Sourceforge.
Онлайн документация.
Небольшой пример, как извлеть HTML элемент:
// Create DOM from URL or file$html = file_get_html('http://www.google.com/');
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';
// Find all links
foreach($html->find('a') as $element)
echo $element->href . '<br>';
Раздел php


August 11th, 2008 at 10:26 pm
Спасибо за ссылку! Ну вот этот способ (http://www.z01d.com/2008/08/08/scrape-site-content-with-php5-domxpath-firebug/) наверное уже известен? Firebug выдает готовый Xpath, не надо вручную искать ноды.
August 19th, 2008 at 10:48 am
Огромное СПАСИБО! Этот блог - супер!!!
August 21st, 2008 at 4:52 pm
благодарю за скрипт, давно уже искал подобное на php, как оказалось - все просто
August 21st, 2008 at 6:58 pm
Библиотека очень удобная ))
August 31st, 2008 at 5:19 pm
Спасибо за Ваш труд!!