developer blog

451 degrees Fahrenheit

Html DOM parser на PHP

August 11th, 2008 by pilot |

Очень полезный класс для разборки DOM модели веб документа с селектора в  jQuery стиле.

Это просто незаменимая вещь если вы любитель обдирать чужие сайты )). А вообще одно из основных применений - это к примеру брать котировки валют прям со страницы банка и тд.

Почему собственно PHP Simple HTML DOM Parser:

  • Написан на PHP5+ и позволяет легко управлять HTML
  • Поддерживает не валидный HTML
  • Поиск тагов в HTML с селекторами в jQuery стиле
  • Может разложить все содержимое HTML в строку

Скачать последнюю версию с Sourceforge.

Онлайн документация.

Небольшой пример, как извлеть HTML элемент:


// Create DOM from URL or file$html = file_get_html('http://www.google.com/');


// Find all images
foreach($html->find('img') as $element)
  echo $element->src . '<br>'; 

// Find all links
foreach($html->find('a') as $element)
  echo $element->href . '<br>';
top of hotblogs.org.ua

Раздел php

4 Responses

  1. z01d Says:

    Спасибо за ссылку! Ну вот этот способ (http://www.z01d.com/2008/08/08/scrape-site-content-with-php5-domxpath-firebug/) наверное уже известен? Firebug выдает готовый Xpath, не надо вручную искать ноды.

  2. ExTriL Says:

    Огромное СПАСИБО! Этот блог - супер!!!

  3. Евгений Says:

    благодарю за скрипт, давно уже искал подобное на php, как оказалось - все просто :)

  4. pilot Says:

    Библиотека очень удобная ))

Leave a Comment

Please note: Comment moderation is enabled and may delay your comment. There is no need to resubmit your comment.