developer blog

451 degrees Fahrenheit

Archives Posts

Валидация DOM HTML в реальном времени

August 15th, 2008 by pilot

Во время web 2.0 валидность документов стандартрам w3.org xhtml, html, css является неотемлемой частью любого проекта

Осообенно трепетно к этому относятся заказчики за пределами СНГ

Валидатор от w3.org, конечно хорошо, но как всегда хочеться большего.

В нашем случае “большее” - это живой валидатор в реальном времени, автор живого валидатора (Validator.nu) Henri Sivonon взял Hixie’s Live DOM Viewer, и на его основе собрал свой парсер DOM.

Получилось я вам скажу очень даже неплохо.

livedomvalidation

Filed under Uncategorized having 6 Comments »

Archives Posts

Html DOM parser на PHP

August 11th, 2008 by pilot

Очень полезный класс для разборки DOM модели веб документа с селектора в  jQuery стиле.

Это просто незаменимая вещь если вы любитель обдирать чужие сайты )). А вообще одно из основных применений - это к примеру брать котировки валют прям со страницы банка и тд.

Почему собственно PHP Simple HTML DOM Parser:

  • Написан на PHP5+ и позволяет легко управлять HTML
  • Поддерживает не валидный HTML
  • Поиск тагов в HTML с селекторами в jQuery стиле
  • Может разложить все содержимое HTML в строку

Скачать последнюю версию с Sourceforge.

Онлайн документация.

Небольшой пример, как извлеть HTML элемент:


// Create DOM from URL or file$html = file_get_html('http://www.google.com/');


// Find all images
foreach($html->find('img') as $element)
  echo $element->src . '<br>'; 

// Find all links
foreach($html->find('a') as $element)
  echo $element->href . '<br>';
Filed under php having 5 Comments »