Анализ страницы HTML через PHP

Существует множество способов парсить страницу HTML через PHP, один из способов это с помощью PHP Simple HTML DOM Parser

создаем объект DOM, где $url — ваш URL сайта, с которого хотите парсить

$html = file_get_html($url);

Ищем то что нам нужно

$posts = $html->find('.post');

Получается массив объектов DOM. Проходимся по ним foreach. В них опять же можно использоваться метод find (ища опять же те селекторы, которые нужны). Либо можно использовать метод innertext чтобы вытащить уже содержимое (текст)

$item->innertext

надо помнить, что метод find всегда возвращает массив, поэтому, даже если вы уверены, что селектор один, необходимо к нему обратиться по нулевому индексу.

$item->find('.cover')[0]->innertext

Полная документация: http://simplehtmldom.sourceforge.net/manual.htm

Leave a comment

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.