Шаблоны для uCoz [18] |
Виды материалов [10] |
Мини профили [7] |
Мини чаты [8] |
Виды комментариев [14] |
Формы входа [3] |
Информеры [33] |
Украшения [16] |
Меню сайта [5] |
Кнопки [27] |
Шапки сайта [3] |
Медиа [19] |
Переключатели [8] |
Разное [65] |
Формы поиска [9] |
Скрипты [46] |
Игры на сайт [6] |
Аякс (Ajax) окна [1] |
PHP скрипты [3] |
11:48 Парсер материалов для юкоз |
Очень умный скрипт — бот, задачей которого является исследование RSS-лент. 1. В предполагаемой RSS-ленте, бот находит ссылки на последние материалы, далее изучает страницы с материалом для дальнейшего парсинга. 2. С помощью библиотеки «phpQuery» (аналог jQuery на языке PHP) собирает нужные элементы с заголовком и текстом материала (как и с каких элементов собирать очень просто изменяется в настройках). 3. Все собранные данные выводит на странице add.php, которая представляет интерфейс админки, где предлогаются действия:
4. При нажатии «редактировать», заголовок и текст материала заменятся на текстовое поле с этим содержимым. 5. После редактирования достаточно нажать кнопку «сохранить», как на глазах все видоизменится. 6. После необходимых процедур, нажав на «сохранить и добавить», начнется самая главная процедура — добавление материала на сайт с интервалом в 25 секунд (меньше интервал — блокировка сайта). Указав в настройках (edit.php) нужные данные:
Для большего удобства, в настройках можно создать отдельный фильтр настроек, и загружать настройки в два клика. Всего несколько шагов:
Чтобы загрузить фильтр, достаточно просто выбрать из списка «Загрузить фильтр» нужный вам фильтр. Нажать «загрузить фильтр». Все фильтры располагаются в папке config. Информация фильтра загружается в главный файл настроек config.txt, откуда они читаются. Например, вы хотите брать информацию с двух сайтов. Укажите нужную информацию в настройках для первого сайта, и назовите его как угодно.Ту же самую операцию провести и со вторым сайтом. Когда захотите перейти к другим настройкам, выберите нужный фильтр, жмите «загрузить фильтр», а после перезагрузки страницы настроек на «перейти к парсингу» (возле кнопки «сохранить»). Такой способ сильно экономит время, которое можно было тратить на пере заполнение полей в настройках. Скрипт работает на нескольких файлах-скриптах (*.php):
Папки config, work создаются автоматически при запуске бота. Для примера возьмем blog.ucoz.ru, что нужно указать в настройках: 1. Все заполняем до поля «Адрес RSS ленты» 2. В поле «Адрес RSS ленты» ввести: http://blog.ucoz.ru/blog/rss 3. В «Элемент для заголовка»: #content h1 4. «Элемент для текста»: div.text-outside 5. Далее заполняем на усмотрение Установка: 1. Загрузить папку «php_bot» в корень FTP сервера s2000.ucoz.net 2. Запустить скрипт настроек «%ваш_сайт%/php/php_bot/edit.php», просто перейдя по ссылке 3. Указать в настройках все необходимые данные для корректной работы скрипта. 4. Начать парсинг материалов можно на странице «%ваш_сайт%/php/php_bot/add.php» |
Всего комментариев: 4 | |||
| |||