Представляю вашему вниманию универсальный парсер контента – Datacol. Вообще Datacol это больше чем просто парсер контента, Datacol это это универсальная программа для получения любых данных, доступных в Интернете.
Datacol это десктопная программа, написанная на C#. Программа умеет экспортировать сохраненные данные в формат CSV, Excel, файл импорта для таких CMS как DLE и WordPress, (а также фришные блоги на платформе wordpress.com).
Автор неплохой программист, так что с ним можно договориться про доработку программы, чтобы она могла экспортировать данный в другие форматы и CMS.
В программе Datacol можно создавать профили настроек, и комбинируя разные опции Datacol вы сможете запросто делать следующее:
- Парсер контента по списку URL;
Указываете список страниц, указываете — где находится контент, которые необходимо спасристь. Если у вас возникнут проблемы то в этом разделе, вы найдете всю необходимую информацию.
Далее приведу список того, что умеет делать данный парсер.
- Парсер выдачи поисковикых систе;
- Парсер SEO параметров сайтов с различных проверочных сервисов;
- Парсер Яндекс Маркета;
- Парсер email (можно парсить майлы блогов, для проведения рекламной акции или для организации обмена ссылками)
- Парсер контента по ключевым словам (можно спасить контент по определенную ключевику, потом залить эту инфу одним махом на фришный блог, а далее ловить переходы по этим ключам и лить трафик на тематическую партнерку)
- Проверка возраста сайта;
- Чекер индексации сайтов;
- Парсер объявлений;
- Парсер интернет магазинов;
- Парсер внешних и/или внутренних ссылок с сайта;
- Парсер прокси адресов;
- Парсер, позволяющий проверять позицию сайта по определенным запросам в поисковике;
- Парсер музыки, парсер картинок и других всевозможных файлов;
- Парсер форумов на любых движках;
- Парсер результатов работы Javascript.
- И много другого.
Как видете возможности очень полезные и весьма разнообразные, так что если у вас будет этот парсер, то вы сможете решить много вопросов, и сэкономить массу времени.
Парсер стоит 80$, если его покупать напрямую. Я являюсь дилером по продаже этого парсера контента, так что через меня вы можете купить Datacol за 65$. Если вы укажите что пришли с блога valentyn-romanenko.com, то вам продадут Datacol со скидкой.
Купить парсер можно здесь.
Парсер-плагин для wordpress — WP UniParser
Итак, прошу любить и жаловать — WP UniParser – универсальный парсер контента в виде плагина под WordPress. Для начала, несколько слов об основных (и, на мой взгляд, действительно полезных) функциях парсера.
Во-первых, WP UniParser можно настроить для парсинга контента практически с любых сайтов. Таким образом, вам теперь не нужно искать отдельно парсер блогов, парсер статей, парсер RSS и т.д. Можно просто потратить 5-10 минут, чтобы настроить плагин для работы с любыми вебресурсами (в независимости от их верстки).
Во-вторых, WP UniParser умеет на лету автоматически переводить контент с помощью сервиса Google Translate. На данный момент поддерживается двухсторонний перевод с самых популярных языков: русский, английский, немецкий, французский, польский, чешский, украинский и болгарский. При необходимости автор обещает добавить любой нужный пользователю язык.
У плагина есть множество других полезных функций и настроек, о которых можно почитать на сайте автора универсального парсера. Там же можно найти ссылки на форумные темы с отзывами покупателей. Автор говорит, что больше всего было отзывов на серче (около 8-9), но тема была удалена модераторами из-за несоответствия правилам.
Теперь скажу о личных впечатлениях. Мне универсальный парсер положительно понравился. Конечно же, это далеко не единственный и не самый навороченный парсер контента. Тем не менее, сочетание цены, качества и функциональности очень приличное. Кроме того, по отзывам покупателей видно, что автор не бросает их в беде, если появляются какие-либо проблемы (или просто сложности) при использовании скрипта. Что касается индексации сайтов, наполненных парсером, то Гоша и Яша их кушают на ура (автора скидывал несколько примеров, если интересно – обращайтесь напрямую к нему).
И напоследок, об одном очень полезном дополнении к универсальному парсеру. Недавно автор разработал плагин, который называется WordPress-DLE конвертер. Название говорит само за себя. Скрипт позволяет экспортировать категории, посты из этих категорий, комментарии к этим постам и пользователей из базы данных блога на WordPress в базу данных сайта на DLE. По сути, в комплекте с WP UniParser данный плагин позволяет получить полноценный универсальный парсер для DLE.
Вот, наверное, и все, что я хотел сказать о WP UniParser. Теперь жду ваших комментариев и отзывов о продукте.
15 Comments
А конкретно кто-то использовал? Хотелось бы реальные отзывы увидеть
[...] информация, именно поэтому вебмастера используют парсеры контента чтобы собирать полезный контент с выдачи поисковых [...]
тоже буду обе тестить, автору спасибо за старания!Ё
Спасибо за обзор, пока писала все вручную, но уже не хватает сил и времени, очень подробно все изложили... Похоже придется испытать обе, потому что блоги на разных платформах...
Вышла вторая версия Datacol AutoTune. Теперь настройка полей для парсинга будет визуальной — просто кликаете во встроенном браузере по элементу и автоматически получаете код для его парсинга. Также добавлена возможность прямого экспорта в удаленную mysql базу данных.
Попробовал скачать демку датакула. Впечатляющая махина, но сложновато разобраться. Хотя видно, что возможности богатые
Легче свой парсер создать для отдельного сайта, и то быстрее будет работать.
да за денежку...сыр можно купить в мышеловке
Все эти парсеры оставляют явные следы в коде страницы так что поисковикам их и вычислять не потребуется .достаточно поставить фильтр и сайт никогда не будет успешным .
я так понимаю за денежку продается этот продукт?)
Zerohold, вы как бы правы, только при тестировании подобных алгоритмов будут улетать в бан еще и тысячи СДЛов
А я не пользовался парсерами. Но после прочтения статьи подумал — а почему бы и нет?
Универсальные парсеры это тема, избавиться от которой будет в ближайшее время сложно.
Но как сообщают с фронтов новый АГС 35 будет выщелкивать такие сайты. Говорят, что научились такое вычислять.
А на Joomla он будет работать
Ну DLE-контент (как правило, варез) можно еще спарсить, но контент с блогов — ни за что чье-то авторское право нарушать! Долой ГС!