A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента

Список разделов Продвижение сайта / Поисковая оптимизация SEO

Описание: продвижение сайтов

Сообщение #51 A-Parser Support » 25 января 2019, 10:13

1.2.387 - улучшенный Просмотр логов, новый парсер Яндекс SafeBrowsing, улучшения в JS парсерах
Изображение
Улучшения
  • Улучшение Просмотра логов:
    • Фильтр по неудачным/выполняющимся задачам
    • Сортировка по времени выполнения
    • Поддержка пагинации и поиска по логам
    • Отображение парсера и запроса
  • Добавлен новый инструмент tools.memory - key/value хранилище в памяти
  • Добавлен новый парсер Изображение SE::Yandex::SafeBrowsing, который позволяет проверить сайт в блэклисте Яндекса
  • В ИзображениеSE::Google::Trends реализована возможность сравнивать данные по ключевым словам
  • Улучшения в логике ИзображениеShop::Amazon
  • Улучшена стабильность JavaScript парсеров (движка v8)
  • JS парсеры: добавлен метод .addElement, который позволяет заполнять массивы в results более удобным способом
  • JS парсеры: добавлена опция resultArraysWithObjects для this.parser.request, которая позволяет возвращать массив объектов в результатах при вызове другого парсера
  • JS парсеры: добавлено кэширование DNS ответов

Исправления в связи с изменениями в выдаче

Исправления
  • Исправлена обработка пустых запросов в JavaScript парсерах
  • Исправлен вывод картинок в лог, проблема появилась в одной из предыдущих версий
  • Исправлена работа с некоторыми видами прокси
  • Исправлена работа опции Stop when found в ИзображениеSE::Yandex::Position
  • В ИзображениеSE::Yandex при получении ошибки от антигейта не менялись прокси
  • Исправлен парсинг ссылок на потенциально опасные сайты в ИзображениеSE::Yandex
  • JS парсеры: исправлена работа check_content с регулярными выражениями, в которых содержится кириллица
  • JS парсеры: исправлено зависание потоков при использование tls
  • JS парсеры: множественные исправления в работе сокетов
A-Parser Support
Автор темы
Репутация: 0
С нами: 1 год 9 месяцев

Сообщение #52 A-Parser Support » 15 февраля 2019, 13:37

Видео урок: Создание JS парсеров. Использование Node.js модулей
Продолжение цикла уроков по созданию JavaScript парсеров. В этом уроке показано как использовать Node.js модули при написании собственных парсеров.
Изображение
В уроке рассмотрено:
  • Работа с Node.js и Node package manager (npm)
  • Первый запуск npm, установка модулей (пакетов)
  • Использование модулей при создании JS парсера
  • Ресурсы для работы с npm
Ссылки:
  • https://npmjs.com/
  • https://learn.javascript.ru/screencast/nodejs
  • https://nodejs.org/
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
A-Parser Support
Автор темы
Репутация: 0
С нами: 1 год 9 месяцев

Сообщение #53 A-Parser Support » 26 февраля 2019, 16:20

Сборник рецептов #30: оценка страниц, форматирование дат и парсинг дропов
30-й сборник рецептов, в котором опубликован пресет для оценки сайтов с помощью open source инструмента Lighthouse, рассмотрен способ форматирования дат в парсере SE::Google::Trends SE::Google::Trends, а также показан способ поиска удаленных доменов. Поехали!

Оценка страниц с использованием Lighthouse
Еще один сервис по оценке сайтов, на этот раз от Google. С его помощью можно оценить веб-страницу по 4-м критериям: Performance, Accessibility, Best Practices и SEO. Пресет доступен в нашем Каталоге по ссылке выше.
Изображение

Форматирование даты в парсере SE::Google::Trends
В A-Parser есть парсер, который позволяет собирать данные из Google Trends. Но даты в этом парсере возвращаются в формате Unixtime, что немного усложняет анализ получаемых данных. По ссылке выше показан простой способ преобразования дат к более удобному виду.
Изображение

Парсер expired domains
Пресет для поиска и сбора дропов, а также их характеристик с сайта expireddomains.net. В качестве запросов нужно указывать ключевые слова, которые должны быть в доменном имени.
Изображение

Еще больше различных рецептов в нашем Каталоге!
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
A-Parser Support
Автор темы
Репутация: 0
С нами: 1 год 9 месяцев

Сообщение #54 A-Parser Support » 8 марта 2019, 13:45

1.2.434 - множество улучшений и новых возможностей в парсерах, оптимизация работы, поддержка SOCKS4
Изображение
Улучшения
  • В ИзображениеSE::Yandex добавлен парсинг значков
  • В ИзображениеSE::Google::Modern добавлена опция Disable autocorrect, которая позволяет отключить автоисправление Гугла и парсить выдачу именно по указанному запросу
  • В ИзображениеSE::Yahoo добавлен выбор страны, языка и Safe Search, обновлен список доменов
  • В ИзображениеNet:: DNS добавлена возможность выводить записи любого типа
  • В Изображение Rank::MajesticSEO добавлена проверка контента и поддержка сессий
  • Значительно улучшенИзображениеSE::Google::Suggest, добавлены новые возможности
  • В ИзображениеSE::IxQuickдобавлен параметр Family filter, позволяет выбрать уровень фильтрации
  • В ИзображениеShop::Amazon добавлена возможность парсить количество продавцов для каждого товара
  • Теперь в ИзображениеSE::Yandex при получении 404 кода ответа парсер будет повторять попытку, также улучшена проверка контента
  • Теперь вИзображениеRank::SEMrush при получении 403 кода ответа прокси будет баниться
  • Добавлена поддержка SOCKS4 прокси
  • Оптимизирована загрузка и сохранение конфига и файлов заданий
  • Улучшена скорость загрузки JS парсеров
  • Уменьшено использование памяти в JS парсерах
  • Улучшение производительности при использовании сокетов в JS парсерах
Исправления в связи с изменениями в выдаче
Исправления
  • В SE::Google::Modern исправлена проблема, при которой запрос считается неудачным при использовании Parse not found
  • Исправлена обработка пустой выдачи в ИзображениеSE::Yandex
  • Исправлена проблема, когда SE:: DuckDuckGo не парсил запросы в которых больше 1 слова
  • JS парсеры: исправлена работа setTimeout на Windows
  • Исправлен ряд ошибок, которые появились в процессе оптимизации парсера
A-Parser Support
Автор темы
Репутация: 0
С нами: 1 год 9 месяцев

Сообщение #55 A-Parser Support » 19 марта 2019, 14:57

Сборник статей #7: сохранение в xlsx, работа с API и обзор методов автоматизации
7-й сборник статей. В нем мы научимся сохранять результаты в виде Excel файлов, продолжим изучение работы через API, а также ознакомимся с 5-ю способами автоматизации последовательного выполнения нескольких заданий. Поехали!

Сохранение результатов в формате Excel (.xlsx)
Вывод результатов в виде xlsx файлов (стандартный формат Excel) - это очень популярный вопрос среди пользователей A-Parser. Ранее такой возможности не было, но с добавлением поддержки Node.js модулей это стало возможным. Поэтому мы публикуем статью, в которой показан реальный пример парсинга с сохранением в Excel. Ознакомиться со всеми подробностями можно по ссылке выше.
Изображение

Работаем с API, часть 2
Это вторая часть из цикла статей по работе с A-Parser через API. В ней на примере парсинга e-mail будет рассмотрен метод addTask. Все детали - по ссылке выше.
Изображение

Обзор вариантов последовательного выполнения нескольких заданий
Очень часто возникают задачи, решение которых требует использования возможностей сразу нескольких разных парсеров и при этом результаты работы одного нужно передавать в следующий. А-Парсер - это очень гибкий инструмент, поэтому существует сразу несколько способов, как автоматизировать последовательное выполнение нескольких заданий, при этом максимально автоматизируя работу и повышая производительность. Описание всех возможных методов читайте в обзоре по ссылке выше.

Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
A-Parser Support
Автор темы
Репутация: 0
С нами: 1 год 9 месяцев

Пред.

Вернуться в SEO

cron