Key Collector —
ваш личный помощник при составлении семантического ядра

Сбор Yandex.Wordstat через прокси-серверы низкого качества

ИНСТРУКЦИЯ И ВИДЕОМАТЕРИАЛЫ ДАВНО УСТАРЕЛИ И НЕАКТУАЛЬНЫ. МЫ НЕ РЕКОМЕНДУЕМ ПОВТОРЯТЬ ЭТИ НАСТРОЙКИ НА СЕГОДНЯШНИЙ ДЕНЬ. ПОКАЗАННЫЕ В ВИДЕОФАЙЛЕ СЕРВИСЫ ПРОКСИ-СЕРВЕРОВ НЕАКТУАЛЬНЫ. МЫ НЕ ДАЕМ НИКАКИХ СОВЕТОВ ВЫБИРАТЬ ИМЕННО ЭТИ СЕРВИСЫ.

Ранее мы публиковали инструкцию по скоростному сбору статистики Yandex.Wordstat через большое количество прокси-серверов низкого качества.

Один из пользователей модифицировал предложенные настройки на тот случай, если абсолютно чистых прокси-серверов нашлось немного, но существенная часть из них находится под капчей.
Как утверждает пользователь, за 8 часов работы при данных настройках ему удается собирать частотности для более чем 10 000 фраз.
При этом уходит около 600 руб. на оплату услуг сервиса распознавания капчи.

Основу метода составляет использование сервиса автоматического распознавания капчи Antigte.com. Итак, если вы получили доступ к большому количеству публичных (не выделенных) прокси-серверов из подборок, то необходимо произвести следующую настройку.

Основная часть настроек на этом заканчивается. Теперь нужно лишь найти большую подборку относительно рабочих прокси-серверов (свыше 400-500 штук), добавить их в программу на вкладке "Настройки - Сеть" и выполнить их проверку в упрощенном режиме через Yandex.Wordstat. Важно использовать именно упрощенный режим, т.к. он автоматически проверяет на предмет наличия блокировки прокси-сервера.

Сам пользователь, предложивший данный метод, выполняет поиск прокси-серверов на сервисе HideMe.ru, однако следует понимать, что после публикации данной инструкции их прокси-серверов может не хватить на всех желающих (что уже наблюдалось после публикации прошлой инструкции), поэтому рекомендуется поискать и другие места.

Если вы все же хотите воспользоваться прокси-серверами HideMe.ru, то пользователь, предложивший данный метод, советует использовать следующие параметры отбора прокси-листа.

Обращаем ваше внимание, что предлагаемые значения параметров являются крайне субъективными и зависят от конкретных условий работы программы (скорость доступа в Интернет, производительность ПК, уровень качества прокси-серверов, реакция сервиса Yandex.Wordstat).

Данные инструкция создана для тех, кто хочет снимать данные именно через бесплатные или крайне дешевые прокси-сервера, т.к. настройки нацелены на достижение максимальной скорости сбора, а не сохранности работоспособности прокси-серверов. Вы можете попробовать подобрать оптимальный для ваших условий таймаут ожидания ответа от сервера, количество потоков и задержки.