Для того чтобы эта идея закрепилась в вашем сознании образно, отсылаю вас к своей статье под названием «9 способов найти девушку во „ВКонтакте“ после общения в ночном клубе» (сайт http://shcherbakovs.com/9sposobov-naity-devushku-vo-vk/). Это будет хорошей подготовкой к теме парсинговых алгоритмов. Идите прочитайте и возвращайтесь — мы опускаемся еще глубже.
На самом деле парсеров в сети «ВКонтакте» довольно много — растущий спрос привлекает все новых и новых разработчиков. Основных, которыми пользуюсь я сам, всего три — «Церебро Таргет», NinjaPepper и Target Hunter.
Пойдем по порядку…
Познакомиться с «Церебро Таргет» поближе можно на сайте церебро. рф или в одноименном сообществе в сети «ВКонтакте». Честно говоря, я бы советовал подписаться на сообщество и провести в нем хотя бы неделю, изучая возможности сервиса, а в перерывах читая кейсы. Для этого даже доступ к сервису покупать не нужно (но если купите — настоятельно рекомендую также доступ к закрытой тусовке пользователей) (рис. 2.24).
Рис. 2.24
Самое главное — разберитесь в функционале. Добейтесь того, чтобы для вас не осталось ни одной непонятной кнопки в сервисе (потому что, скорее всего, именно эта кнопка однажды и сыграет решающую роль в максимизации ваших продаж или их полном отсутствии). В принципе, инструкций самого «Церебро», их видеоуроков и тусовки внутри сообщества вам будет более чем достаточно для старта. Остальное приложится в процессе практики.
NinjaPepper скромнее по функционалу и количеству фанатов, зато умеет парсить не только «ВКонтакте» (как «Церебро Тар-гет»), но и «Одноклассники». По идее, так как «ВКонтакте» и «Одноклассники» представляют собой взаимоинтегрированные площадки, идентификаторы пользователей (ID) одного ресурса можно использовать на другом. Только вот где гарантии, что, если юзер активен в сообществах «ВКонтакте», он будет так же активен в сообществах «Одноклассников»? Нет таких гарантий. А здравый смысл упорно подсказывает, что, скорее всего, будет ровно наоборот. Признаюсь на правах практика: так и случается. Сайт: https://vk.com/pepperninja.
Turget Hunter — наименее понятен интуитивно, имеет репутацию «профессионального» сервиса, зато содержит массу замечательных функций, не реализованных в рамках конкурентных сервисов (типа автоматизации парсингового процесса и сбора пользователей по добавленным аудиозаписям). Познакомиться поближе, воспользоваться пробной версией и прочесть о деталях можно здесь: https://vk.com/targethunter.
Как итог: богу — богово, кесарю — кесарево, для «ВКонтакте» — «Церебро» и Target Hunter, для «Одноклассников» — NinjaPepper. А дальше как уж душа попросит (но в идеале — попробовать все на своем опыте).
Настоятельно рекомендую вам «загуглить» в Интернете файл под названием «Большое сравнение парсеров» (распространяется в Google Docs бесплатно). Авторство неизвестно, но там собрана информация о 14 парсерах, которые сопоставили с точки зрения 112 характеристик. Колоссальная работа. Даже если вы наткнетесь на давно не обновлявшийся файл, уверен, приятных впечатлений вам все равно не избежать.
Парсинговые связки и названия кнопок интерфейса в этой книге могут отличаться от актуально действующих. Поэтому концентрируйтесь на том, чтобы уловить принцип, а не оттенки формулировок.
Честно говоря, чтобы обсудить хотя бы половину возможных (даже только типичных) алгоритмов, нужна еще одна отдельная книга, а то и не одна. Но чтобы пазл в вашей голове приобрел законченный вид, я пробегусь по логике процесса. Следите внимательно…
Предположим, вам нужна аудитория мам из Москвы, у которых есть маленькие дети (наряду с бизнес-аудиторией и аудиторией молодоженов одна из самых востребованных и дорогих аудиторий вообще). Что вы можете сделать?
Вариант 1
1. Собрать 3–5–10 (сколько найдете) активно действующих сообществ по темам типа «Мамочки Москвы», «Современные родители», «Детство — лучший отрезок жизни», «Советы мамам», «Подслушано у грудничков» и т. п.
2. Найти в этих сообществах обсуждения и фотоальбомы для тех мам, которые недавно родили (вкладка «Аудитория сообществ»/«Обсуждения» и «Аудитория сообществ»/«Фотоальбомы» в «Церебро») и спарсить оттуда всех активных.
3. Затем получившуюся базу загрузить в «Поиск аудитории»/«Группы, где есть ЦА» и найти все остальные сообщества, в которых суммарно состоят люди, собранные на предыдущем шаге.
4. Отфильтровать получившийся список минус-словами так, чтобы в нем остались только сообщества, посвященные материнству, заботе о грудничках и т. п., то есть очень и очень целевые.
5. Сохранить список оставшихся сообществ, а затем загрузить его во вкладку «Аудитория сообществ»/«Активности» и спарсить только активных пользователей, допустим, за последние две недели (причем активных за исключением лайков, потому что «лайкать» могут и те, кому просто фотография понравилась).
6. Зайти в «Фильтр баз»/«Поиск по базе» и отфильтровать девушек по возрасту и, самое главное, географии (вам ведь только москвички интересны).
7. Сохранить файл и посмотреть, достаточно ли он велик, чтобы продолжать с ним работу, или процедуру нужно повторить, начиная с третьего шага. В принципе, для нормальной работы вам нужна база примерно от 5000 до 80 000 ID, хотя я вполне эффективно настраивался и на аудиторию из 2000 человек (на аудиторию мам, родивших близняшек, кстати). Очень многое зависит от ниши, ее востребованности, вашего оффера и т. д. Что касается «Одноклассников», на данный момент базы менее 5000 человек сюда физически не загружаются.
Только что мы с вами мысленно прошли, пожалуй, наиболее типичный алгоритм поиска целевой аудитории (причем не очень сегментированный). То есть я совсем не удивлюсь, если точно таким же путем движется еще…дцать игроков московского рынка. В итоге вы начинаете конкурировать в рамках одной площадки за одних и тех же людей (потому что найдены они одним и тем же образом). Тем самым разогреваете аукцион (то есть поднимаете среднерыночную цену на рекламу) и откровенно выматываете целевую аудиторию своим предложением — не вы, так конкуренты. Это, кстати, еще одна причина, почему стоит сегментировать свою ЦА.
Хорошая новость заключается в том, что если вы готовы заморачиваться, то эту же аудиторию (но, скорее всего, другую ее часть) можно собрать и иначе.
Вариант 2. Парсинг — он как комбинация генов: чем родители наградили, тем и будут довольствоваться потомки. Таким витиеватым способом я пытаюсь сказать, что исходное сообщество (или исходная база данных) имеет ключевое значение. Поэтому…
1. Вы можете собрать исходные сообщества не по теме материнства в целом, а, например, по теме любви к мультфильмам. Найти сообщество «Маша и медведь», «Три богатыря», «Миньоны», «Мультимания» и т. п.
2. С помощью вкладки «Аудитория сообществ»/«Активности» можно выбрать всех, кто за последний месяц оставлял в этих сообществах комментарии (то есть активен).
3. Можете зайти в «Фильтр баз»/«Поиск по базе» и оставить в своем списке только девушек, только из нужного региона и только с детьми (конечно, будет погрешность в возрасте детей, потому что парсер соберет всех, у кого в графе «дети» указан хоть кто-нибудь; но с учетом того, что исходные сообщества были посвящены мультфильмам, вряд ли в конечном файле окажется так уж много мам выпускников средних школ).
4. Дальше — уже известная вам процедура распарсивания, которая на примере с «Церебро» начинается с вкладки «Поиск аудитории»/«Группы, где есть ЦА» (шаг 3 в предыдущем варианте).
Юмор в том, что, если вы фактически пройдете сначала первый вариант, потом второй, аудитории не будут повторяться на 100 % (хотя бы только потому, что не все мамы вступают в тематические сообщества про материнство).
Вариант 3. А как вам идея в качестве исходного массива данных брать сообщества, которые представляют детские интернет-магазины или сами выступают как площадка для продажи товаров для грудничков? Думаю, логику вы уже ухватили.
Вариант 4. Отработать лидеров мнений и их подписчиков по вашей теме. Первые фамилии, которые приходят мне в голову (а я не представитель целевой аудитории), — Елена Малышева, Евгений Комаровский, Дмитрий Карпачев… Наверняка ведь их читают те, кому тема резонирует, — значит, и ваш оффер срезонировать может.
Вариант 5. Вариант из неочевидных, но абсолютно необходимых — парсинг сообществ конкурентов. Facebook такое делать не дает, а вот в сети «ВКонтакте» и в «Одноклассниках» есть где разгуляться. Подумайте сами: если подписчики состоят в сообществах ваших конкурентов, значит, у них наверняка есть потребность в том, что вы продаете, — ну так сделайте им предложение, от которого они не смогут отказаться (только спарсите их толком).
Надеюсь, к этому моменту вы уже уловили, насколько разносторонним может быть подход к поиску отобранных сегментов целевой аудитории. Пределов здесь буквально нет, а варианты для парсинга заканчиваются там, где заканчивается ваша фантазия.
Если вы до сих пор не прочитали статью про поиск девушек из клуба — сделайте это прямо сейчас. А теперь задумайтесь: ведь парсить можно не только тех, кто вам нужен, но и тех, кто вам совсем не нужен, — топ-менеджерский состав конкурентов (чтобы они вашу рекламу не увидели) или офферов (тех, кто получил деньги за вступление в сообщество), допустим.
Найдите несколько сообществ, которые точно набиты оплаченными аккаунтами (еще лучше сообщества, из которых офферы продаются), и соберите оттуда буквально всех. Потом распарсите. Снова соберите и распарсите еще раз. В итоге получившуюся базу можно будет добавлять в исключения к каждой рекламной кампании, которую вы настраиваете (чтобы на этих людей реклама точно не откручивалась). То же самое касается и конкурентов или, например, администраторов сообществ по какой-то теме (есть у парсеров и такая вкладка).