Как провалидировать базу подписчиков (№106)

Прошлый год мы завершили повтором рассылок по неоткрывшим. Этот начнём с разговора о базе подписчиков, а вернее о такой вещи, как валидация email.

Применительно к email маркетингу валидация — это проверка качества email-адресов: не содержат ли они опечаток, доступны ли для рассылок, не являются ли спам-ловушками и т.п.

Валидация email может осуществляться непосредственно при вводе адреса (скажем, в форме подписки), путём автоматической проверки соответствия его базовым условиям — наличие @, домена электронной почты — или даже с помощью интеграции со специальными сервисами валидации, которые могут провести более глубокую проверку в реальном времени. Другой вариант — это валидация базы задним числом, когда уже накопилось какое-то количество контактов, нуждающихся в проверке.

Нас будет интересовать именно последний случай: массовая валидация собранных email-адресов перед запуском по ним рассылок.

О том, когда необходима такая валидация, см. подробнее
База из офлайна: что с этим делать?
Как работать со старыми базами

Зачем нужна валидация

Наличие большого числа некачественных (недоступных для рассылок) email-адресов в базе — характерный признак спамеров. Обычно те не слишком заморачиваются, собирая почты везде, где это только возможно. Из так называемых «открытых источников» вроде разделов «Контакты» на сайтах, с форумов, досок объявлений и прочих мест, где можно разжиться каким-то количеством email-адресов.

Поэтому рассылка по некачественной базе мгновенно напрягает спам-фильтры почтовых провайдеров, а ещё раньше — сервисы рассылок, если таковые используются для массовой отправки писем. Исходя из моего опыта, достаточно > 15% «невалидов» в базе, чтобы получить блокировку в сервисе рассылок / начать испытывать проблемы с доставляемостью во Входящие в различных почтовиках.

Блокировка в сервисе рассылок из-за высокого % отказов

[Остановка рассылок в сервисе MailChimp из-за высокого % ошибок]

К этому добавляются другие «сигналы» для сервисов, которые также вредят доставляемости:

большое количество role-based ящиков типа info@, contact@, sales@ и т.п., также свидетельствующих о некорректных способах сбора базы,

временные почты, созданные для регистрации где-либо, а затем быстро становящиеся недоступными,

спам-ловушки, преобразованные из заброшенных почт реальных пользователей или чистые, намеренно размещённые спам-службами в сети для выявления недобросовестных сборщиков баз (последние особенно вредны для репутации отправителя).

Всё это может оказаться в любой, даже собранной вполне легальными методами базе, если она лежит без дела довольно давно (от нескольких месяцев) или при её сборе не уделялось достаточно внимания проверке качества контактов на входе.

Валидация email-адресов перед рассылками в таких случаях становится необходимым этапом, без которого риски получить проблемы на самом старте становится слишком высокими.

 

Как валидировать email-адреса

Возникает вопрос, как массово провалидировать email-адреса — не вбивать же их по одному в сервисы бесплатных проверок вроде 2ip.ru/mail-checker. Тут на помощь приходят более продвинутые сервисы валидации (email validation service), предназначенные как раз для проверки качества больших баз. Вот некоторые из них:

Рус. Eng.
Epochta.ru/verifier (софт) Datavalidation.com
Mailvalidator.ru Millionverifier.com
Sendpulse.com/ru/features/verifier ZeroBounce
…   …   … …   …   …

(Ещё больше сервисов можно найти, например, в обзорах eSputnik или Roman.ua).

Порядок работы с подобными сервисами достаточно простой:

регистрируем аккаунт в выбранном сервисе,

загружаем туда файл с базой контактов, которые хотим провалидировать,

запускаем проверку и получаем результат через некоторое время (от нескольких минут до часов или даже дней, в зависимости от размера базы).

В результирующем файле сервис добавит к каждому email-адресу свою оценку — стоит ли делать на него рассылку или нет.

Система оценок сервиса Datavalidation

[Система оценок качества email-адресов в сервисе Datavalidation]

Проверка платная — как правило, основанная на числе контактов в базе. Например, валидация 10 000 email-адресов на данный момент обойдётся в 2-3 тыс. рублей (в отдельных сервисах, особенно зарубежных, где тарифы в $, может быть дороже).

Иногда у владельцев бизнеса / руководителей возникает сопротивление при виде выставленного за валидацию счёта. Однако нужно хорошо уяснить, что экономия на данном этапе способна обернуться куда более серьёзными потерями впоследствии, когда рассылка по непроверенным адресам начнёт попадать в спам или вовсе не достигать почтовых ящиков подписчиков. Оплата валидации в данном случае — инвестиция в базу, чтобы этого не случилось.

 

Как выбрать сервис валидации

Сервисов для валидации email-адресов достаточно много. Так что следующий вопрос — как выбрать среди них подходящий?

Во-первых, это зависит от «происхождения» базы. Если большинство в ней составляют отечественные почты — на Mail, Yandex, Rambler — то, по моим ощущениям, проверять её стоит в отечественном же сервисе, который просто лучше умеет работать с такими типами адресов. Если база «западная» — включает преимущественно Gmail, Yahoo, Aol и т.п. — то, пожалуй, здесь нужно ориентироваться на зарубежные сервисами по тем же соображениям.

Механика проверки email в сервисе Mailvalidator

[Механика проверки качества email-адресов в сервисе Mailvalidator]

Второе, на что стоит обращать внимание — это механика проверки, которую анонсирует сервис. В наиболее простых случаях дело ограничивается проверкой синтаксиса (@, домен почты и т.д.) и других технических параметров. Более продвинутые сервисы помимо этого сверяются с большими базами известных невалидных адресов. Такие сервисы выбирать, конечно, предпочтительнее.

Проверить работу того или иного сервиса можно, загрузив туда несколько десятков email-адресов известного качества (с некоторым количеством «невалидов») и посмотрев, что в итоге покажет сервис. Погрешность будет в любом случае, но всё зависит от её размера. Если сервис допустит > 20% ошибок в определении статуса адреса, то я бы призадумался, стоит ли с ним работать.

Из моих личных предпочтений: Mailvalidator.ru для проверки отечественных баз и Datavalidation.com для зарубежных. Оба сервиса в моей практике показали приемлемый % ошибок. При последующих рассылках по базам, проверенным с их помощью, каких-либо проблем из-за большого числа «невалидов» не возникало. Уровень доставки в первых рассылках редко опускался ниже 90%, что не вызывает особых вопросов ни у сервисов рассылок, ни у почтовых провайдеров.

Нюансы валидации

Есть ряд нюансов — типичных вопросов — которые возникают при проведении массовой валидации контактов в первые разы, когда опыт подобных процедур ещё отсутствует.

• Можно ли доверить базу сервису валидации?

Довольно часто встречающееся сомнение, которое касается не только сервисов валидации, но и сервисов рассылок: насколько они надёжно защищены и не произойдёт ли «утечка» данных, загруженных в сервис. Ответ здесь: защищены достаточно надёжно (100% гарантий не даст никто).

Также при регистрации можно ознакомиться с Политикой конфиденциальности, разделом FAQ, прочей доступной документацией и оценить, достаточно ли гарантий предоставляет сервис по защите данных.

• Нужно ли как-то предварительно готовить базу к валидации?

Ответом здесь будет: если не хочется переплачивать, то нужно. Оплата в сервисе происходит за каждый адрес, отправленный на проверку.

Сортировка некачественных email в Экселе

[Предварительный отсев некачественных контактов через сортировку в Эксель]

Поэтому неплохо будет заранее избавиться от дублей, абракадабры, которая иногда встречается среди нормальных email-адресов и т.п. Всё это делается с помощью несложных манипуляций в Экселе.

• Что, если в результатах проверки видны явные ошибки?

Распространённая ситуация: при визуальном просмотре результатов проверки базы мы обнаруживаем корректные по нашему мнению адреса, которые помечены сервисом, как недоступные для рассылок. Это сразу вызывает вопросы.

Обсуждение результатов валидации

[Вероятные ошибки в результатах проверки email-адресов]

Разумеется, при массовой проверке адресов возможны подобные ошибки — слишком много факторов влияют на финальный результат. Однако работа с большими массивами данных предполагает соответствующее к ним отношение. На мой взгляд, не стоит «мельчить», спускаясь на уровень отдельных email-адресов — особенно, если в базе десятки тысяч записей — и выискивая ошибки. Возможно, в каких-то случаях сервис ошибается, но, возможно, ошибаемся и мы, считая корректным адрес, на который давно не отправляли никаких писем.

Так или иначе, если мы заметили какую-то явную ошибку в проверенном файле — просто исправляем её и идём дальше, не зацикливаясь на этом. Нам важно получить не 100% точные результаты проверки (что вряд ли возможно), а приемлемый % ошибок, который не лишит нас слишком многих качественных адресов, но при этом и отсеет достаточное количество некачественных — чтобы мы без проблем сумели провести рассылку.

• Что, если отсеивается слишком много адресов?

По результатам проверки сервис может запросто отсеять 30-50% (и даже более) email-адресов — особенно, если база у нас «залежалась». Лишаться такого количества контактов больно, поэтому возникает соблазн взять в работу не только качественную базу, но и некоторое количество менее качественных адресов — скажем, с неопределённым статусом проверки — чтобы снизить % отсева.

Отсев половины базы в результате валидации email-адресов

[Только 51% всех проверенных адресов признаны доступными для рассылок]

Это вредная практика, которая может свести на нет результаты всей проверки. Работать стоит только с качественными адресами, которые сервис определил точно пригодными для рассылок — сколько бы их в итоге ни осталось от исходной базы. А ко всем отсеянным контактам относиться не как к упущенным возможностям, а как к предотвращённым неприятностям.

• Как быстро можно отправлять рассылку после валидации?

Со временем результаты валидации устаревают (например, какое-то количество адресов, ранее доступных для рассылок, становятся недоступными — переполняются, удаляются и т.п.). Это происходит не очень быстро, тем не менее, желательно валидировать базу «вплотную» к предстоящей рассылке — за несколько дней / неделю — чтобы результаты проверки были наиболее «свежими» и актуальными.

 

Итого

Исходя из вышесказанного, складывается следующий порядок валидации базы:

Проводим «аудит» базы перед запуском рассылок — какого она размера, как давно собиралась, какими способами — и принимаем решение, нужна ли валидация.

Если валидация нужна, подбираем сервис для этого и, возможно, тестируем его на небольшой «порции» адресов известного качества.

Готовим базу перед загрузкой в сервис — удаляем дубликаты, сортируем и убираем откровенный «мусор» вроде абракадабры, адресов без @ и т.п.

Загружаем базу в сервис и проводим валидацию.

Берём в работу только качественные адреса — остальные (сколько бы их ни набралось) откладываем в сторону.

Не затягиваем с первой рассылкой по базе, чтобы результаты проверки оставались актуальными.

Имея ввиду такую последовательность шагов, можно спокойно приступать к валидации. Ну а о том, что делать дальше, как провести первую рассылку по проверенной базе, уже был разговор ранее →

[В следующей статье рассмотрим сегментацию базы, как часть планирования email маркетинга].

P.S. Ещё больше информации о грамотном ведении рассылок вы найдёте в моём курсе «Email маркетинг под ключ». Курс включает 10 бесплатных уроков, которые я отправлю вам по электронной почте.

Также, если вы ещё не подписались на рассылку моего блога — самое время это сделать 😉