Как работать с разрозненными данными о подписчиках (№95)

В прошлый раз мы занимались выбором сервиса для рассылок. Сегодня поговорим о том, как быть, если наши данные о подписчиках сильно разрозненные.

В первую очередь, имею в виду email-адреса, которые могут поступать совершенно из разных источников (но, конечно, не «открытых» источников в интернете, а своих собственных). Сюда же можно отнести прочую информацию, полезную для рассылок — ФИО, дату рождения, историю покупок и т.д.

Исходная ситуация

Часто у маркетолога, только начинающего проект по рассылкам, возникают затруднения с данными: они разбросаны по разным местам, собираются бессистемно, хранятся по-разному и, возможно, часть из них при этом «вылетает в трубу».

Например, данные об онлайн-регистрациях могут лежать в CMS, данные по заказам аккумулироваться в CRM или , заявки через форму обратной связи собираться в корпоративной почте. А сотрудники отдела продаж могут вдобавок вести свою отдельную табличку, в которой перемешаны и регистрации, и заказы, и ещё какие-нибудь контакты из визиток, раздобытых ими на выставках и конференциях.

В таком случае, если данные настолько разрозненные, мы, конечно, не реализуем потенциал email маркетинга на 100%. Скорее наоборот, есть большая вероятность навредить себе — скажем, делая подписчикам ну совсем неподходящие предложения или из-за путаницы в списках отправляя одинаковые письма одним и тем же людям несколько раз подряд:

Два одинаковых письма от Сбербанка в один и тот же день

Чтобы улучшить наши результаты, нам предстоит с этим разобраться.

Работа с данными

Если мы начнём действовать беспорядочно, хватаясь то за одну ниточку, торчащую из общего «клубка», то за другую — скорее всего, только ещё больше всё запутаем. И даже если придём к успеху, то затратим на это слишком много времени.

Поэтому попробуем действовать по определённому алгоритму, который сэкономит наше время и поможет целенаправленно распутать «клубок» до конца.

• Проводим аудит

Начнём, как водится, с изучения текущей ситуации: какие данные у нас есть сейчас, как они собираются и где лежат?

Составим перечень всех источников данных примерно следующего вида:

Перечень источников данных о подписчиках

В первом столбце перечислим все известные нам «хранилища» информации (CMS, CRM, 1С, эксель и т.д.).

Во втором приведём данные, которые в них содержатся (email, ФИО, дата регистрации, количество заказов, средний чек и т.д.).

В третьем столбце дополним эти сведения необходимыми пояснениями в свободной форме:

Разрозненные данные: перечень источников данных о подписчиках

Так у нас сложится какая-то исходная картина, которая сделает наши разрозненные данные понятнее.

• Выгружаем данные

Перед выгрузкой спросим себя: какие именно данные нам сейчас нужны?

Если мы собираемся вести пока только массовые рассылки по всей базе, то вовсе не обязательно собирать много информации — нам вполне достаточно будет связки email+имя (или ФИО, если в базе информация по фамилии-имени не разделена).

Для простоты разберём сначала именно этот случай, самый распространённый. А уже затем усложним себе задачу дополнительными данными.

Делаем выгрузку контактов поочерёдно из каждого источника. Где-то это не составит труда — например, нам понадобится только нажать кнопочку «Выгрузить»:

Выгрузка данных из CRM в файл

Где-то нам понадобится помощь — к примеру, у нас нет возможности делать выгрузки из 1С самостоятельно и придётся обратиться к работающему с системой специалисту.

Где-то данных вовсе не будет в готовом виде, и нам нужно «выковыривать» их, скажем, из заявок, приходивших на корпоративную почту в течение года.

Но в любом случае по итогам всех этих действий у нас появятся отдельные эксель-таблички с email-адресами по каждому источнику, с которым мы работаем.

• Приводим к общему формату

Формат, в котором находятся разрозненные данные из многих источников, может быть различным — где-то это только email-адреса, а где-то таблицы с кучей вспомогательных столбцов вроде даты регистрации, ID и т.д.:

Разрозненные данные: приводим к общему формату в таблице Эксель

Поскольку в конечном итоге мы собираемся объединить все эти таблицы, то для начала просто приводим их к какому-то общему знаменателю.

Убираем лишние столбцы, оставшиеся выстраиваем в одинаковом порядке и называем единообразно (электронная почта → email, ФИО → имя).

Обязательно добавляем столбец «источник», куда внесём название места выгрузки данных: CMS, CRM, 1C

Общий формат базы данных для email рассылок

В дальнейшем эта информация пригодится нам как для учёта темпов роста базы по разным источникам, так и для возможной сегментации.

• Соединяем списки

Приведённые к одинаковому набору и порядку столбцов списки (в нашем базовом случае это будет email+имя+источник), уже нетрудно сложить вместе, просто пристраивая один список «в хвост» другому:

Разрозненные данные: соединяем данные из нескольких источников в единый список

• Чистим от дубликатов

Среди контактов, которые содержат наши разрозненные данные, возможны повторения: например, один и тот же подписчик есть в списках из CMS и 1С. Поэтому воспользуемся удобной опцией эксель, чтобы избавиться от таких дублей:

Разрозненные данные: чистим базу от дубликатов записей

Важный нюанс: вместе с удалённым дубликатом может пропасть и часть информации (о ФИО, об источнике). В случае, когда мы работаем всего с 3-мя столбцами, это не так важно. В дальнейшем, если нам предстоит работать с бо́льшим количеством столбцов, это необходимо учитывать.

• Валидируем

Поскольку email-адреса у нас могут собираться длительное время, да ещё разными способами (в том числе, и через офлайн), то первое, что нам нужно сделать с общим списком — это провести валидацию email, т.е. проверить их качество.

Если в базе по той или иной причине окажется много некачественных email-адресов, это скажется на уровне доставки рассылок (к примеру, мы просто не можем доставить письма на несуществующие ящики). Соответственно, низкий уровень доставки спровоцирует попадание наших рассылок в спам — если сервис рассылки не заблокирует нас за это ещё раньше:

Блокировка аккаунта в Мэйл Чимп из-за низкого качества доставки

Поэтому обязательно проверяем базу с помощью специального сервиса валидации (например, Mailvalidator или Datavalidation).

• Редактируем

После валидации, когда некачественные email-адреса отсеялись, мы можем заняться редактированием оставшейся информации. До этого момента мы бы только нагрузили себя лишней работой, возясь с контактами, которые впоследствии заблокирует сервис валидации.

Поскольку из дополнительных данных у нас пока только имена, то, соответственно, их и редактируем.

Если у нас в столбце ФИО, разделяем его на 3 столбца, перепутанные местами имена и фамилии переставляем, затем фамилии и отчества удаляем (если только не собираемся использовать их в рассылках). Неполные имена, латиницу, прозвища и т.д. также приводим в порядок:

Разбивка ФИО на 3 столбца в экселе

Если в нашем итоговом списке наберётся несколько тысяч контактов, из которых несколько сотен понадобится редактировать — что ж, придётся попотеть или поискать какое-то автоматическое решение. Всё лучше, чем потом промахнуться с именем в письме:

Некорректное имя в базе данных для email рассылки

Картинка от Алисы Киричок

Если контактов десятки и сотни тысяч — это явно не наш случай:)

• Загружаем в сервис рассылок

Конечная цель такого «жонглирования» столбцами и табличками — получить единую, полную, корректную базу данных, в которую сведены контакты из всех наших источников.

Мы можем хранить её в CRM, в каком-то самописном решении — но поскольку речь у нас идёт про рассылки, и мы готовим базу именно для них, то удобно будет сделать местом хранения объединённых данных непосредственно сервис рассылок.

Подготовим его к импорту данных, создав в нём список контактов (адресную книгу, лист — название зависит от конкретного сервиса). В списке заведём нужные нам поля в подходящем формате:

Email (формат «email»),
Имя (формат «текст»),
Источник (формат «текст», «группа», «метка» — также зависит от сервиса).

Затем воспользуемся функцией массового импорта данных в сервис, чтобы загрузить базу:

Разрозненные данные: загружаем приведённую в порядок базу в сервис рассылок

• Запускаем рассылки

Если по собранной из разрозненных источников базе нам предстоит провести первую рассылку, действуем осторожно, потому что помимо качества email-адресов существует ещё немало факторов, которые могут отправить нас в спам:

технические ошибки (некорректная настройка аутентификации, некорректная вёрстка и т.д.),
резкий старт с большим объёмом писем,
неуместное содержание (которое вызовет скачок жалоб на спам).

Поэтому первую рассылку стараемся провести максимально корректно:

выполняем все технические настройки (хорошая книга по теме — «Доставка в Inbox. Уровень бог» Леонида Николаева),
отправляем письма постепенно (10 000 писем не за один день, а, скажем, за неделю),
подбираем предложение, уместное для широкой аудитории + не забываем добавить в письмо заметную отписку, можно прямо в шапку письма:

Больше рекомендаций по первой рассылке также есть в статье
Как работать со старыми базами.

Если мы вели до этого рассылки и просто нарастили свою базу за счёт более тщательного сбора контактов из всех источников, то действуем примерно так же — включаем новые контакты в рассылки постепенно, смешивая их с уже «приработанными» контактами, которые получают наши письма длительное время.

Дополнительные данные

Если мы хотим отправлять не только массовые рассылки, а в наших системах запрятано ещё немало полезных данных — по заказам, среднему чеку, возрасту, полу подписчиков и т.д. — что ж, все их тоже можно подключать к работе.

Ключевое условие здесь: мы собираем данные, которые нам действительно нужны.

Например, если у нас нет плана, как задействовать в рассылках историю покупок, то просто не заморачиваемся на её извлечение из системы. Или — если у нас не найдётся подарка для подписчика-именинника — так ли нам нужно «тащить» в базу дату его рождения?

Лучше для начала составить чёткий план email маркетинга, нарисовать схему писем, и уже исходя из этого собирать данные.

Если мы уже знаем, как распорядиться дополнительной информацией, тогда пользуемся тем же алгоритмом: выгрузка → соединение → чистка…

Но когда у нас в таблицах уже не 3, а, скажем, десяток столбцов, все эти процедуры, конечно, становятся сложнее, и нужно быть большим любителем экселя, чтобы справиться с ними без проблем.

На эту же тематику есть подробная статья
Построение эффективной базы данных для рассылок.

Автоматизация

Если ресурсы позволяют — у нас на проекте есть программист, и он даже готов уделить время нашим задачам — то, конечно, после первичного сбора данных вручную всю последующую передачу информации в сервис рассылок лучше автоматизировать.

Для этого готовим для программиста ТЗ на синхронизацию, а затем тестируем и принимаем финальный результат.

Возможен «комбинированный» вариант, когда часть данных мы передаём по API, а часть продолжаем выгружать вручную. Например,в CMS нам удалось задействовать готовый модуль интеграции с сервисом, а подключиться к 1С нет технической возможности. К тому же, контакты туда поступают из офлайн-точек продаж, поэтому перед загрузкой в сервис их всё равно приходится модерировать.

Если ресурсов на автоматизацию совсем нет, что ж, продолжаем действовать «ручками», проходя все шаги сбора данных с определённой периодичностью (к примеру, раз в месяц).

Это не самое удобное решение, но после первого раза весь последующий механизм экспорта/импорта пойдёт быстрее — и данных будет меньше, и процесс уже отлажен.

Заключение

Почти каждый новый проект начинается с такой вот «чехарды», где участвуют разрозненные данные. В какой-то момент это может сбить с толку.

Но если действовать последовательно, очень скоро в окружающем хаосе наметятся первые следы порядка — и это будет, пожалуй, самым приятным вознаграждением за приложенные усилия:)

[В следующий раз, в новом году, снова обратимся к теме сегментации по полу. Но уже в прикладном ключе — как её делать минимально доступными средствами].

P.S. Ещё больше информации и механик работы с данными для рассылок есть в 4-5 уроках «Email маркетинга под ключ». Если вам интересно глубже исследовать этот вопрос — добро пожаловать на курс! Тем более его основные материалы совершенно бесплатны.

Если вы ещё не подписались на мою рассылку — самое время это сделать 😉