Все знают о существовании HR-аналитики, многие хотят иметь что-то подобное в своей организации, кто-то уже попробовал, а часть компаний успела разочароваться. Почему? Ответ прост — качество услуг от внешних провайдеров не удовлетворяет потребностям рынка. В этой статье мы поговорим о некоторых проблемах, возникающих при работе с данными.
Так уж случилось, что HR-аналитика, как и вся область Data Science и Machine Learning, на данном этапе развития находится на пике популярности в Gartner’s Hype Cycle. Что это значит? Цикл популярности Гартнер –– модель, которая описывает популярность технологии и ожидания от ее использования. В ней есть всего один максимум — пик завышенных ожиданий, и находится он в самом начале цикла — технология появляется, в нее все начинают верить и ждать от нее невероятного. Затем приходит разочарование, и дальше сообщество уже свежим взглядом оценивает, как можно ее применять. Таким образом, современная аналитика все еще находится на пике завышенных ожиданий, что свидетельствует о незрелости технологии — отсутствии единых стандартов, единого языка и семантического поля. Как правило, современная аналитика базируется на методах, а не методологии, что очень характерно для свежих областей. Что это значит? Можно мастерски проанализировать собранные данные, вот только может оказаться, что они не релевантны бизнес-запросу, а еще обнаружится много каких-то пробелов в заполнении, да и расчеты зачастую проводятся так, что потом конечный пользователь не знает, как извлечь пользу из полученных результатов. Зачастую и представлено все это не в том формате, в котором хотел бы видеть заказчик.
Проблема возникает из вполне понятных источников — аналитика сейчас находится на стадии бурного развития и популяризации, что порождает активное развитие услуг. Консалтинговые компании осознают, что потребность появляется, а рынок не покрыт. Рабочих рук не хватает, для проведения статистического аудита нанимают вчерашних (или сегодняшних) студентов технических ВУЗов, бросая их на амбразуры проектов из «реального мира». При этом, как правило, такие подрядчики редко понимают специфику данных, с которыми работают. Для них это просто цифры — они могут отражать удовлетворенность сотрудников заработной платой, объем космического мусора в стратосфере, KPI по фроду менеджера по банковским продуктам, количество нерп на Байкале — методы работы с цифрами будут одни и те же. И это путь весьма классический, но, к счастью, в настоящее время все менее распространенный.
Как следствие, мы имеем серьезную проблему — низкую технологичность оказываемых услуг. Что делать? Благо, само явление аналитики не ново, и разработаны различные стандарты аналитического цикла, которые проверены годами и практикой, хорошо задокументированы, но оставляют неограниченный простор для свободы самого процесса анализа (ключевое здесь — что логика процесса остается жесткой). К таким технологическим циклам можно отнести CRISP-DM, KDD, SEMMA, IMPACT и ряд других менее распространенных практик. Для чего они нужны? Все просто — это общая канва методологии построения аналитического исследования. Рассмотрев цикл на примере модели CRISP-DM, мы поймем, на каких этапах можно подстелить соломку, чтобы ваша аналитика принесла максимум пользы для компании. Сама методология является стандартом, который был впервые представлен в 1996 году в Брюсселе. После этого стандарт несколько раз дорабатывался, и в настоящее время он выглядит как шестиступенчатый итеративный цикл — осознание проблемы и взвешивание ситуации, сбор данных, подготовка их для анализа, построение моделей, проверка их работоспособности и внедрение в практику. А затем все по новой, поскольку происходит сдвиг парадигмы управления от интуитивного принятия решений к управлению компанией на основе данных, что заставляет анализировать огромные их пласты. Мы обрисовали общий вид цикла, теперь попробуем углубиться в детали.
Пройдем последовательно все шаги на примере реального кейса. Сначала необходимо провести первичную коммуникацию с заказчиком. Понять, как он видит проблему, погрузиться в специфику бизнеса, оценить, какие есть ресурсы (и временные, и технические). После чего можно уже переходить на более детальное описание желаемого результата и составление технического задания, чтобы зафиксировать все шаги. К примеру, мы приходим в банк. Заказчик — руководитель HR-департамента — сообщает нам, что текучка в банке колоссальная, ее необходимо снизить. Как известно, цель должна быть достижима и конкретна (и вообще, лучше всего, чтобы она соответствовала SMART-методологии). В процессе диалога выявляется более конкретный запрос. Оказывается, что заказчик предполагает, что сотрудники могут быть не слишком удовлетворены условиями труда. Это уже более реальный запрос — нам необходимо связать удовлетворенность сотрудников различными аспектами их трудовой деятельности и спрогнозировать их отток. Далее уточняем, есть ли какие-либо данные относительно удовлетворенности персонала. Выясняется, что ежегодно в компании проходит мониторинг удовлетворенности персонала, и очередная итерация будет через месяц. На основании этой информации решаем, что стоит дождаться нового мониторинга, а пока заполняем оставшиеся белые пятна и отправляемся писать ТЗ.