Куат Сандалов, Казахтелеком: вам нужна работа с данными, даже если у вас нет ни одного программиста
Интервью с директором департамента бизнес-решений АО «Казахтелеком» о преимуществах и проблемах Big Data.
Чем дольше существует компания, тем больше у нее накоплено данных. Куат Сандалов, директор департамента бизнес-решений и инфокоммуникаций АО «Казахтелеком», в интервью Profit.kz рассказал, как национальный оператор использует информацию и где берет специалистов по Big Data.
— Куат, под большими данными понимают разные вещи. Как вы для себя определяете понятие Big Data?
— Действительно, единой дефиниции — что такое большие данные — не существует. Для меня, как и для многих других, Big Data — это скорее подход к работе с информацией, когда можно собрать разного рода источники воедино и выявить какие-то тренды, используя механизмы машинного обучения, вводя часто неструктурированные данные на входе. Существует также понятие характеристик больших данных — сначала это было 3V: Volume (Объем — данные исчисляются в терабайтах и петабайтах), Variety (Разнообразие — данные поступают из самых разнообразных источников в различных форматах), Velocity (Скорость — данные необходимо быстро обрабатывать). На сегодняшний день характеристик V намного больше. С моей точки зрения, работа с данными — это даже не тренд, без этого бизнесу сегодня просто невозможно выжить. Конкуренция заставляет заниматься анализом данных. Есть известная цифра — ежегодно количество данных в интернете увеличивается на 40%. Можете себе представить, какие нужны мощности, человеческие ресурсы, чтобы справляться с их анализом без применения технологий управления большими данными. Количество данных увеличивается, оцифровывается много аналоговой информации. И это все очень важно для принятия бизнесом решений. Многие компании в мире из самых разных отраслей занялись своими данными: ритейл, телеком, интернет-бизнес, промышленность… Даже такой вид бизнеса, как металлургия — вроде, сугубо «аналоговый» — пришел к тому, что нужно использовать Big Data в работе.
— Есть ли такой вид деятельности, где это, скорее, не нужно?
— Я даже не могу подобрать такой пример. Даже если у вас единственный программист и интернет-магазин с одним клиентом в день, у вас уже есть, по сути, CRM, уже есть данные с временным рядом. У вас уже есть какие-то типовые характеристики клиентов. И на таком маленьком масштабе уже видна потребность в анализе информации. Это прогресс — от этого не убежишь. Мир погружен в работу с данными. Сейчас на Западе появляются примеры, когда в супермаркетах устанавливают электронные ценники и цены на товары меняются в зависимости от времени на часах. Это то, что называется deep dive. И чем дальше, тем больше таких историй мы будем встречать.
— Как «Казателеком» работает с большими данными?
— Еще до того, как везде стал появляться термин Big Data, «Казахтелеком» работал с биллинговыми данными, с лицевыми счетами и так далее. И вся эта информация накоплена, она есть. Мы смотрим на то, какой тарифный план у клиента и отслеживаем его лояльность по отношению к пакету услуг, который он получает. Мы анализируем данные и выявляем профили абонентов, которые, вероятно, не вполне удовлетворены. И мы действуем проактивно, делаем встречное предложение. То есть мы стремимся к тому, чтобы каждый наш клиент получил наиболее релевантные предложения и удовлетворил свои потребности. И при этом чтобы использовал полностью услуги, за которые он платит. То же самое по борьбе с оттоком. Если мы видим, что есть какие-то профили абонентов, которые склонны к оттоку, мы начинаем анализировать: во-первых, почему это происходит, во-вторых, что мы должны изменить, чтобы удовлетворить эту группу. Мы стараемся сделать правильные выводы, чтобы выросла клиентская удовлетворенность нашей работой. Мы ищем шаблоны поведения — когда люди переходят с одного тарифного плана на другой. И это уже работает.
«Казахтелеком» — это довольно, скажем так, зрелая структура. Соответственно, у нас очень много ИТ-систем, процессов, процедур, которые были внедрены довольно давно. И сегодня компания проходит через процесс цифровой трансформации. Мы уже давно работаем над централизацией данных. Мы всегда работали над управлением мастер-данными. Но с учетом размера компании, того, что мы оперируем по всей стране, нашего немаленького штата, можно сказать, что мы достаточно быстро идем в сторону упрощения процедур и централизации работы с данными.
— Есть какие-то планы по монетизации данных?
— Действительно, многие телекоммуникационные компании в мире используют свои данные для того, чтобы их монетизировать. Накоплено очень много информации об абонентах. Самая ценная информация — у сотовых операторов, потому что они видят, когда и как абоненты пользуются мобильным телефоном, где они это делают, у тих также есть в распоряжении биллинговая информация. На базе этих данных можно создавать профили, которые могут оказаться очень полезными для внешних компаний. И сотовые операторы, дочерние компании «Казахтелекома», предоставляют такого рода услугу. В действительности, это может быть очень полезно, например, для акиматов при планировании. Ведь, используя данные, можно создавать тепловые карты, которые показывают, где сосредоточено больше жителей, в какое время люди находятся в конкретных точках. Причем, можно увязать это с возрастом абонентов и сделать выводы о том, есть ли смысл строить в конкретном месте новые школы, детские сады, поликлиники или спортивные объекты. То же самое по пробкам — их на тепловых картах очень хорошо видно. Можно видеть выезды из города, въезды. Сфер применения очень много.
— Вы уже упомянули цифру — ежегодный рост количества информации на 40%. На специализированных конференциях можно услышать, что компании уже не знают, что с этой информацией делать, что их накрывает вал данных…
— На самом деле проблема не в количестве данных, а в том, каким образом эти данные появляются, как хранятся — в структурированном виде или нет. На Западе уже довольно давно большие компании осознали потребность в необходимости управлять данными. Там в правлении компаний распространена должность CDO — Chief Data Officer. У нас же часто бывает, что разные отделы или департаменты компаний генерируют свои данные: финансовый, маркетинговый, коммерческий, юридический, административно-хозяйственный. И у каждого свои базы. У айтишников есть устойчивое выражение: автоматизация хаоса приводит к автоматизированному хаосу. Если собирать данные в абсолютно разрозненном виде или от случая к случаю, хранить в разных форматах в разных местах, в этом случае и растет вал данных, образуется лавина информации. И с этим действительно сложно иметь дело. Когда же есть четкие правила, как с данными работать на входе, как с ними обращаться, то тогда они превращаются в конкурентное преимущество компании. Важно не то, что объем данных растет, а то, что многие компании не задумываются, что им делать с этим все возрастающим количеством информации. Но даже если есть большой объем неструктурированных данных, с этим можно и нужно работать, потому что именно в условиях неопределенности машинное обучение показывает результаты, хорошо просчитывает информацию, дает возможность и data-аналитикам, и бизнес-аналитикам делать выводы. Тут можно провести такую аналогию. Допустим, у астрологов все люди поделены на 12 типов. А потом вы проводите машинное обучение, и оказывается, что у вас 12 тысяч сегментов. Также в маркетинге: маркетологи могут предложить ограниченное число профилей, машины выявляют намного больше шаблонов поведения. И это позволяет подобрать ключ к каждому из клиентов. И самое главное тут — выдвигать гипотезы, перепроверять их. Big Data позволяет расставить приоритеты, выявить действительно важные направления, где нужно приложить усилия.
— По всему миру ужесточается регулирование, связанное с хранением и использованием данных. Не остановит ли это развитие этой сферы?
— Это естественный эволюционный процесс общества. Идет осознание того факта, что данные имеют ценность, и очень высокую — кто владеет информацией, тот владеет миром. И поэтому появляется регулирование. Возьмите как пример GDPR — европейские правила регулирования. Как вы, наверное, знаете, компаниям давалось три года, чтобы привести свои системы в порядок. Все компании, которые работают в Европе, соответствуют сегодня GDPR. Вы можете зайти в настройки Facebook и скачать всю информацию, которую компания о вас знает. И это правильно. С регулированием не надо бороться. Если есть требования — надо им соответствовать. «Казахтелеком», в свою очередь, полностью соответствует всем требованиям, которые предъявляются нашим государством. Мы не имеем права передавать персональные данные. Но мы можем сами делать таргетированные маркетинговые кампании, исходя из профилей. Мы можем на обобщенных данных давать рекомендации по планированию тех же инфраструктурных объектов, например.`
— Как в Казахстане обстоят дела со специалистами по большим данным?
— Откровенно говоря, очень сложно и очень дорого найти сегодня хорошего профессионала, который занимается большими данными. У них высокие зарплатные требования и их очень немного. В этой ситуации тяжело конкурировать с нефтяными, ИТ-компаниями и иностранными корпорациями, которые тоже переманивают лучших казахстанских специалистов. Поэтому «Казахтелеком» выбрал для себя такой путь: мы работаем со студентами Назарбаевского университета, МУИТа, КБТУ и других вузов, начиная с 3-4 курсов. Мы берем их на стажировку, и тех, кто показывает лучшие результаты, приглашаем в штат. В вузах теоретическая подготовка по большим данным достаточно серьезная, практическую же часть предоставляем мы. Людям, которые увлечены работой с большими данными, очень интересно заниматься реальными проблемами. И мы видим, что это сочетание зрелости компании и молодости вчерашних студентов приносит плоды.