DAMA Kazakhstan 2024: при работе с данными важны и процессы, и технологии
6 сентября в Алматы прошла конференция по управлению данными DAMA Kazakhstan 2024, ключевой темой которой стало управление данными.
Представители бизнеса и госсектора собрались, чтобы обсудить Data Governance как новую корпоративную функцию. Мероприятие открыл Дмитрий Цой, президент DAMA Kazakhstan. Он отметил, что основные задачи конференции — обмен опытом и нетворкинг.
«Мы являемся площадкой для интеграции между экспертами и поставщиками в комьюнити data-менеджмента. Основная тема конференции — это управление данными и все, что связано с этой тематикой. Сейчас проводится очень много разных мероприятий. Фишка нашей конференции в том, что мы строим ее около одной темы. У нас есть рабочий комитет, который внутри этой темы выбирает какую-то актуальную подтему. В этом году это — Data Governance», — отметил Дмитрий Цой.
Сегодня у компаний очень много данных, и ими нужно грамотно управлять. Растут объемы данных, плюс развиваются технологии обработки данных, вычислительные мощности, а также сами алгоритмы. Стремительно развивается искусственный интеллект. И во всей этой истории данные являются фундаментом. Поэтому данные — наиболее актуальный для всех компаний аспект развития.
«В Казахстане заметно растет уровень зрелости компаний в управлении данными. По нашей оценке, уже много компаний имеет направление CDO, развивает Data Governance. И для конференции мы как раз искали компании с высоким уровнем зрелости, чтобы они поделились своим опытом», — пояснил президент DAMA Kazakhstan.
С приветственным словом к участникам обратился Куанышбек Есекеев, советник Президента РК. Он напомнил, что основная часть управленческих решений экономического и социального характера принимается на основе данных.
«Развитие банковского сектора, развитие всех сфер государственных услуг, в чем наша страна является лидером, основано на том, что мы собрали самые крупные базы данных физических и юридических лиц. Это позволяет очень активно оказывать государственные сервисы в цифровом виде. И это стало возможным благодаря тому, что государство очень четко отработало вопросы с данными по физическим и юридическим лицам, различным реестрам и так далее. Поэтому госуслуги сейчас являются базой для дальнейшей цифровизации. Сейчас уже идет другой этап — сбор больших данных, создание дата-хранилищ и, в принципе, правильное управление данными. Сейчас этот тренд для цифровизации является основным», — прокомментировал для Profit.kz важность темы конференции Куанышбек Есекеев.
По его словам, подобные конференции позволяют объединить усилия государства и рынка, чтобы управлять данными грамотно. Такие конференции являются частью большой и очень важной задачи, которая стоит перед всем государством — это прозрачность процессов и качество управления.
«Я думаю, что каждый шаг, который делают сейчас и коммерческие, и государственные структуры в этом деле, позволяет улучшить качество жизни и качество работы каждого человека и государства в целом. Вы знаете, что в своем недавнем послании Президент поставил задачу внедрить искусственный интеллект в eGov. Сейчас идет работа над языковой моделью, которая позволит нам подойти к использованию ИИ. Очень важная задача, которую поставил Глава государства — создание собственной языковой модели. И как только языковая модель заработает, основная часть услуг в eGov будет оказываться на основе искусственного интеллекта. Я думаю, что отрасль, связанная с данными, перешла в новый формат, и уже ни одна компания и ни один госорган не обходится без данных. Конечно, таких петабайтов данных, которые сейчас генерируются в телекоме, у госорганов нет. Но в то же время основная часть данных, которая дается госорганами, является основой очень многих ныне существующих приложений. Например, банковский сектор пользуется данными, связанными с социальными выплатами. И такая корреляция между государственными данными и коммерческими структурами позволяет очень быстро и очень качественно создавать новые услуги. Государство тоже сейчас работает над Data Governance. В каких-то госорганах эта работа действительно идет очень успешно, в каких-то госорганах требуются доработки, но в целом проблема управления данными стоит на первом месте», — отметил Куанышбек Есекеев.
Рустем Бигари, генеральный директор Центра поддержки цифрового правительства, подчеркнул, что Казахстан занимает восьмое место в мире по электронным сервисам, но и задел для работы еще большой — огромные массивы данных только предстоит оцифровать. Однако уже имеющиеся данные помогают, например, банковскому сектору делать скоринг-системы, бороться с мошенничеством.
План реализации функции Data Governance в государственном озере данных представил Дмитрий Мун, и.o. председателя правления АО «Национальные информационные технологии». Он также осветил кейсы, реализованные на основе данных — Цифровую карту семьи, мониторинг деятельности монопольных организаций, мониторинг экологического состояния окружающей среды и др.
В рамках панельной сессии участники конференции обсудили новый тренд — влияние искусственного интеллекта и его роль в управлении данными. Компании хотят получать от этого экономический эффект, в связи с чем роль руководителей по управлению данными возрастает.
О роли дата-офицеров рассказал Валех Набиев, Chief Data Officer, PASHA Holding (Азербайджан). Он подчеркнул, что подход к работе с данными и участие CDO в управлении сильно зависит от уровня зрелости организации.
«Мы для себя долго пытались найти формулу того, как нам вообще нужно к этому вопросу подходить и нужен ли вообще CDO. В итоге мы поняли, что для достижения той самой цифровой трансформации, о которой мы говорим последние несколько лет, роль данных и роль CDO — ключевая. Роль CDO — это постоянный диалог с бизнесом, с руководством организации, с вопросом о том, что же вы, коллеги, хотите сделать», — говорит Валех Набиев.
Подробнее стратегию PASHA Holding осветил Ниджат Агаммедов, Data Governance Senior.
Об институте CDO в Банке ЦентрКредит рассказала Рубина Лозовая, CDO, вице-президент по управлению данными и розничному риск-менеджменту АО «Банк ЦентрКредит». Она подсветила ключевые моменты, на которых делается фокус, а также разобрала вопросы получения данных и работы банка с кредитными бюро и агрегаторами.
«Сейчас, спустя четыре года с начала работ по построению системы работы с данными, я могу сказать, что у нас есть подтвержденный эффект от использования данных, от использования модели искусственного интеллекта. То есть, мы можем сказать, что, допустим, на триллион выдач эффект в прибыли от использования модели искусственного интеллекта составляет где-то в среднем 50 миллиардов. То есть, при выдаче в 3 триллиона, которые сейчас есть в банке, 150 млрд — это подтвержденный эффект. Очень важно для CDO в первую очередь считать именно эффекты, которые „садятся“ потом в финансовый результат», — считает Рубина Лозовая.
Об опыте Jusan Bank рассказал Ержан Малимбаев, Chief Data Officer ГК Jusan. Сейчас Jusan находится в процессе трансформации своей экосистемы, и управление данными помогает выстроить стратегию и понять, какие архитектурные решения необходимы.
«Ни для кого не секрет, что Jusan Bank является, наверное, единственным банком, который прошел очень много слияний и реструктуризаций. На сегодняшний день мы видим, что есть много разрозненных данных, которые собирались и использовались по-разному в каждом банке. И здесь, как раз, Data Governance нужен в первую очередь. Потому что мы видим, что клиентская база очень большая, из них активных клиентов не так много. Но имея эти данные, мы можем, соответственно, возобновить отношения с нашими клиентами. Мы организовали новый блок по управлению данными, и акционеры, руководство банка, наши дочерние и сестринские компании — все прекрасно понимают, что нужно строить единое хранилище, где будут собраны все данные Группы компаний, и их можно будет использовать для всех. Мы идем по той стратегии, что на сегодняшний день банк должен не только продавать какую-то банковскую услугу. Банк должен формировать и закрывать жизненную ситуацию клиента. А для этого нужно иметь большой набор данных, нужно понимать информацию о клиенте, его потребности, его желания. Знать, где он бывает, чем занимается и так далее. Над этим мы сейчас активно работаем. Собираем в нашей экосистеме, организовываем глубокий клиентский профиль и сегментируем всю ситуацию по клиентам. На сегодняшний день мы уже разработали достаточно много моделей, понимаем четкий портрет нашего клиента, понимаем, какие у него есть потребности, какие можно предложить продукты. И большой упор мы делаем на то, что можем предложить комплексную услугу и закрыть непосредственную боль и потребность клиента в текущий момент», — говорит Ержан Малимбаев.
О возросшей роли дата-аналитиков и дата-инженеров высказался Владимир Колесников, Head of Data Science АО «Bereke Bank». Он также отметил, что в связи с развитием ИИ очень остро встает вопрос поддержки развития инфраструктуры. По мере роста количества данных и совершенствования алгоритмов машинного обучения очень сильно возрастает стоимость обучения этих моделей. Соответственно, организации важно обращать внимание на развитие и масштабирование инфраструктуры.
«Я полностью согласен с Рубиной, что риск-менеджмент — это самое очевидное и самое прибыльное с точки зрения монетизации данных направление, потому что основная деятельность банка — это кредитование, и зарабатываем мы именно с кредитования. Параллельно у нас в банке идут достаточно интересные эксперименты с генеративными моделями. На самом деле, оттуда можно вытащить интересные концепции. В частности, последние прорывы в больших языковых моделях приблизили появление того самого SelfService BI, когда можно будет децентрализовать предоставление данных. Этот прорыв позволяет пользователям самостоятельно искать данные и делать простые базовые запросы при помощи генеративных моделей. Однако здесь очень важным становится развитие Data Governance. От того, как у вас описано хранилище и как у вас выставлены практики Data Governance, будет зависеть качество SelfService BI», — считает эксперт.
А о том, какие данные и инструменты работы с ними используются в строительстве, рассказал Азат Туратов, руководитель управления анализа и архитектуры данных BI Group. Он поделился примерами того, как BI Group работает с алгоритмами и использует их в своей деятельности. Спикер отметил, что строительная отрасль очень консервативная, но BI Group удалось шагнуть вперед по сравнению с другими представителями рынка. Компания уделяет много внимания построению Data Governance, и за счет управления данными она сократила процессы в два-три, а где-то — и в десять раз. И хайп вокруг ИИ вызвал всплеск интереса к данным.
«Сейчас есть действительно отличные решения, которые позволяют автоматизировать процессы, настроить какие-то вещи. Сейчас мы выпускаем, к примеру, нейронную модель, которая сама будет перепроверять за финансистами их данные. Это большой ручной труд, который занимает очень много времени. Соответственно, люди начинают заниматься манипуляцией данных либо осознанно, либо неосознанно. Здесь уже, как раз, AI нам очень сильно помогает. И при этом мы еще и меняем процесс, потому что глобальные тренды говорят, что операционисты скоро в принципе исчезнут, но появится другой большой блок аналитики. И сейчас мы наблюдаем, как у нас появляются аналитики по закупу, аналитики по финансам, которые начинают обучать какие-то модели на основании своей экспертности. Если говорить про мировые тренды, то сейчас развивается искусственный интеллект в проектировании, когда эскизное проектирование делает уже модель, а проектировщик только проверяет. Это очень сильно сокращает цикл строительства дома, позволяет отслеживать аномалии и не допускать ошибки при планировании и проектировании дома. И что самое главное, разгружает людей. Проектировщики больше занимаются анализом, чем операционной деятельностью. Все это — плюс как для строительных компаний, так и для клиентов. Потому что, покупая квартиру, вы уже понимаете, что там не будет каких-то ошибок», — отмечает Азат Туратов.
О том, почему бизнесу важно заниматься данными, рассказал в своем выступлении Султан Кыстаубаев, Head of Data & Analytics, Allur.
«Исходя из перспектив авторитейла, автомобильной промышленности и сферы мобильности, мы видим пять основных точек роста к 2025 году. Среди них — борьба за доли рынка продаж авто в РК и развитие экспортного потенциала, повышение операционной эффективности (скорость, качество, затраты), усиление вертикальной интегрированности бизнеса, оптимизация продуктового портфеля, новые продукты, сервисы и бизнес-модели (в том числе за счет „цифры“ и интеграции с Tech-игроками). Data & Analytics фокусируется на извлечении ценности из данных для стейкхолдеров, на основе видения, целей и приоритетов, а также повышает эффективность способов ее извлечения и предоставления. Мы стремимся к созданию в Allur эффективной экосистемы D& A, участники которой способны принимать взвешенные решения в вопросах повышения мобильности граждан Казахстана благодаря убедительным дата-продуктам и дата-сервисам», — говорит Султан Кыстаубаев.
А о том, как же создать функцию управления данными с нуля, рассказал Кирилл Евдокимов, директор практики Data Governance в Databorn. Он также представил дорожную карту перехода к Data Driven парадигме. По словам спикера, данные — это главный актив и драйвер роста.
Константин Аушев, партнер и руководитель технологической практики KPMG в Казахстане и Центральной Азии, представил риски, связанные с данными и моделями ИИ, а также поделился подходами, которые могут быть применены в организациях при внедрении GenAI.
«Существует четыре зоны рисков адаптации GenAl, к которым нужно подходить с точки зрения управления данными. Среди них — устойчивость (риск чрезмерного потребления энергии на хранение и обработку данных), защита персональных данных (риск нарушения прав субъектов, чьи данные собираются для анализа), транспарентность (риск потери доверия стейкхолдеров) и честность (риск сбора нерепрезентативных данных). О чем стоит задуматься уже сейчас? Из очевидных задач — определить видение и целевую архитектуру, отслеживать затраты, рассматривать ИИ-инициативы как полноценную программу проектов. Менее очевидные, но критические задачи — внедрение механизмов отслеживания и анализа ошибок моделей, оценка рисков, связанных с поставщиками услуг и технологий, вовлечение комплаенс-служб при проектировании, проработка интеграции ИИ-решений с другими решениями в организации на самом раннем этапе программ внедрения, непрерывная работа над качеством данных», — делится экспертизой Константин Аушев.
Еще одна панельная сессия конференции была посвящена особенностям внедрения инструментов по управлению данными. Василий Кийко, Head of BI в ТОО «Magnum Cash & Carry», обозначил, что до бизнеса важно доносить необходимость работы с данными.
«Мы росли на протяжении последних нескольких лет очень сильно, открывали по десятку магазинов в месяц. При таком росте очень сложно было управлять, нужно было показать в принципе экономические эффекты. Это самое важное. Помимо того, что управление данными позволяет принимать правильные решения, и принимать их быстрее, но экономический эффект всегда точнее показывает выгоду от применения тех или иных инструментов», — говорит Василий Кийко.
Рустем Увалиев, начальник управления по цифровизации Business and Technology Services, ERG, рассказал о нескольких способах внедрения инструментов работы с данными. Среди них — использование опыта внешних консультантов, создание Дата-офиса внутри компании или эволюционный подход, при котором в компании органически, вследствие постепенного развития, появляются те или иные инструменты и аналитические продукты.
«Когда идет внедрение решения, иногда слишком сильный фокус направлен непосредственно на технологическую платформу, — делится мнением Кирилл Евдокимов. — То есть, достаточно часто можно слышать от ряда вендоров — „поставьте наше решение, и у вас все будет хорошо, вы получите Data Governance“. Но на самом деле это история, которая в значительной мере зависит от процессов внутри компании. Нужно не забывать, что инструмент — это только инструмент, это средство автоматизации процессов и ролей. Сам инструмент этого не даст, если в компании не выстроены роли. Второй аспект, про который часто забывают: не секрет, что инициативы по управлению данными чаще всего рождаются либо в Дата-офисе, либо в IT, и при выборе инструментов не учитывается мнение бизнеса. Но огромную роль играет „приживаемость“ инструмента. То есть, важно, чтобы бизнесу было комфортно им пользоваться. Поэтому правильнее всего на ранних этапах вовлекать бизнес, убедиться, что он тоже включен в эти инициативы».
Это мнение поддержал Алексей Ильин, эксперт Data Governance и Data Quality в BeCloud.ai. Он отметил, что зачастую инструменты в компаниях внедряются из двух крайностей. Одна из них — когда IT выбирает решение, покупается лицензия, вендор проводит тренинги, но после этого решение просто «ложится на полку». Вторая крайность — когда проект делается без IT-шной составляющей, лишь с описанием процессов и политик в презентации PowerPoint.
«Успешные процессы Data Quality менеджмента — это когда качеством данных занимается не дата-команда, не айтишники. А все в организации начинают заниматься качеством данных — вот это действительно очень важно, и тут важен инструмент, процесс, важна вовлеченность бизнеса. И это то, что требует очень большого внимания. Качество данных — это ключевой момент», — уверен эксперт.
«Не нужно стараться внедрять Data Governance просто, чтобы внедрить, — поддержал коллег Рустем Увалиев. — Или, как уже говорили, не нужно стремиться внедрять инструмент просто чтобы отчитаться о внедрении. Это должно приносить пользу. А оптимальное соотношение инвестиций и пользы будет только тогда, когда функция управления находится на правильном уровне, соответствует уровню зрелости компании».
Свои решения для работы с данными, а также кейсы и опыт, представили на конференции сразу несколько компаний.
Так, Алексей Калинников, директор по работе с ключевыми клиентами Yandex Cloud CIS, рассказал об оптимизации процессов работы с данными с помощью облачной платформы.
Павел Мальцев, Technical Sales Specialist — Data & AI, IBM, поделился подходами для контролируемой адаптации AI и рассказал о ее преимуществах.
Болат Таймагамбетов, бизнес-архитектор DIS Group, выступил с презентацией о революции в управлении данными на основе Copilot.
Артем Спиридонов, Open Eco-System and Big Data Program manager в Beeline Казахстан, рассказал о конфиденциальных вычислениях и платформе для безопасной работы с данными Aggregion.
Алексей Сидоров, Chief Data Guru and Data Evangelist в Denodo, раскрыл возможности и подводные камни при руководстве данными через GenAI.
Эдуард Ким, Head of Data Office АО «Technodom Operator», рассказал о влиянии Lake House на Data-Driven.
Кейс о построении Data Governance в Data Office представила Қасиет Оразымбетова, TeamLead Data Governance в Altel Digital.
А Ирина Боровских, советник по управлению данными в Lithuanian Railways, осветила лучшие практики и реальные кейсы по интеграции Data Governance в процессы производственных и логистических компаний.
По итогам конференции можно сделать один общий вывод — работать с данными сегодня крайне необходимо. При этом эксперты отмечают: важно не бояться это делать, можно идти к этому небольшими шагами, пробуя те подходы, которые будут актуальны для самой организации, исходя из ее текущих условий и возможностей. Главное здесь — понимать боли бизнеса и выгоды.