Большие Данные — ответ без вопроса
В Gartner полагают, что данные не всегда ценный ресурс и технологии Больших Данных не всегда полезный инструмент
По некоторым прогнозам, рынок технологий, объединяемых термином «Большие Данные», достигнет в 2013 году 34 млрд долл. К 2015 году трудиться в этой сфере будет 4,4 млн ИТ-специалистов. И все же до сих пор, по мнению аналитиков Gartner, это решение только ищет свою проблематику.
Компании спешат начать глубокий анализ своих хранилищ данных в расчете получить полезные подсказки для развития бизнеса, и многие уже пытаются осваивать такие технологии, как Hadoop. В то же время, по словам Дебры Логан, аналитика компании Gartner, не сделано главное: не заданы те вопросы, на которые нужно искать ответы.
«Даже банки не прибегают к Большим Данным для получения какой-то практической пользы, поскольку их данные и так прекрасно систематизированы, — отметила она. — Разумеется, здесь изучают новую технологию и пытаются понять, что она собой представляет, знакомятся с этим типом решений и методами, используемыми для программирования и выполнения аналитических операций, но все эти работы находятся в самой начальной стадии».
Банки Deutsche Bank и HMRC недавно упоминали, что изучают способы извлечь полезные данные из унаследованных систем, чтобы интегрировать их с современными системами поддержки больших объемов данных, основанными на технологии Hadoop.
Логан отметила, что наиболее прогрессивный с точки зрения освоения технологий Больших Данных рынок — это ретейл, поскольку здесь активно применяются такие современные технологии, как радиочастотная идентификация (RFID), управление цепочками поставок и разного рода карты постоянных клиентов. Именно здесь, как полагает Логан, создаются «задачи для Больших Данных».
Во многих других отраслях просто ищут способы управлять и извлекать прибыль из информационных активов, и здесь Большие Данные — это далеко не всегда то, что нужно. Есть множество готовых программ, позволяющих визуализировать большие объемы данных, а порой лучшее, что можно сделать, — просто выкинуть все старые горы информации.
«Не все данные представляют собой ценный актив, и часто хранение ненужных данных становится не более чем пустой тратой денег. Первое, что нужно сделать, — определить, что действительно полезно, — сказала Логан. — А для этого нужно понять, на какой вопрос мы ищем ответ. Так ли существенно отличаются выводы, сделанные по объемному массиву данных, от тех, которые сделаны по более скромной выборке?»
Конечно, в отраслях, работа которых подлежит контролю, не всегда можно уничтожать данные. Здесь нужно решить, стоит ли проводить эксперименты с данными в целях получить дополнительную отдачу. Это та сфера, в которой бизнесу и технологии нужно работать в более тесном контакте, чтобы лучше понимать проблемы и возможности.
Организации сейчас активно ищут специалистов, которые не только обладали бы высокой квалификацией в области ИТ, но и имели бы аналитический склад ума и деловую хватку, чтобы принимать многообещающие решения. Таких людей называют аналитиками данных или директорами по данным, и они очень редки.
«Некоторые наши клиенты в Лондоне говорили, что не могли найти консультантов, удовлетворяющих всем их запросам. Им приходилось вникать во все самим, поскольку специалисты с подходящими умениями уже нашли себе место... ну, скажем, в Европейском центре ядерных исследований, — рассказала Логан. — Это профессионалы, имеющие опыт математического и статистического моделирования — того, чему мы сейчас обучаем разработчиков. Сейчас немногие умеют сносно программировать, не говоря уже о математическом моделировании».
Рынок испытывает серьезную нехватку специалистов такого рода, но Логан предупредила, что компаниям не стоит обольщаться заявлениями о том, что такой-то является аналитиком данных. «Стоит внимательнее присмотреться к человеку и убедиться, что он действительно знает, о чем говорит», — сказала она.
Альтернативой может стать командный подход. В коллектив должен входить программист, юрист и человек, разбирающийся в бизнесе. Если предоставить этим людям доступ к данным и дать возможность поработать с ними, не исключено, что они сделают настоящие открытия.
«Предприятия понимают, что технология дает ответа, но задан ли вопрос? Пусть опытные специалисты поэкспериментируют с данными в поисках того, что можно было бы найти», — отметила она.
Сейчас не существует правильного или неправильного подхода к использованию Больших Данных. Организациям нужно выработать свои подходы. Прежде чем кидаться на новинку и вкладывать большие деньги в такие технологии, как Hadoop, лучше попытаться получить выигрыш, четко задав цели.