Следите за новостями

Цифра дня

41% казахстанцев столкнулись с инцидентами кибербезопасности

Cloudera получит финансовую поддержку от Google и других

Новый раунд финансирования поможет компании продолжать совершенствовать свой дистрибутив Hadoop для предприятий

25 марта 2014 10:51, Computerworld.kz
Рубрики: Мир

В компании Cloudera объявили о получении нового раунда финансирования — 160 млн долл., которые будут направлены на дальнейшее развитие дистрибутива платформы обработки Больших Данных Hadoop.

Учитывая, что общий объем финансирования Cloudera достиг уже 300 млн долл., можно видеть, насколько оптимистично инвесторы настроены относительно перспектив Hadoop на предприятиях.

Примечателен и сам состав инвесторов на данном раунде: главным из них стал фонд T. Rowe Price, к которому присоединились Google Ventures и компания, аффилированная с Майклом Деллом. До того, как стали известны имена инвесторов, сообщалось, что объем финансирования составит 200 млн долл., а большую часть суммы вложит Intel.

Особое внимание привлекает участие Google Ventures, поскольку у Google есть собственный вариант Hadoop в виде сервиса — BigQuery. «На многих предприятиях заинтересованы в гибком подходе к обработке Больших Данных, и по нашим прогнозам, соответствующий рынок продолжит быстро расти, — отметил генеральный партнер Google Ventures Карим Фарис. — Cloudera кардинально снижает затраты предприятий на надежное хранение и реализует принципиально новые способы аналитической обработки обширных срезов данных».

Cloudera предлагает дистрибутив Hadoop, который во многом сохраняет особенности материнского проекта Apache с открытым кодом, но также добавляет ряд усовершенствований. В частности, в Cloudera разработали инструментарий администрирования и мониторинга Cloudera Manager и технологию Impala, позволяющую обращаться к данным Hadoop с помощью запросов на SQL. Дистрибутив Hadoop от Cloudera не является целиком продуктом с открытым кодом. Когда заказчикам Cloudera нужно что-то отсутствующее в Apache Hadoop, необходимая функциональность либо разрабатывается, либо заимствуется у партнера, уже реализовавшего ее. Как отмечают аналитики Forrester, чтобы выделяться на фоне конкурентов, Cloudera придерживается принципов сохранения основ Hadoop и оперативной разработки новшеств согласно требованиям заказчиков. Эта стратегия окупается: число пользователей платформы Cloudera стабильно растет и на сегодня уже достигло около двухсот. У некоторых из клиентов объем обрабатываемых данных уже больше петабайта, а число узлов Hadoop — свыше тысячи.

Cloudera впервые заявила о себе в 2009 году, и сегодня является одним из ведущих поставщиков дистрибутивов Hadoop. Ее основные конкуренты — Hortonworks, Teradata, MapR Technologies, Microsoft и Amazon Web Services.

Изначально Hadoop применялась онлайн-гигантами вроде Google и Yahoo, а сегодня эту самую популярную платформу управления Большими Данными активно осваивают и другие предприятия. Основных причин этому две: у предприятий накопливаются огромные объемы информации, а Hadoop отлично подходит для ее обработки, в том числе когда нужно объединять исторические данные с новыми, неструктурированными; многие ИТ-компании подключаются к предоставлению услуг технической поддержки и других, связанных с Hadoop, делая платформу более привлекательной для предприятий.

«Рынок Hadoop неудержимо растет: платформа с открытым кодом прочно укореняется в корпоративных архитектурах управления данными, — пишут аналитики Forrester Майк Гвалтьери и Ноэль Юханна в докладе Wave Report. — В Forrester убеждены, что Hadoop — обязательная система для больших предприятий, являющаяся краеугольным камнем любой гибкой платформы управления данными. Если у вас много структурированных, неструктурированных или двоичных данных, Hadoop в вашей организации самое место».

Как отмечают в Forrester, выбор поставщиков сегодня уже достаточно велик. Аналитики перечисляют девять компаний, предлагающих услуги, связанные с Hadoop, и отмечают их преимущества и недостатки. Авторы доклада приходят к выводу, что на сегодня явного лидера рынка еще нет, и относительно молодые компании предлагают услуги не хуже, чем у ИТ-гигантов.

Hadoop, напомним, — это проект Apache, доступный для загрузки всеми желающими и состоящий из следующих основных модулей: набора библиотек Hadoop Common, распределенной файловой системы Hadoop Distributed File System, планировщика заданий YARN и программируемой платформы обработки данных MapReduce. Одна из главных возможностей Hadoop — распределение рабочих задач между множеством узлов, счет которых может идти на тысячи. Дистрибутивы и сервисы, упрощающие работу с Hadoop, сегодня предлагаются целым рядом ИТ-компаний, каждая со своей стратегией.