Бизнес устал от зоопарка СУБД
Требования к системам управления базами данных для поддержки транзакционных и аналитических приложений стремительно меняются.
Чтобы понять предпочтения бизнеса и актуальные проблемы, американская компания InterSystems, разработчик технологий для интеграции приложений, хранения и анализа данных, заказала исследование аналитической компании IDC. В исследовании «Choosing a DBMS to Address the Challenges of the Third Platform» приняло участие 502 организации из Австралии, Бразилии, Китая, Германии, Японии и Великобритании. В частности, отвечая на вопрос о том, какая из бизнес-задач является № 1 для их компании в грядущем году, респонденты отдали предпочтение скорости внедрения инноваций (33,9%) и упрощению операций (31,9%). На третьем месте — снижение расходов (18,4%), а замыкает четверку наиболее актуальных бизнес-задач упрощение инфраструктуры (15,8%). Среди данных, которые, по мнению респондентов, наиболее важны для бизнеса, в опросе упоминаются реляционные данные, данные IoT, потоковые данные из внешних источников, данные сенсоров, аудиоданные, видео-изображения, JSON и т. д. В исследовании отмечается, что 37% респондентов хотят попробовать новые СУБД, около 45% — считают, что новые системы управления базами данных должны строиться исключительно на проприетарных технологиях, и лишь чуть более 17% предпочитают решения Open Source.
По мнению IDC, в мире наблюдается огромный разрыв между транзакционными и аналитическими системами, при этом для оптимизации бизнеса необходима аналитика в режиме реального времени. На практике ситуация удручающая — более 65% опрошенных отметили, что от 25% до 49% данных в компании перемещается между транзакционными и аналитическими системами с использованием процессов ETL (Extract, Transform, Load), и это обнажает огромную проблему. Почти 52% респондентов отмечают, что в среднем каждая ETL-задача занимает 5–7 дней, поскольку состоит из промежуточных перемещений транзакционных данных перед их попаданием в аналитическую базу данных, а в 12% случаев — от 7 до 14 дней. Отвечая на вопрос о том, действительно ли невозможность анализировать текущие данные в режиме реального времени препятствует решению задач бизнеса, 43% ответили утвердительно, а 29% констатировали некоторое влияние этого показателя. Раскрывая этот ответ, респонденты уточнили, что речь идет о продуктивности систем, аналитике и взаимопонимании клиентов. Невозможность анализировать текущие данные в реальном времени, по мнению более половины опрошенных, негативно влияет на операционную эффективность компании.
Интересный результат в данном исследовании получился и при выяснении стоимости владения разными базами данных. Опрос респондентов показал, что более 60% из них имеют 5 разных систем управления базами данных, а 30% — более 10! Плата за такой «зоопарк» — это растущая сложность ИТ-инфраструктуры, включая вычислительные ресурсы, сложность администрирования, при этом каждое вносимое изменение в такие сложные системы становится отдельным проектом со всеми вытекающими из этого последствиями. Расходы на поддержание таких систем возрастают по мере увеличения количества серверов почти в линейной зависимости.
Вывод IDC не терпит разночтений: решение выявленных проблем заключается в консолидации баз данных, операций, объединяющих транзакционные и аналитические возможности в единственное решение СУБД со смешанными функциями.
InterSystems IRIS Data Platform
Очевидно, что, заказывая данное исследование, в InterSystems хотели удостовериться в правильности парадигмы InterSystems IRIS Data Platform, которую в компании позиционируют как высокопроизводительную универсальную платформу для работы с транзакционными и аналитическими данными. Содержит все необходимые инструменты и возможности для быстрой разработки транзакционных, аналитических и транзакционно-аналитических приложений, которые сокращают задержки при ETL и позволяют получать информацию действительно в оперативном режиме. «InterSystems IRIS Data Platform предоставляет все необходимое для работы с данными, совместного их использования, а также для того, чтобы реализовать ценность самого большого актива, который есть в вашей компании, — данных», — отмечают в InterSystems. Это полновесная платформа, которая устраняет необходимость интеграции нескольких технологий разработки приложений и систем управления базами данных. Приложения на платформе InterSystems IRIS Data Platform, как сообщают в компании, требуют меньше кода, меньше системных ресурсов и меньше обслуживания.
Высокая производительность с горизонтальной и вертикальной масштабируемостью
Особая гордость InterSystems — это не только производительность, но и невероятная масштабируемость InterSystems IRIS Data Platform как по вертикали, так и по горизонтали, что позволяет эффективно учитывать растущие рабочие нагрузки, размеры данных и т. д.
Вертикальное масштабирование обеспечивается, в частности, за счет параллелизации SQL- и MDX-запросов. Для снижения стоимости аппаратного обеспечения, как правило, целесообразно использовать горизонтальное масштабирование.
Для систем на платформах InterSystems, с которыми работает большое количество пользователей, Enterprise Cache Protocol (ECP) позволяет распределить вычислительную нагрузку между серверами приложений, которые получают с серверов баз данных и кешируют необходимые пользователям данные. Протокол ECP автоматически синхронизирует данные между серверами данных и серверами приложений.
InterSystems IRIS Data Platform обеспечивает горизонтальное масштабирование данных за счет шардинга, разделяя большие базы данных между серверами. Запросы выполняются параллельно на каждом сервере, и результаты агрегируются перед отправкой пользователю.
Единая модель данных и высокая скорость разработки приложений
IRIS Data Platform предоставляет разработчику свободу выбора модели хранения и работы с данными — в рамках одного приложения можно использовать NoSQL, реляционный и объектный способы доступа к данным.
InterSystems IRIS Data Platform может быть использована совместно с любыми популярными средствами разработки приложений, языками программирования и стандартами, включая Java, .Net, REST, JSON, C++ JavaScript, XML и т. д.
Серверная логика может разрабатываться на объектно-ориентированном языке программирования ObjectScript. Методы классов и серверные программы на ObjectScript могут обращаться к многомерным массивам и классам IRIS Data Platform, использовать SQL и MDX.
Аналитика
InterSystems IRIS Data Platform — открытая аналитическая платформа, которая позволяет, комбинируя различные средства исследования данных, бизнес-аналитики, прогнозирования, создавать эффективные аналитические решения. Возможность анализировать данные в оперативном режиме обеспечивает поддержку принятия решений не только в аналитических, но и в транзакционных приложениях.
В IRIS DataPlatform включена OLAP-технология, средства анализа неструктурированной информации (текстов) и прогнозирования. Данные, которые хранятся под управлением IRIS Data Platform, доступны для внешних аналитических средств через xDBC, Apache Spark Connector и другие интерфейсы.
Интеграция
В платформу IRIS Data Platform входит мощная и гибкая технология для интеграции данных, приложений и бизнес-процессов.
Решения на IRIS Data Platform за счет поддержки многочисленных программных интерфейсов (API) могут использовать бизнес-логику, разработанную на Java, .NET, JavaScript, и т. д.
Поддержка JSON и REST, стандартов XML и веб-сервисов, а также расширяемый набор адаптеров обеспечивают интеграцию различных источников данных, приложений и сервисов.
Средства описания и исполнения бизнес-процессов IRIS Data Platform предназначены для автоматизации взаимодействия систем и людей (human workflow).
Все эти технологии позволяют создавать на IRIS Data Platform корпоративные сервисные шины (Enterprise Service Bus), системы автоматизации бизнес-процессов, композитные приложения в соответствии с сервис-ориентированной или микросервисной архитектурой.
Открытая среда и быстрое развертывание
IRIS Data Platform легко интегрируется в существующие ИТ-инфраструктуры заказчиков за счет поддержки контейнеров, средств развертывания в облаках, развитых технологий мониторинга приложений и интеграции со средствами мониторинга третьих фирм.
В зависимости от задач бизнеса, решения на IRIS Data Platform можно разместить как в публичных и частных облаках, так и у заказчиков. «Автоматизированные варианты развертывания упрощают работу с публичными и частными облаками, в корпоративных центрах обработки данных, а также на виртуальных машинах», — замечают в компании.
Лучшее в своем классе
«Философия IRIS (Interoperable, Reliable, Intuitive, Scalable), которая лежит в основе разработки InterSystems IRIS Data Platform, позволяет создавать надежные, высокопроизводительные и интуитивно понятные системы, которые предоставляют большие возможности для разработки новых транзакционных и аналитических систем, интеграции приложений и вместе с тем отличаются очень высокой масштабируемостью и надежностью», — резюмируют в компании.
В исследовании IDC отмечено, что невозможность своевременно анализировать данные не позволяет ИТ в полной мере поддержать бизнес в анализе продуктивности, анализе заказчиков, решении задач обеспечения безопасности. InterSystems IRIS Data Platform призвана снять эти ограничения и обеспечить решение задач бизнеса.
Опираясь на результаты исследования IDC и учитывая мощный потенциал InterSystems IRIS Data Platform, можно с уверенностью утверждать, что InterSystems удалось создать решение, которое оптимально соответствует ожиданиям заказчиков, учитывая практически все существующие и потенциальные требования. Этот путь по «минному полю», где, с одной стороны, нужно соответствовать запросам потенциальных клиентов, а с другой — предложить перспективные возможности, которые на годы вперед обеспечат рост бизнеса, компания прошла успешно.