Сырым Толеулиев, Казтелепорт: GPU для ИИ в Казахстане — дефицит, спрос и будущее инфраструктуры
О специфике локального рынка и перспективах развития рассказывает заместитель председателя правления АО «Казтелепорт».
Индустрия искусственного интеллекта переживает фазу экспоненциального роста, и ключевым бенефициаром этого тренда становится рынок GPU-инфраструктуры. От дефицита вычислительных мощностей до трансформации дата-центров и облачных платформ — GPU сегодня фактически стали новой «нефтью» цифровой экономики. О специфике локального рынка и перспективах развития рассказывает заместитель председателя правления АО «Казтелепорт» Сырым Толеулиев. В интервью он комментирует, как меняется спрос на вычислительные ресурсы, почему доминирует NVIDIA, какие альтернативы существуют и какую роль Казахстан играет в новой AI-экосистеме.

— Сырым, индустрия искусственного интеллекта переживает экспоненциальный рост, и GPU стали ключевым ресурсом для этой трансформации. Как вы видите роль Казахстана и «Казтелепорт» в этой новой AI-экосистеме?
— «Казтелепорт» создает устойчивую инфраструктурную базу для развития AI в стране. Пользователь видит только конечное приложение, но за ним стоит сложная инфраструктура: энергетика, дата-центры, GPU и облачные платформы. Именно эти слои мы последовательно развиваем.
Мы размещаем GPU-серверы клиентов в наших дата-центрах, предоставляем аренду собственных GPU и планируем запуск облачных инструментов для AI-разработчиков. Приоритет — инфраструктура Tier III с высокой доступностью, резервированием критических систем и SLA, а также полное соответствие регуляторным требованиям по персональным данным.
— GPU существуют давно, но что именно вызвало нынешний взрывной спрос? Почему это произошло именно сейчас?
— Отправной точкой стал взрывной рост генеративного ИИ (Gen AI). Спрос на высокопроизводительные ускорители вышел за рамки любых прогнозов. На данном этапе развития нейросетей, возможности AI сервисов наращиваются в основном путем масштабирования вычислительных мощностей, на которых обучается нейросеть. Логика происходящего проста: чем сложнее модель, тем больше она потребляет — а значит, доступ к вычислениям напрямую определяет конкурентоспособность. Это спровоцировало настоящую гонку за ресурсами: Amazon, Google, Microsoft и другие технологические гиганты выкупают GPU партиями, включая ещё не выпущенные производственные циклы. Так, NVIDIA продавала графические ускорители с опережением на год вперёд, а весь производственный объём оказался зарезервирован под дата-центры крупнейших корпораций, оставив корпоративный сегмент и исследовательские организации фактически в листе ожидания.
На этом фоне стремительно нарастает структурный дефицит, который спровоцировал бурный рост Gen AI. Рынок испытывает нехватку не только самих GPU, но и других компонентов, как оперативная память и SSD накопители.
Отдельная тема для обсуждения — геополитика. США ужесточили экспортный контроль над поставками, получение лицензии занимает от шести месяцев до года. Для организаций за пределами ключевых технологических центров это означает не просто задержки, а реальную недоступность передовых вычислительных мощностей. Доступ к оборудованию всё больше концентрируется у тех, кто располагает прямыми соглашениями с NVIDIA и другими производителями.
— Почему обучение нейросетей эффективнее на GPU, а не на CPU?
— CPU, по своей сути, представляет собой процессор широкого профиля. Он последовательно и точно обрабатывает сложные логические операции, обеспечивая высокую производительность на каждую отдельную задачу. Степень параллелизма у него невысока, однако это компенсируется гибкостью и скоростью.
GPU построен на иных принципах. Его архитектура изначально проектировалась под одновременное выполнение большого числа простых вычислений. В игровой графике каждый кадр содержит миллионы пикселей, требующих параллельной обработки, именно под эту задачу и оптимизирована архитектура графического процессора.
Графические процессоры появились в 1990-х годах как специализированные решения для игровых и визуальных приложений. В середине 2000-х исследователи начали применять их в научных вычислениях, где требовалась высокая степень параллелизма. Эксперименты с обучением нейронных сетей подтвердили закономерность: алгоритмы глубокого обучения основаны на матричных операциях, которые органично ложатся на параллельную архитектуру GPU.
Это дало толчок к формированию отдельного направления — GPU без графического выхода, ориентированных на научные расчёты, моделирование и обработку больших данных. Именно с этого момента началось развитие современных вычислительных ускорителей, которые сегодня составляют аппаратную основу для развития ИИ.

— На рынке часто выбирают NVIDIA. Почему именно она?
— Несмотря на присутствие на рынке таких производителей, как Intel и AMD, а также активные инвестиции китайских компаний в собственные разработки, их совокупная доля в сегменте вычислительных GPU остаётся небольшой. По открытым данным, свыше 90% нейросетей сегодня работают на графических процессорах NVIDIA — и это результат стратегии компании.
NVIDIA приступила к исследованиям в области высокопроизводительных вычислений и искусственного интеллекта ещё в 2000-х годах, значительно раньше конкурентов, и последовательно выстраивала технологическую экосистему вокруг своих решений. Одну из определяющих ролей в этом сыграла программно-аппаратная архитектура CUDA, ставшая де-факто отраслевым стандартом. Современные AI-модели, фреймворки и инструменты разработки ориентированы преимущественно на неё, что создаёт высокие барьеры для смены платформы.
Тем не менее ситуация постепенно меняется. Intel, AMD и китайские разработчики целенаправленно наращивают компетенции. По оценкам отраслевых экспертов, в горизонте ближайших одного-полутора лет возможно заметное перераспределение рыночных долей.
— А есть ли реальные альтернативы GPU для AI?
— Ведущие технологические корпорации всё активнее разрабатывают собственные специализированные ASIC-чипы для инференса — узкопрофильные ускорители, оптимизированные под выполнение повторяющихся операций в заранее определённых AI-нагрузках. По сравнению с универсальными GPU они обладают рядом существенных преимуществ: значительно более низкой стоимостью, меньшим энергопотреблением и упрощёнными требованиями к охлаждению.
На сегодняшний день эти чипы недоступны для прямого приобретения и используются преимущественно в облачной инфраструктуре гиперскейлеров — предоставляются клиентам на условиях аренды в рамках закрытых платформ.
Появление ASIC несёт в себе потенциал для кардинального изменения экономики AI-вычислений. Показательна аналогия с майнингом криптовалют: в 2010-х годах переход с GPU на специализированные ASIC-майнеры снизил стоимость вычислений во много раз. Аналогичный сценарий применительно к индустрии ИИ может повлечь столь же существенное снижение стоимости инференса, и, как следствие, перестройку сложившейся расстановки сил на рынке AI-вычислений.
— А что происходит на уровне дата-центров с ростом AI-сервисов?
— Бурное развитие и рост потребления AI-сервисов сильно повлияли на отрасль дата-центров и энергетики. В мире наблюдается бум строительства дата-центров для AI нагрузки, в эту отрасль инвестируются очень большие средства. Также меняются технологии, которые применяются для дата-центров: требуется больше мощности на стойку, все чаще используется жидкостное охлаждение.
Рост количества дата-центров уже создает дефицит электрической мощности в США и странах Европы. Потребление электричества дата-центров растет на 50% каждый год. По прогнозам, к 2030 году дата-центры будут потреблять 5% всего производимого электричества в мире. Нехватка мощности может стать одним из ограничивающих факторов развития AI. Для решения данной задачи крупные компании сейчас разрабатывают разные решения, например, модульные атомные станции для дата-центров.

— Весь этот ажиотаж вокруг GPU и AI — это пузырь или реальный технологический сдвиг?
— Влияние AI на бизнес и обычных потребителей будет колоссальным, это уже видно. Когда текущий ажиотаж вокруг AI стихнет, останутся сервисы, реально трансформирующие процессы. Основная часть инвестиций сейчас идёт на инфраструктуру, дата-центры и GPU — фундамент долгосрочного сдвига.
Многие эксперты сейчас сравнивают AI бум с. com бумом в начале 2000-х годов. В эту отрасль вливаются очень много инвестиций, хотя большинство AI-проектов работают в убыточном режиме. Все это делается с пониманием перспектив, которые обещает технология AI. 80% крупного бизнеса в мире уже используют AI.
Стоит отметить, что большая часть инвестиции сейчас приходятся на инфраструктуру, строятся дата-центры на гигаватты мощности. Производственные линии вендоров направлены на выпуск GPU, что уже создало дефицит комплектующих для другой вычислительной техники в мире. В этом плане есть опасения, что в скором времени может быть избыток этих ресурсов.
Во времена.com бума в начале 2000-х годов также было выпущено много серверного и сетевого оборудования, проложены сотни тысячи км оптических кабелей. Но после спада бума эти ресурсы недолго пустовали и вскоре дали бурное развитие интернету.
— Сырым, как GPU интегрируются в публичные и частные облака? Насколько эффективна виртуализация?
— Многие провайдеры позволяют виртуально использовать GPU для обучения и инференса. «Казтелепорт» предлагает аренду GPU в собственном облаке: GPU серверы размещены локально в наших дата-центрах, соответствуют регуляторным требованиям. Сейчас доступны различные модели для обучения и инференса. Управление ресурсами GPU в облаке производится через портал самообслуживания с почасовыми и месячными тарифами. В ближайшем будущем, повторюсь, появятся инструменты для AI-разработчиков.
— Облака облегчают доступ к GPU. Но они больше усиливают дефицит или делают ресурсы доступнее?
— Облачные решения однозначно повышают доступность GPU. В аренду через облако можно получить мощные графические процессоры быстро и по гибкой цене, включая почасовые и дневные тарифы. Это особенно удобно для задач обучения нейросетей, когда требуются ресурсы только на ограниченное время.
Самостоятельная покупка и размещение таких GPU в дата-центре обходится крайне дорого, а для многих проектов постоянное использование оборудования просто не требуется. Облака позволяют компаниям эффективно масштабировать вычислительные мощности под реальные потребности, оптимизируя расходы и снижая барьеры для внедрения AI-решений

— Какие изменения, по вашему мнению, ждут рынок GPU в ближайшие 3–5 лет?
— Сложно делать прогноз на такой длительный срок. Ведь в данной сфере все быстро меняется, хотя за последний год взрывной рост немного замедлился. Если коротко, то крупные поставщики AI решений будут заниматься улучшением и стабилизацией своих сервисов, внедрение AI решений в бизнесе будет проводиться с большим пониманием. Тем не менее внедрение AI в различные сегменты мировой экономики будет набирать обороты. Спрос на GPU будет дальше расти в ближайшие 2-3 года.
С точки зрения облачного провайдера, мы видим, что теперь в облаке GPU будут требоваться наравне с CPU. Обученные модели внедряются в постоянную эксплуатацию, их потребление будет расти, будут нужны больше GPU для инференса.
По словам экспертов в ближайшие 3-5 лет будет уже разработан AGI, следующий уровень развития AI, который будет рассуждать и принимать решение как человек. Для этого будет требоваться еще больше вычислительных ресурсов. Есть ожидания, что с использованием ASIC процесс инференс будет намного доступнее, чем сейчас.
Если говорить про локальный рынок, в Казахстане реальный спрос на GPU-инфраструктуру формируется в нескольких ключевых отраслях экономики, что подтверждается как актуальными рыночными тенденциями, так и реализуемыми государственными и корпоративными проектами.
Финансовый сектор является одним из ключевых драйверов спроса. Банки и финтех-компании последовательно внедряют различные AI решения во многие свои процессы.
Государственный сектор и научно-образовательные учреждения формируют устойчивый институциональный спрос на вычислительные ресурсы. В рамках национальной стратегии цифровой трансформации потребность в GPU-мощностях будет обусловлена задачами повышения удобства госуслуг для граждан, аналитики больших данных, обеспечения кибербезопасности и проведения научных исследований.
— А насколько Казахстан сегодня нуждается в GPU-инфраструктуре?
— Страна активно развивает AI-инфраструктуру: строятся дата-центры, активно инвестируются в AI-проекты, формируется стратегия AI-хаба Центральной Азии. Коммерческий сектор постепенно внедряет AI, и спрос на GPU будет только расти. Наша страна может стать отличной площадкой для GPU инфраструктуры. Я думаю, что для этого есть все условия и предпосылки.
— Чувствуется ли влияние глобального GPU-бумa на локальный рынок?
— Глобальный спрос мы, скорее всего, не ощутили в полной мере: на данном этапе мы лишь осваиваем технологию и делаем первые шаги в её применении. Тем не менее влияние внешних факторов оказалось весьма ощутимым. Геополитическая ситуация в мире в совокупности с политикой NVIDIA по продаже графических процессоров существенно осложнили весь процесс — от получения и транспортировки оборудования до его установки и настройки.
В более широком контексте это означает переход от точечного использования AI к системной трансформации экономики, где доступ к вычислительным мощностям становится базовым фактором конкурентоспособности. На этом этапе ключевую роль начинают играть не только сами технологии, но и инфраструктурные провайдеры, способные обеспечить масштабируемость, надёжность и соответствие регуляторным требованиям. Именно такая инфраструктурная база будет определять скорость и глубину внедрения AI-решений в Казахстане в ближайшие годы.
— Сырым, благодарим за интересную беседу и глубокую экспертизу — ваши комментарии помогли системно взглянуть на развитие GPU-инфраструктуры и роль Казахстана в формирующейся AI-экосистеме.