Инструменты программирования графических процессоров Nvidia увеличат производительность мобильных устройств
CUDA 5.5 будет поддерживать процессоры ARM, широко применяемые в смартфонах и планшетных компьютерах
Компания Nvidia намерена увеличить производительность мобильных устройств за счет инструментов, обеспечивающих согласованное использование центральных процессоров и графических ускорителей.
Компания представила версию CUDA 5.5, которая впервые будет поддерживать процессоры ARM, установленные в большинстве смартфонов и планшетных компьютеров. Новые программные средства помогут закрепить производительность суперкомпьютеров на отметке выше 1 PFLOPS (1015 операций с плавающей запятой в секунду. — Прим. ред.). Что касается мобильных устройств, то прирост быстродействия здесь будет сдерживаться отведенными им рамками энергопотребления.
Многие планшетные компьютеры и смартфоны сегодня оснащаются процессорами Nvidia Tegra, позволяющими пользователям получать удовольствие от современных игр.
Инструменты параллельного программирования CUDA помогают разработчикам создавать приложения, которые эффективно используют мощности центрального, графического и других процессоров.
«Увеличение производительности благодаря CUDA особенно ощутимо при обработке изображений, – отметил генеральный менеджер направления графических процессоров Nvidia Иан Бак, считающийся 'отцом' CUDA. – Смартфоны с камерами получают улучшенные средства обработки и распознавания изображений. По сути, CUDA открывает путь к расширению функциональных возможностей смартфонов. С того момента как мы начали заниматься графическими процессорами для настольных компьютеров, нам удалось продвинуться далеко вперед. Сегодня накопленный опыт переносится на Tegra. Впервые мы начинаем внедрять CUDA на мобильном рынке».
Компания Nvidia уже сейчас интегрирует графические процессоры в лучшие мобильные чипы, регулярно улучшая их функционал. CUDA позволяет ускорить графическую обработку и повысить эффективность энергопотребления устройств.
Перевод суперкомпьютеров на графические процессоры и другие ускорители является одним из способов дальнейшего увеличения их быстродействия. Графические процессоры Nvidia установлены во втором по производительности компьютере Titan, который развернут в Национальной лаборатории Министерства энергетики США в Окридже. Пиковая производительность суперкомпьютера, включающего в себя 299 008 процессоров Opteron и 261 632 графических ядер Nvidia Tesla K20X, достигает 17,59 PFLOPS.
Мобильный чип Tegra, который разрабатывается сейчас под кодовым наименованием Logan и должен быть готов в будущем году, первым начнет поддерживать версию CUDA 5.5. Поддержка CUDA в Logan будет реализована путем интеграции графического процессора с архитектурой Kepler, используемой и в суперкомпьютере Titan. Современные чипы Tegra имеют графические ядра GeForce и не оптимизированы для CUDA.
Хотя совместимые с CUDA модули еще не готовы, Nvidia предоставила разработчикам мобильных устройств возможность ознакомиться с преимуществами CUDA 5.5. Соответствующие платы объединяют в себе чипы Tegra 3 с совместимым с CUDA графическим процессором Kayla. Оборудование, представленное в начале текущего года на конференции Nvidia GPU Technology Conference, было показано и на конференции International Supercomputing Conference, которая прошла в Лейпциге.
Помимо мобильных устройств, преимуществами CUDA могут воспользоваться и суперкомпьютеры, построенные на основе процессоров ARM или графических плат Nvidia.
Сегодня более 400 из 500 ведущих суперкомпьютеров используют процессоры x86-архитектуры компаний Intel или AMD, многие из них оборудованы и графическими платами Nvidia. Вместе с тем первые шаги в серверной области совершают и технологии ARM, а в барселонском Supercomputing Center был анонсирован прототип суперкомпьютера, построенный на процессорах ARM. Специальная презентация на ISC была посвящена использованию CUDA 5.5 в суперкомпьютерах.
Для мобильных устройств и суперкомпьютеров существует несколько инструментов параллельного программирования. Наиболее популярным является, пожалуй, OpenCL, поддерживаемый компанией Nvidia. Корпорация Intel предлагает свой собственный инструмент для разработки программного обеспечения, поддерживающий чип ускорителя Xeon Phi, а AMD является основателем организации HSA (Heterogeneous System Architecture) Foundation, которая намерена обеспечить переносимость приложений между различными процессорными архитектурами и устройствами. Компания Nvidia решила не участвовать в работе HSA, тогда как ARM и другие производители процессоров (в частности Qualcomm и Texas Instruments), вошли в состав объединения.
Обозреватели отрасли полагают, что Nvidia отказалась от членства в HSA Foundation главным образом из-за стремления сосредоточиться на CUDA. «Единого подхода к параллельному программированию, который годился бы на все случаи жизни, не существует, – подчеркнул Бак. – В долгосрочной перспективе никакой унификации средств написания программ для графических процессоров ждать не приходится, а CUDA станет наилучшим инструментом для процессоров Nvidia. Программисты сегодня используют для разработки приложений множество разных языков: Си, C++, Java, Ruby on Rails, Python и т. д. Множество различных подходов будут использоваться и для обеспечения параллелизма при работе мобильных устройств и суперкомпьютеров».
Аппаратные улучшения Nvidia должны упростить программирование чипов. Процессор Nvidia Tegra 6, разрабатываемый под кодовым наименованием Parker, превращает память центральных и графических процессоров в совместно используемый ресурс. В настоящее время память центрального и графического процессоров разделена, а в Parket объем адресуемой памяти будет расширен.
«Задействуя преимущества графического процессора, разработчик не должен задумываться о том, где находятся данные», – пояснил Бак.