Модель языкового зрения Oylan запустили в Казахстане
Институт интеллектуальных систем и искусственного интеллекта при NazarbayevUniversity (NUISSAI) сделал значительный шаг вперед в области ИИ.
Oylan — это мощная модель, способная обрабатывать как изображения, так и текст, и работающая на казахском, английском и русском языках. Для обучения Oylan исследователи ISSAI использовали самый большой набор данных, когда-либо созданный в Казахстане. Этот массив включает в себя более 10 миллионов изображений и 50 миллионов пар «вопрос-ответ». Все они были тщательно подобраны с учетом специфических языковых, культурных и экономических особенностей страны. Oylan может применяться в различных областях, включая образование, здравоохранение, промышленность и финансы.
«Набор данных охватывает широкий сектор областей, таких как подписи к изображениям, визуальные вопросы и ответы, оптическое распознавание символов, анализ документов, понимание диаграмм, графиков и таблиц, решение задач в различных областях, таких как математика, геометрия, физика и многое другое», — говорит Аскат Куздеуов, ведущий аналитик данных.
Несмотря на ограниченные вычислительные ресурсы, команда ISSAI разработала инновационные методы для эффективного обучения Oylan. Теперь общественность может изучить возможности Oylan, запустив пилотный проект на ISSAI Playground (oylan.nu.edu.kz), где также реализовано голосовое взаимодействие для более интуитивного восприятия. Кроме того, разработчики могут использовать функциональные возможности Oylan, получив доступ к его API для интеграции в свои решения.