Следите за новостями

Цифра дня

10,4 млрд — количество безналичных транзакций в РК в III квартале 2024

    Нужен ли Казнету поисковик?

    Попытка анализа всех идей и слухов, связанных с созданием национального поисковика в Казнете.

    11 февраля 2008 11:11, Нурпеисов Асет, Akshaturaly.info
    Рубрики: Интернет

    За последние несколько лет идея создания национальной казахстанской поисковой системы стала чем-то вроде национальной идеи Казнетеров или идеи фикс для правительственных органов. Все от мала до велика хотят занять нишу, которую пока еще не полностью освоили зарубежные поисковые системы, а местные просто не дотягивают до уровня, при котором ими хоть кто-нибудь бы пользовался. Эта тема неоднократно обсуждалась на различных форумах, в блогах, конференциях и так далее. В этой статье я хочу провести анализ всех идей и слухов, связанных с созданием национального поисковика, а также узнать нужен ли он вообще.

    Начнем с того, в чем же специфика создания этого поисковика. Специфика в том, что он должен искать по сайтам, находящимся в доменной зоне .kz, а также использующим казахский язык, но не находящимся в зоне .kz. Также нужно чтобы он искал также по сайтам на русском языке (никто не отменял язык межнационального общения), так как им владеют почти все казахстанцы. Реализация подобного проекта — довольно амбициозная задача. Но с ней возможно справится. К примеру, поисковая система «Яндекс» — ищет не только по сайтам в доменной зоне .ru, а по всем сайтам на русском языке.

    Но тут стоит учесть один нюанс. Дело в том что руководители «Яндекса», а также его сотрудники — специалисты не только в сфере ИТ, но также и в сфере языкознания и филологии. Именно качественный поиск по русскоязычным сайтам, учитывающий сложную морфологию русского языка делает «Яндекс» лидером поисковых сервисов в России. Google тоже выдает хорошие результаты поиска, но все же сделан и заточен специально для англоязычного поиска. Как же у них обстоит дело с казахским языком? В небольшом исследовании, проведенным моим коллегой Алексеем Чубыкиным, он проводил анализ поиска по казахскоязычным сайтам крупнейших поисковых систем Рунета — Гуглом и Яндексом. Как видно из исследования — поисковые системы еще не готовы к полноценному внедрению полностью казахскоязычных сайтов. Для того чтобы урвать свою долю поискового трафика приходится дублировать казахские тексты на русском или английском языках. Это как минимум накладно, а как максимум неэффективно и мало кому нужно. Куда проще не мудрствовать лукаво и создать сайт только на русском языке.

    Морфология казахского языка — это еще одно препятствие на пути создания поисковика. Дело в том, что у нас нет таких кадров, которые бы совмещали в себе специалистов математического анализа, филологии, математического моделирования структуры текста и так далее. Подобные кадры куются в Научно исследовательских институтах посвященных математическим исследованиям структур баз данных, поисковых систем и так далее. Но мало того, что их нужно изучать, нужно еще и уметь применять данные знания для их использования в области поисковых сервисов. И если Ларри Пэйдж и Сергей Брин, с самого университета посвящали этому все свое время, то нам нужны точно такие же кадры, со знанием казахского языка. Потому что для того чтобы конкурировать с Гуглом и другими ПС (поисковыми системами), мало знать то, что знают они, нужно быть на голову выше. Например, Илья Сегалович и Аркадий Волож (руководители Яндекс) занимались вопросами поиска очень глубоко и словосочетания математическое моделирование словоформ для них не кажется бредом. Или к примеру поисковик Нигма — творение российских студентов является совместной разработкой факультетов МГУ: факультета вычислительной математики и кибернетики и факультета психологии. Именно сочетание таких несовместимых казалось бы вещей, как психология и математика дает в итоге специалиста готового разрабатывать поисковые системы. У нас даже учебных заведений с таким профилем не имеется.

    Нужно понять, что создание поисковика — задача бизнеса, а не государства. Никаким волюнтаристским решением сверху проблемы в интернете никогда не решались и решаться вряд ли будут. Это свободная зона, где мотивацией человека на создание чего-либо может служить лишь прибыль, которую он может получить от этого. А есть ли экономическая выгода в создании поисковой системы. Самая основная проблема создания национальной поисковой системы — ее экономическая эффективность. Если ежедневная аудитория Google может достигать нескольких сотен миллионов человек в сутки, у «Яндекса» — несколько сотен тысяч, то, что может противопоставить этому казахстанский поисковик? Проведем небольшой арифметический подсчет: В Казахстане проживает около 15 миллионов людей. Из них государственным языком владеет чуть больше половины. Это примерно 8 миллионов человек. Количество людей за пределами Казахстана владеющих казахским языком, преимущественно в Китае, Узбекистане, России, составляет по разным подсчетам составляет от 2 до 4 миллионов человек. Будем оптимистами, скажем что 4. Итого 8+4 равно 12 миллионов носителей языка. Подсчет очень грубый. Из них скажем треть, имеет доступ в интернет. Это 12/3=4.  Четыре миллиона человек — вот аудитория на которую может рассчитывать создатель поисковика. «Почему в расчете подсчитывалось только казахскоязычное население!?» возмутятся многие, «ведь им могут пользоваться и русскоязычные пользователи!». Полностью согласен, поисковик — он для всех. Но дело в том, что мало кто может конкурировать с «Яндексом» по качеству поиска по русскоязычным сайтам, даже «Гугл».

    Итак 4 миллиона — это много или мало? В рамках Казахстана — эта цифра кажется неимоверной. Согласен, но нужно надеяться на лучшее. Четыре миллиона пользователей, это огромная цифра. Но качество этой цифры очень подозрительно. Дело в том, что почти каждый из этих 4 миллионов будет знать как минимум еще и русский, язык. Как показывают статистические данные по популярности ресурсов, в казахстанском ТОП 100 по посещаемости только 18 ресурсов из Казахстана. Весь наш трафик уходит за границу, в основном к нашему северному соседу. Знание русского языка и его повальное использование в Казнете сыграло с ним злую шутку — пользователи предпочитают отечественным ресурсам российские, благо для них нет языкового барьера. Но если так и будет продолжаться, очень мы сможем наблюдать картину, когда в Казахстане не останется ни одного своего сервера и хостинга. Зачем покупать его в РК, когда рядом есть РФ, а трафик все равно не идет в РК?

    У нас было множество попыток создать поисковики. Даже не знаю хватит ли памяти упомнить всех. Вот некоторые из них: poisk.kztabu.kzai.kzkaz.kzgavgav.sugavgav.cn и еще неизвестно сколько поисковиков. Практически никто из них не дает качественной выдачи. Если будете заходить на сайт и увидите что он недоступен — не пугайтесь, многие из этих поисковиков находятся на обычных виртуальных хостингах и поэтому часто в дауне. Есть даже попытка создать KYC — Казахстанский индекс цитирования, от одного из самых нормальных поисковиков Казнета — ai.kz. Но проблема в том, что ресурсов, на которых его можно увидеть — практически нет.

    В Казнете как в таковом пока еще совсем нечего искать. Сайтов на казахском — мизер. Если поисковик и будет создан, то искать он будет по сотне — другой сайтов, из которых половина — государственные ресурсы. А как же экономическая эффективность? Откуда берутся у поисковиков деньги? В основном от продажи контекстной рекламы. Они выступаю на этом рынке брокерами. А можно ли продавать рекламу с госсайтов? Нет конечно! А негосударственных сайтов на казахском языке у нас очень мало!

    В чем же видится выход из этой ситуации? Выход есть. Нужно создавать сайты на казахском языке! Качественные и популярные. Только тогда, когда возникнет необходимость поиска по огромному количеству сайтов на казахском языке, только тогда нам и потребуется поисковик! Поисковик безусловно нужен, но для того чтобы он работал. Нужно то, что именно он будет искать. Нужен контент, нужны статьи, нужны сайты на казахском языке. Поднимем Казнет вместе!

    Подписывайтесь на каналы Profit.kz в Facebook и Telegram.

    Комментарии