"Абай жолын" Абай жазды деп жауап берді": Қазақстандық ЖИ KazLLM-ді желі қолданушылары сынап тастады

Қазақстандықтар ЖИ және цифрлық даму министрі Жаслан Мәдиевтің Тоқаевқа берген есебіне күмән келтірді. Министрдің сөзінше, қазір отандық KazLLM өнімін 600 мыңнан астам адам, ал Aitu мессенджерін 700 мыңнан астам қазақстандық, ChatGPT-ді Қазақстан халқының 13%-ы ғана пайдаланады екен. Осы мәлімдемеден соң қазақстандықтар отандық ЖИ-ді пайдаланып, оның қате жауаптарын желіде бөлісті. Бұл туралы Stan.kz ақпарат агенттігі хабарлайды.
"KazLLM-ді 600 мыңнан астам адам пайдаланады"
Президент Қасым-Жомарт Тоқаев үкіметтің кеңейтілген отырысында ұлттық тілдік модель KazLLM-ге сұраныс төмен екенін ескертті.
"KazLLM бағдарламасына қатысты сұрақтарым бар. Білуімше, бұл бағдарламаға сұраныс әлі де төмен. Себебі оның жетілдіруді қажет ететін тұстары көп. Халық негізінен ChatGPT-ге жүгінеді, KazLLM-ге көшкісі келмейді. Бұл жағы қалай болып жатыр?" – деп сұрады Тоқаев Мәдиевтен.
Жауап ретінде жасанды интеллект және цифрлық даму министрі Жаслан Мәдиев бүгінде екі ірі тілдік модель – KazLLM және AlemLLM жұмыс істеп тұрғанын айтты. Олар EgovAI және басқа да жүйелерді қоса алғанда, 40-тан астам жүйеге енгізілген екен.
"Олар стартап компаниялардың студенттері мен IT компанияларға қолжетімді. Мұндай жүйелердің сапасын үнемі жетілдіріп отыру қажет, сондықтан халықаралық деңгейдегі сарапшылармен бірлесіп жұмысты жалғастыра береміз", – деді Мәдиев.
Жаслан Мәдиев KazLLM-ді 600 мыңнан астам адам пайдаланатынын, ал ChatGPT-ді Қазақстан халқының 13%-ы, Aitu мессенджерін 700 мыңнан астам қазақстандық қолданатынын айтты. Дегенмен президент бұл деректі тексеру керек екенін ескертті. "Көрейік. Мұны тексеру керек", – деді Тоқаев.
"Бәріне рахмет. Мен қайтадан GPT мен Gemini-ге кеттім"
Желі қолданушылары да ЖИ министрінің сөзіне күмән келтірді. Олар KazLLM-нің сайтын тапқанымен, ЖИ-ді қолдана алмағанын айтып отыр.
"600 пайдаланушысы бар әрі ChatGPT-ге бәсекелес делінген отандық KazLLM туралы іздеп көрдім. Сайтын көремін деп үміттендім. Мен қарапайым қолданушымын. Біздейлер үшін жасалған шығар деп ойладым. Бірақ сайтын таппадым. Тек әзірлеушілердің сайты мен жаңалыққа сілтемелері бар екен. Бірінші сілтемеге өттім, онда тұтас бір мәтін толып тұр, ал кез келген генеративті ЖИ-дағыдай үйреншікті іздеу жүйесін көрмедім. Әрі қарай іздей бердім. Сөйтсем, 6 модель Hugging Face репозиторийінде қолжетімді екен. Мен отандық ЖИ-мен сөйлесіп көргім келген еді, бірақ бюрократияның ортасына түсіп кеткендей болдым. Қысқасы, баршаңызға рахмет. Мен қайтадан GPT мен Gemini-ге кеттім", – деп пікір білдірді қазақстандық пайдаланушы.
"Қазақстандық ЖИ "Абай жолын" Абай жазды дейді"
Ізінше басқа қазақстандықтар да KazLLM-ді пайдаланып көргендерін жазды. Анықталғандай KazLLM жасаған ЖИ – Oylan 3.0 оңай сұрақтарға қате жауап берген.
"Мен де қазақстандық LLM-ді пайдаланып көрейін деп ойладым. KazLLM, Gemini және ChatGPT-ге бірдей сұрақ қойдым", – деп үш ЖИ бір сұраққа қалай жауап бергенін көрсетті.
ChatGPT мен Gemini "Абай жолы" романын Абай жазған ба?" деген сұраққа дұрыс, яғни "Жоқ, "Абай жолын" Мұхтар Әуезов жазған" деп жауап берген. Ал ISSAI KazLLM бұл сұраққа қате, яғни "Абай жолын" Абай жазған" деп жауап беріп, соңынан Абайдың портреттерін ұсынған. Дегенмен басқа бір қолданушы ISSAI KazLLM-ге дәл осы сұрақты қойғанда ол осы жолы дұрыс жауап берген.

Желі қолданушылары қазақстандық жасанды интеллекті сынап тастады. Олардың сөзінше, KazLLM-нің тілі қытай-америкалық. Оның сыртын өзгертіп, өзіміздікі етіп шығарғаннан не пайда дейді:
- Өзі Llama болып тұрса, оның несі қазақстандық?
- Билігіміз қандай болса, жасанды интеллектіміз де сондай!
- Қысқасы, ISSAI жасанды интеллектіне кіргенде төменде тұрған глобус белгішесін басу керек екен. Сол кезде қалыпты жұмыс істейді, бірақ бұл да нақты емес.
- Қытай-америкалық бірдеңені алып, оны "жөндеп", өзіміздікі деп шығарып, тауарлық белгісін жапсыра сал да, алға бас. Шын мәнінде кәдімгідей бизнес жоспар сияқты естіледі екен.
"Жаңа технологиялар өзінің ісіне берік, "жанып-күйіп, сол үшін өлем" деп тұрған адамдардың арқасында туады. Ал министрлікте қарапайым бюджектер, олар айлыққа жұмыс істейді, сенбі-жексенбі демалады, таңнан кешке дейін ғана кеңседе отырады. Ал Сэм Альтмандар (Open AI директоры) күні-түні гипотеза тексеріп, пәленбай инвесторға жұмысын таныстырып, Нвидиа, Ораклдармен достасып, миллиардтап ақша жұмсап жатыр. Ал осы тұста Қазақстанның бір министрлігі ChatGPT аналогын жасайды деген – өтірік әңгіме. Біздікілер үшін оңайы Google, ОpenAI-лармен келісіп, солардың өнімін мектеп, универ, бюракратияға енгізе салуға болатын еді", – деп пікір білдірді қазақстандық.
Осы ретте біз де KazLLM-нің өнімі Oylan 3.0 жасанды интеллектін сынап көрдік. Дегенмен интеллект орысша мәтінді қазақшаға аудара алмады. Сонымен қатар сурет те жасап бере алмады, тек ойланып тұрып қалды.

Бүгінде іс жүзінде қазақстандық AITU App Store-дан 10 мың рет жүктелген, ал Play Market-тен жүктелгені 5 мыңға да жетпейді. Бұл ретте AITU-ды мемлекеттік қызметкерлерге мәжбүрлеп жүктетіп жатқанын ескеру керек дейді қолданушылар.
ISSAI KAZ-LLM-ді жасауға 3,9 миллиард теңге бөлінген
Түсіндіре кетейік, ISSAI KAZ-LLM – қазақ тілінің үлкен тілдік моделі. Ал ISSAI – ақылды жүйелер мен жасанды интеллект институты. Оны Қазақстан халқының өмір сапасын жақсарту және экономикалық дамуды ынталандыру мақсатында генеративті ЖИ жетістіктерінен пайда көруі үшін әзірленген.
ISSAI KAZ-LLM – тілдік модель ғана, бұл жасанды интеллектің өзі емес. Сондықтан да қазақстандықтар мұны қолдана алмай отыр. Бүгінде ISSAI дайындаған ЖИ-ді oylan.nu.edu.kz деген мекенжай бойынша қолдануға болады.
KAZ-LLM-ді неліктен пайдалана алмаймыз?
Өзін KazLLM-ді үйреткен компанияға қатысы бар инженермін деп таныстырған Ренат Алимбеков қазақстандықтар неліктен KazLLM-ді қолдана алмай отырғанын түсіндірді.
"Инженер ретінде жауап берейін. Әуелі көпшілік біле бермейтін фактілерді айтайын: KazLLM 8 DGX H100 серверінде 50 күн бойы оқытылды. Бюджеті – 3,9 млрд теңге. Команда 70 адамнан тұрады. Нәтиже қандай? Модель HuggingFace-те коды ашық платформа) жатыр. Оны іске қосу үшін әрқайсысы 80GB болатын 2 видеокарта керек. Үйіңізде сондай бар ма? Менде жоқ. Ешкім ашық айтпай отырған мәселе мынау: KazLLM – өнім емес, зерттеу. Бірақ research (зерттеу) пен product (өнім) – екі бөлек әлем. ChatGPT – өнім: кіресің, жазасың, жауап аласың. KazLLM – 150 гигабайттық .tar файл, екі H100-і бар инженерге арналған", – дейді ол.
Ренат Алимбековтің сөзінше, министрліктегілер тілдік модельді халыққа "қазақстандық ChatGPT" деп таныстырған.
"Шенеуніктер халыққа "қазақстандық ChatGPT" деп сатты, ал іс жүзінде олар бағдарламашыларға арналған модель шығарды. Адамдар өздерін алданғандай сезініп отыр, бұл орынды. Тағы айтатыным: өз өнімдерімде KazLLM-ді қолдандым және ол қазақша аударғанда шынымен жақсы нәтиже көрсетеді. GPT-4o мен Gemini қазақшада жиі галлюцинация жасайды, септіктерді шатастырады, орыс тілінен калька береді. Бұл тұрғыда KazLLM айтарлықтай дәлірек, модель 150+ миллиард қазақша токенде оқытылғаны сезіледі. Мәселе модельдің сапасында емес. Модель мықты. Мәселе – қарапайым адам оны "ұстап көре" алмайды. ISSAI командасы күрделі инженерлік жұмыс атқарды. Бірақ модель мен адамдардың арасында көпір салынбады. Адамдарға .tar файл емес, "Қазақша сұрау" деген батырма керек", – деп түсіндірді маман.
Ал Aitu SuperApp деген не?
Aitu SuperApp – қазақстандық қосымша және мессенджер. Бизнес үшін қолданылатын бұл қосымшаға жасанды интеллект те енгізілген. Aitu BTS Digital цифрлік экожүйесіне кіреді. Бұл қолданбаны Kazdream Technologies IT-холдингі әзірлеген.
2021 жылғы мамырдан бастап Aitu қосымшасында қолданушылар COVID-19 пандемиясы кезінде өзекті болған Ashyq қызметін де қолданған. Сол жылғы шілдеде онда egov.kz электронды үкімет қызметі де, соның ішінде түрлі мемлекеттік анықтамаларға қол жеткізу қосылды.
2025 жылғы тамызда Қазақстан үкіметі мемлекеттік органдар Aitu қосымшасына көшетінін хабарлады. Шешім қабылдауда үкімет қосымшаның "заманауилығына, қауіпсіздігі мен ыңғайына" назар аударды. Шешімді Тоқаевтың өзі қолдады.
"233 миллиард теңгенің ұмытылмаған сабағы": Қазақстанға 2029 жылғы Азия ойындарын өткізудің пайдасы бар ма?