Зображення

ШІ з українським ДНК. Навіщо Україна створює свою мовну модель і коли вона запрацює

11.03.2026 10:50 | Всі новини

Українська LLM захистить дані та не збреше про Крим

Україна планує увійти в трійку світових лідерів із розвитку та впровадження штучного інтелекту. Необхідна для цього інфраструктура створюється вже сьогодні.

Про це в інтерв'ю РБК-Україна розповів керівник напряму ШІ Міністерства цифрової трансформації України Данило Цьвок.

Читайте також: Штучний інтелект стає "дурнішим"? Microsoft знайшла слабкість у ChatGPT та Gemini

Головне:

  • Амбітна мета: Україна прагне увійти до топ-3 країн світу з розвитку ШІ вже до 2030 року.
  • АІ-суверенітет: українські фахівці створюють власну "фабрику ШІ" та національну мовну модель.
  • Український контекст: власна АІ-інфраструктура дозволить захистити дані й оперувати правдивою інформацією.
  • Доступність: спершу українська LLM стане основою для державних чатботів та AI-асистентів, але пізніше модель буде open-source (доступною для всіх).

Як Україна будує АІ-інфраструктуру

Експерт поділився, що наразі є важлива "місія" - "увійти в трійку країн світу з розвитку та впровадження ШІ до 2030 року".

"Зараз ми переходимо від цифрової до агентивної держави, де AI-асистенти проактивно задовольняють потреби громадян і держави", - додав Цьвок.

Водночас він нагадав, що "справжній прогрес неможливий без АІ-суверенітету".

Саме для цього, за словами спеціаліста, Україна будує власну інфраструктуру:

  • AI Factory (так звану фабрику штучного інтелекту, першу в країні державну інфраструктуру для АІ-рішень);
  • національну LLM (велику мовну модель).

"Це гарантує безпеку даних та розвиток України як технологічного лідера", - наголосив Цьвок.

Україна може увійти в трійку країн світу з розвитку та впровадження ШІ до 2030 року (інфографіка РБК-Україна)

Що таке велика мовна модель або LLM

"Що таке українська велика мовна модель? Ми не створюємо новий ChatGPT або Gemini, чи будь-який інший продукт", - розповів представник Мінцифри.

Він пояснив, що "в межах кожного такого продукту є ядро, мозковий центр".

"Це ядро - велика мовна модель. Це - велика нейронна мережа, яка навчена на великих об'ємах інформації", - поділився Цьвок.

Навіщо Україні власна мовна модель

"Навіщо Україні національна велика мовна модель - LLM? Загально - іноземні моделі не мають глибокого розуміння українського контексту", - повідомив керівник напряму ШІ Мінцифри.

Він пояснив, що саме тому спеціалісти хочуть "створити модель, яка буде проукраїнською: розумітиме українську мову, культуру, історію, термінологію, національні особливості".

"По суті, це закладання цеглинки нашого ДНК у сферу штучного інтелекту. Наразі Мінцифра це робить у партнерстві з компанією Kyivstar", - поділився Цьвок.

Друга причина, за його словами, полягає в тому, що зараз люди живуть "в умовах інформаційної війни".

"Особливо важливо, щоб моделі давали відповіді на політичні й історичні теми без упереджень щодо України", - наголосив експерт.

Так, умовно кажучи, "не має виникати сумніву щодо Криму або щодо причин, які спровокували війну на Сході України". Або "що таке, наприклад, так звані ЛНР чи ДНР".

"Треба розуміти, що наш ворог також веде свою роботу. У нього свої підходи, як отруювати наявні на ринку великі мовні моделі. Тому нам потрібно мати насамперед першоджерело правди", - розповів Цьвок.

Насамкінець третя причина - "українська LLM буде в 2,5-3 рази дешевша за іноземні аналоги".

Україна створює власну велику мовну модель (інфографіка РБК-Україна)

"Маючи власну інфраструктуру та власну національну велику мовну модель, яка працює на державній інфраструктурі, ми повністю забезпечуємо AI-суверенітет. Це гарантує, що дані жодним чином не виходять за межі країни", - наголосив урядовець.

Отже, по суті, AI-суверенітет - здатність країни самостійно розробляти, запускати й контролювати системи штучного інтелекту (без критичної залежності від іноземних компаній, хмар чи моделей).

Коли може з'явитись перша версія української LLM

Цьвок розповів також, що нині українська мовна модель "якраз перебуває в активній фазі створення".

"Є технологічна частина, яку взяла на себе компанія партнер Kyivstar. Вони відповідають за процес розробки й тренування великої мовної моделі. Ми як держава відповідаємо за збір та агрегацію даних, на яких проводитимуть донавчання моделі", - поділився експерт.

Він зауважив, що зараз триває найважливіший етап - збір даних.

"До цього процесу залучені державні інституції, університети, наукові заклади, бізнеси, медіа тощо. Зусилля зосереджені на системі тестування (так звані бенчмарки). Вони вимірюють, наскільки добре модель знає українську історію, мову та чи дотримується вона етичних норм і права власності", - пояснив фахівець.

Крім того, було розроблено:

  • критичні компоненти архітектури (наприклад, "токенайзер"), без яких неможливо побудувати велику мовну модель;
  • пайплайн - послідовність певних кроків на рівні комп'ютерної інженерії (навчання крок за кроком на цих великих даних).

"Українська LLM буде основою для державних чатботів та AI-асистентів. Спочатку ми інтегруємо модель у "Дія.АІ", а потім в АІ-тьютор у "Мрії", - поділився планами на майбутнє Цьвок.

Після тестування, за його словами, "модель стане open-source - доступна для всіх".

Це дасть змогу бізнесу, науковцям і громадським організаціям створювати власні продукти.

"Плануємо так, щоб з першою версією моделі ми вийшли на кінець весни 2026 року", - підсумував керівник напряму ШІ Міністерства цифрової трансформації.

Нагадаємо, раніше ми розповідали про штучний інтелект на НМТ - чи "допустять" його до створення тестів і перевірки знань українців.

Крім того, ми пояснювали, чи забере ШІ вашу роботу та як може змінитись ринок праці в епоху штучного інтелекту.

Читайте також, коли "цифрові" документи з "Дії" будуть визнавати в ЄС.