Мінцифри запускає проект з розробки LLM
Міністерство цифрової трансформації України (Мінцифри) оголосило про початок створення української великої мовної моделі (LLM), яка буде навчатися на унікальному наборі даних, щоб краще відповідати українському контексту. Про це повідомила пресслужба відомства під час Форуму Підприємців 2025, що проходить у Києві.
Співпраця з Київстаром
17 червня Мінцифри підписало меморандум з телекомунікаційною компанією «Київстар», яка стане стратегічним партнером та інвестором у розробці національної LLM. Міністр цифрової трансформації Михайло Федоров зазначив, що «Київстар» займатиметься розробкою, формуванням експертизи та навчанням цієї моделі.
«Проект з розробки національної LLM розрахований на дев’ять місяців», – додав Федоров. Після цього розпочнеться бета-тестування моделі, яке триватиме до 12 місяців. За словами заступника міністра цифрової трансформації Олександра Борнякова, в цей період модель буде безкоштовною для державних установ, вишів та інших організацій.
Команда та бюджет проекту
Для реалізації проекту знадобиться команда з 10-15 технічних спеціалістів та 30-40 лінгвістів. Директор з розробки цифрових продуктів «Київстар» Михайло Нестор під час презентації зазначив, що реалізація подібного проекту в Казахстані коштувала компанії Veon від 1,5 до 2 мільйонів доларів. В Україні планується витратити аналогічну суму.
Переваги національної LLM
Національна LLM стане основою для нових продуктів на базі штучного інтелекту, сприятиме розвитку стартапів, залученню інвестицій та економічному зростанню України. Федоров підкреслив, що ця модель краще враховуватиме українську мову, історію та контекст, ніж іноземні аналоги. «Вона буде доступнішою, дешевшою та безпечнішою, адже дані зберігатимуться в Україні», – додав він.
Інтеграція з державними сервісами
Під час бета-тестування національну LLM можуть інтегрувати з ШІ асистентом на порталі Дія, що дозволить перевірити її ефективність.
Що таке великі мовні моделі?
Великі мовні моделі (LLM) – це системи штучного інтелекту, які використовують нейронні мережі для обробки, аналізу та генерації тексту. Вони тренуються на величезних масивах даних, що дозволяє їм розуміти мову, контекст і стиль, а також створювати логічні тексти. Приклади таких моделей включають GPT-4 (OpenAI), Gemini (Google) та Llama (Meta).
Перспективи розвитку
Міністр цифрової трансформації Михайло Федоров анонсував, що першу версію україномовної LLM планують презентувати до кінця 2025 року. Це відкриє можливості для створення тисяч українських ШІ-продуктів, таких як віртуальні помічники, генератори тексту та інструменти програмування. Власна модель також посилить безпеку, адже іноземні LLM можуть не враховувати український контекст і бути вразливими до пропаганди. Локальна обробка даних стане ключовою для ШІ в обороні, уряді, медицині та фінансах.
Детальніше про це читайте у матеріалі Forbes.