Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
http://lpc-dspace.org.ua/jspui/handle/123456789/1017| Назва: | ІННОВАЦІЙНІ МОВНІ ТЕХНОЛОГІЇ ТА ШТУЧНИЙ ІНТЕЛЕКТ: РОЗРОБКА ТА ЗАСТОСУВАННЯ ПЛАТФОРМИ POLYHEDRON НА ОСНОВІ УКРАЇНСЬКИХ ЛЕКСИКОГРАФІЧНИХ ТЕОРІЙ |
| Автори: | Надутенко, Максим Вікторович Надутенко, Маргарита Володимирівна Фаст, Ольга Леонідівна |
| Ключові слова: | методи штучного інтелекту обробка природної мови лексикографічні технології динамічні онтології морфолого-семантичний аналіз нейронні мережі мультикритеріальний аналіз POLYHEDRON |
| Дата публікації: | 25-жов-2024 |
| Видавництво: | Академічні студії. Серія "Гуманітарні науки". |
| Бібліографічний опис: | Інноваційні мовні технології та штучний інтелект: розробка та застосування платформи Polyhedron на основі українських лексикографічних теорій. Академічні студії. Серія «Гуманітарні науки». 2024. (3). С. 38–48. |
| Короткий огляд (реферат): | У статті представлено комплексний підхід до створення та впровадження інтелектуальних мовних технологій, розроблених авторами POLYHEDRON, що ґрунтуються на фундаментальних лексикографічних теоріях, розроблених Українським мовно-інформаційним фондом НАН України. Автори акцентують увагу на сімействі технологій POLYHEDRON, яке включає інструменти для лексикографічного та корпусного опрацювання текстів, системи парсингу файлів різних форматів, модулі морфолого-семантичного аналізу, а також інноваційні засоби побудови динамічних онтологій і підтримки прийняття рішень. Завдяки цьому забезпечується багаторівнева обробка природної мови (української, англійської, російської, французької, німецької та італійської) та створення масштабованих інформаційних ресурсів, орієнтованих як на науковий, так і на прикладний використок. Центральний елемент дослідження – гібридна архітектура, що об’єднує статистичні методи (глибокі нейронні мережі типу трансформерів) із лексикографічно-онтологічними моделями. Такий підхід дозволяє водночас ефективно аналізувати синтаксичну й семантичну структуру речень, виявляти латентні зв’язки між термінами й концептами та формувати динамічні онтології, які постійно оновлюються на основі нових текстових даних. У роботі особливо підкреслено роль технологій динамічного стискання знань, які забезпечують оптимізоване зберігання та обробку інформації, даючи змогу використовувати менші за обсягом нейронні моделі без погіршення точності аналізу. Одним із ключових напрямів застосування описаних технологій є автоматизований моніторинг та аналіз великих масивів тексту, включно з документами правового характеру, науково-технічними публікаціями, медіа-матеріалами тощо. Для цього було розроблено окремі підсистеми парсингу (MxParse, MxDocArch, OCR-модулі), що підтримують формати DOC, PDF, TXT, HTML та інші, а також розпізнають відскановані зображення й аудіо/ відео-файли. Важливу роль відіграють технології «AVALANCHE» та «INVISIBLE», розроблені авторами, які забезпечують унікальні можливості для швидкої індексації та пошуку даних у багатомовних корпусах: перша відповідає за постійне зберігання мільярдів об’єктів на диску, а друга – за ефективну роботу з великими структурами в оперативній пам’яті. У статті також представлено платформу INTELLIGENCE-ANALYTICS, що поєднує три важливі складові: нейронну мережу, онтологічний модуль і механізми мультикритеріального аналізу (MCDA). Така інтеграція дає змогу знаходити неочевидні зв’язки між документами, визначати пріоритети серед множини альтернатив, а також формувати гнучкі аналітичні звіти для прийняття рішень у реальному часі. Серед перспективних напрямів застосування – галузі національної безпеки, освіти, правової експертизи, наукових досліджень, а також інформаційного менеджменту у великих організаціях. Автори наголошують на критичній важливості розвитку власних національних мовних моделей, зокрема українськомовних, які можуть бути конкурентоспроможними з зарубіжними аналогами. Запропоновані концепції підтверджують, що укорінення лексикографічно-онтологічного підходу разом із сучасними нейронними алгоритмами дозволяє зберегти якість обробки при зменшенні розміру моделей та обчислювальних ресурсів. Це особливо актуально з огляду на обмеження цільового фінансування та інфраструктурні виклики. Завдяки проведеним дослідженням та співпраці з партнерами з наукових і освітніх установ створено унікальні напрацювання, які здатні прискорити темпи оцифрування документів, підтримати розвиток високотехнологічних продуктів в Україні та зміцнити інформаційну безпеку. У статті підкреслено потребу консолідації науково-технічного потенціалу, формування державно-приватних проєктів і розширення партнерства між установами НАН України, університетами й приватним сектором. Автори вбачають у цьому головний імпульс до створення інтегрованої мовно-інформаційної екосистеми, здатної вирішувати інтелектуальні виклики сучасності та стимулювати науково-технологічний прогрес у країні. |
| URI (Уніфікований ідентифікатор ресурсу): | http://lpc-dspace.org.ua/jspui/handle/123456789/1017 |
| Розташовується у зібраннях: | Кафедра загальної педагогіки, психології та методики початкової освіти |
Файли цього матеріалу:
| Файл | Опис | Розмір | Формат | |
|---|---|---|---|---|
| 615-Текст статті-1153-1-10-20250130.pdf | 610,01 kB | Adobe PDF | Переглянути/Відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.