Програмне виявлення україномовних текстів, згенерованих ШІ: методи, оцінки, виклики

Рейтинг користувача:  / 0
ГіршийКращий 

Authors:


С. Д. Приходченко*, orcid.org/0000-0002-6562-0601, Національний технічний університет «Дніпровська політехніка», м. Дніпро, Україна, Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.

О. Ю. Приходченко, orcid.org/0000-0001-5080-737X, Національний технічний університет «Дніпровська політехніка», м. Дніпро, Україна, e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.

О. С. Шевцова, orcid.org/0000-0002-0148-5877, Національний технічний університет «Дніпровська політехніка», м. Дніпро, Україна, e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.

І. Г. Олішевський, orcid.org/0000-0001-8573-3366, Національний технічний університет «Дніпровська політехніка», м. Дніпро, Україна, e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.

* Автор-кореспондент e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.


повний текст / full article



Naukovyi Visnyk Natsionalnoho Hirnychoho Universytetu. 2025, (4): 150 - 159

https://doi.org/10.33271/nvngu/2025-4/150



Abstract:



Мета.
Оцінка ефективності існуючих інструментів виявлення тексту, згенерованого штучним інтелектом, для виявлення машинно-генерованого контенту у кваліфікаційних роботах студентів. Дослідження має на меті проаналізувати точність, надійність і обмеження цих методів виявлення, зокрема для текстів, написаних українською мовою, а також вивчити потенційні покращення розпізнавання вмісту ШІ.


Методика.
У дослідженні використовується поєднання статистичного аналізу й експериментальної оцінки інструментів виявлення ШІ. Набір даних академічних текстів, створених ШІ і написаних людиною, використовується для оцінки точності виявлення з додатковими експериментами, проведеними для аналізу впливу мовних структур, ефектів перекладу та формалізації тексту. Дослідження також включає обчислювальні методи для вивчення рівня помилок і визначення закономірностей у розпізнаванні контенту, створеного ШІ.


Результати.
Результати дослідження дають зрозуміти продуктивність поточних систем виявлення ШІ, підкреслюючи їхні сильні й слабкі сторони. Аналіз виявив значні проблеми із виявленням тексту, створеного штучним інтелектом, особливо не англійською мовою, таких як українська. Крім того, дослідження визначає вплив перекладу на точність виявлення та обговорює ефективність різних лінгвістичних і статистичних підходів.


Наукова новизна.
Це дослідження робить внесок у поточний дискурс про академічну доброчесність, розглядаючи обмеження інструментів виявлення ШІ для неангломовних академічних текстів. На відміну від попередніх досліджень, що зосереджені в основному на англомовному контенті, створеному штучним інтелектом, це дослідження пропонує унікальний погляд на проблеми виявлення тексту, створеного штучним інтелектом, українською мовою, пропонуючи нові погляди на адаптацію моделей виявлення для різноманітних мовних контекстів.


Практична значимість.
Результати цього дослідження є цінними для викладачів, дослідників і політиків, які займаються підтриманням академічної доброчесності в епоху генеративного ШІ. Виявляючи слабкі місця в поточних системах виявлення та пропонуючи можливі вдосконалення, дослідження створює основу для розробки більш надійних методологій виявлення ШІ, які можна ефективно застосовувати до академічних текстів кількома мовами.


Ключові слова:
згенерований ШІ текст, академічна доброчесність, інструменти виявлення, вища освіта, обробка природної мови, машинне навчання, багатомовний аналіз тексту

References.


1. Shah, A., Ranka, P., Dedhia, U., Prasad, S., Muni, S., & Bhowmick, K. (2023). Detecting and Unmasking AI-Generated Texts through Explainable Artificial Intelligence using Stylistic Features. International Journal of Advanced Computer Science and Applications, 14, 110. https://doi.org/10.14569/IJACSA.2023.01410110

2. Majhi, D., & Santra, P. (2023). Scholarly Communication and Machine-Generated Text: Is it Finally AI vs AI in Plagiarism Detection? SRELS Journal of Information Management, 60, 173-181. https://doi.org/10.17821/srels/2023/v60i3/171028

3. Kumarage, T., Agrawal, G., Sheth, P., Moraffah, R., Chadha, A., Garland, J., & Liu, H. (2024). A Survey of AI-generated Text Forensic Systems: Detection, Attribution, and Characterization. https://doi.org/10.13140/RG.2.2.23893.60645

4. Rashidi, H., Fennell, B., Albahra, S., Hu, B., & Gorbett, T. (2023). The ChatGPT conundrum: Human-generated scientific manuscripts misidentified as AI creations by AI text detection tool. Journal of Pathology Informatics, 14, 100342. https://doi.org/10.1016/j.jpi.2023.100342

5. Mindner, L., Schlippe, T., & Schaaff, K. (2023). Classification of Human- and AI-Generated Texts: Investigating Features for ChatGPT. https://doi.org/10.1007/978-981-99-7947-9_12

6. Amirjalili, F., Neysani, M., & Nikbakht, A. (2024). Exploring the boundaries of authorship: a comparative analysis of AI-generated text and human academic writing in English literature. Frontiers in Education. https://doi.org/10.3389/feduc.2024.1347421

7. Ma, Y., Jiawei, L., & Yi, F. (2023). Is This Abstract Generated by AI? A Research for the Gap between AI-generated Scientific Text and Human-written Scientific Text. https://doi.org/10.48550/arXiv.2301.10416

8. Chaka, C. (2024). Reviewing the performance of AI detection tools in differentiating between AI-generated and human-written texts: A literature and integrative hybrid review. Journal of Applied Learning & Teaching, 7, 1-12. https://doi.org/10.37074/jalt.2024.7.1.14

9. Weber-Wulff, D., Anohina-Naumeca, A., Bjelobaba, S., Foltýnek, T., Guerrero-Dib, J., Popoola, O., Šigut, P., & Waddington, L. (2023). Testing of detection tools for AI-generated text. International Journal for Educational Integrity, 19. https://doi.org/10.1007/s40979-023-00146-z

10.      Gotoman, J., Luna, H., Sangria, J., Cereneo, C., & Barbuco, D. (2025). Accuracy and reliability of AI-generated text detection tools: A literature review. American Journal of IR 4.0 and Beyond, 4(1), 1-9. https://doi.org/10.54536/ajirb.v4i1.3795

11.      Chaka, C. (2024). Accuracy pecking order – How 30 AI detectors stack up in detecting generative artificial intelligence content in university English L1 and English L2 student essays. Journal of Applied Learning & Teaching, 7(1), 1-13. https://doi.org/10.37074/jalt.2024.7.1.33

12.      Ladha, N., Yadav, K., & Rathore, P. (2023). AI-generated content detectors: Boon or bane for scientific writing. Indian Journal of Science and Technology, 16(39), 3435-3439. https://doi.org/10.17485/IJST/v16i39.1632

13.      Price, G., & Sakellarios, M. (2023). The effectiveness of free software for detecting AI-generated writing. International Journal of Teaching, Learning and Education, 2(6), 31-38. https://doi.org/10.22161/ijtle.2.6.4

14.      Walters, W. (2023). The effectiveness of software designed to detect AI-generated writing: A comparison of 16 AI text detectors. Open Information Science, 7. https://doi.org/10.1515/opis-2022-0158

15.      László, B. (2024). Artificial Intelligence-Generated Text in Higher Education ‒ Usage and Detection in the Literature. Interdisciplinary Description of Complex Systems, 22, 238-245. https://doi.org/10.7906/indecs.22.3.1

16.      Jung, M., Panizo, C., Dugan, L., Fung, M., Chen, P.-Y., & ­Liang, P. (2025). Group-adaptive threshold optimization for robust AI-generated text detection. arXiv Preprint. https://doi.org/10.48550/arXiv.2502.04528

17.      Ji, J., Guo, J., Qiu, W., Huang, Z., Xu, Y., Lu, X., Jiang, X., Li, R., & Li, S. (2025). I know myself better, but not really greatly: Using LLMs to detect and explain LLM-generated texts. arXiv Preprint. https://doi.org/10.48550/arXiv.2502.12743

18.      Shivarkar, P. (2025). LLM AI-generated text detection. International Journal of Scientific Research in Engineering and Management, 9(1), 1-9. https://doi.org/10.55041/IJSREM41593

19.      Walker, E., Evans, L., Mitchell, A., Zhang, Z., Patel, R., & Chen, I. (2024). Text classification in detection of AI-generated content using BERT. ResearchGate Preprint. https://doi.org/10.13140/RG.2.2.30193.90722

20.      Krois-Lindner, A. (2011). International legal English: a course for classroom or self-study use. Cambridge University Press. Cambridge professional English. ISBN 9783125351905.

 

Наступні статті з поточного розділу:

Попередні статті з поточного розділу:

Відвідувачі

12630885
Сьогодні
За місяць
Всього
6754
364061
12630885

Гостьова книга

Якщо у вас є питання, побажання або пропозиції, ви можете написати їх у нашій «Гостьовій книзі»

Реєстраційні дані

ISSN (print) 2071-2227,
ISSN (online) 2223-2362.
Журнал зареєстровано у Міністерстві юстиції України.
Реєстраційний номер КВ № 17742-6592ПР від 27.04.2011.

Контакти

49005, м. Дніпро, пр. Д. Яворницького, 19, корп. 3, оф. 24 а
Тел.: +38 (066) 379 72 44.
e-mail: Ця електронна адреса захищена від спам-ботів. вам потрібно увімкнути JavaScript, щоб побачити її.
Ви тут: Головна Індексація журналу UkrCat Архів журналу 2025 Зміст №4 2025 Програмне виявлення україномовних текстів, згенерованих ШІ: методи, оцінки, виклики