Neapykantos kalbos atpažinimas lietuviškuose komentaruose panaudojant dirbtinį intelektą
Articles
Eglė Kankevičiūtė
Vytautas Magnus University, Lithuania
Milita Songailaitė
Vytautas Magnus University, Lithuania
Justina Mandravickaitė
Vytautas Magnus University, Lithuania
Published 2023-05-11
https://doi.org/10.15388/LMITT.2023.3
PDF

Keywords

dirbtinis intelektas
teksto klasifikavimas
neapykantos kalba
transformerių neuroniniai tinklai

How to Cite

Kankevičiūtė, E., Songailaitė, M. and Mandravickaitė, J. (2023) “Neapykantos kalbos atpažinimas lietuviškuose komentaruose panaudojant dirbtinį intelektą”, Vilnius University Open Series, pp. 27–34. doi:10.15388/LMITT.2023.3.

Abstract

Šiame darbe pateikiame neapykantos kalbos aptikimo modelių palyginimą lietuvių kalbai. Neapykantos kalbai aptikti naudojome tris giliojo mokymosi modelius: daugiakalbį BERT, LitLat BERT ir Electra. Visi trys modeliai buvo adaptuoti lietuviškų komentarų klasifikavimui į tris klases: neapykantos, įžeidžią ir neutralią kalbą. Norint adaptuoti modelius atpažinti neapykantos kalbą, buvo parengtas anotuotas duomenų rinkinys, kuriame yra 25 219 lietuviški komentarai. Apmokyti modeliai buvo įvertinti naudojant tikslumo, atkūrimo, preciziškumo ir F1 statistikos metrikas. Geriausiai pasirodė LitLat BERT, kurio F1 statistikos reikšmė buvo 0,72. Antroje vietoje liko daugiakalbis BERT, kurio F1 statistika buvo 0,63, o trečioje vietoje liko Electra, kurio F1 statistika pasiekė 0,55.

PDF

Downloads

Download data is not yet available.

Most read articles by the same author(s)

1 2 3 4 5 > >>