Propagandos atpažinimas lietuviškame tekste naudojant transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius

Paulius Zaranka; Gražina Korvel

doi:10.15388/LMITT.2024.22

Straipsniai

Paulius Zaranka

Vilniaus universitetas

Gražina Korvel

Vilniaus universitetas

Publikuota 2024-05-13

https://doi.org/10.15388/LMITT.2024.22

PDF

Esminiai žodžiai

propagandos atpažinimas
daugiakalbiai modeliai
transformeriai
iš anksto apmokyti modeliai
modelių adaptavimas

Anotacija

Didėjant informacijos kiekiui ir jos svarbai visuomenėje atsiranda vis didesnis poreikis automatinių įrankių, gebančių atpažinti propagandą. Dėl geopolitinės situacijos Lietuvos valstybė gali būti ypatingai pažeidžiama propagandinių mechanizmų, o automatinis jos atpažinimas lietuviškuose tekstuose yra nepakankamai ištyrinėta sritis. Šio darbo tikslas – išbandyti 3 pagrindinius transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius propagandos atpažinimui. Sprendžiamas binarinis klasifikavimo uždavinys, priskiriant tekstui propagandinio arba nepropagandinio teksto klasę. LitLat, XLM-R ir mBERT modeliai adaptuoti apmokant ekspertų suanotuotu duomenų rinkiniu. Nors geriausią, 88,5 % F1 statistikos įvertį pavyko pasiekti adaptavus LitLat iš anksto apmokytą modelį, kiti šiame darbe adaptuoti modeliai pasiekia panašius rezultatus.

PDF

Nuorodos

Šis darbas apsaugotas Creative Commons priskyrimo 4.0 viešąja licencija.

Atsisiuntimai

Nėra atsisiuntimų.

Dažniausiai skaitomi to paties autoriaus (-ių) straipsniai

Donata Petkutė, Gražina Korvel, Draudimo sektoriaus klientų atsiliepimų ir vertinimų nuotaikų kaitos analizė laike , Vilnius University Open Series: 2024: Konferencijos „Lietuvos magistrantų informatikos ir IT tyrimai“ darbai
Evelina Vaitkevičiūtė, Gražina Korvel, Propagandos technikų lingvistinių požymių lyginamoji analizė taikant natūralios kalbos apdorojimo metodus , Vilnius University Open Series: 2025: Konferencijos „Lietuvos magistrantų informatikos ir IT tyrimai“ darbai. 2025
Eglė Kondrataitė, Gražina Korvel, Early Detection of Rare Diseases using Natural Language Processing , Vilnius University Open Series: 2024: Konferencijos „Lietuvos magistrantų informatikos ir IT tyrimai“ darbai
Aidas Žygas, Gražina Korvel, Muzikos garso šaltinių atskyrimo giliojo mokymosi modelio SCNet apmokymas skirtingais duomenų rinkiniais , Vilnius University Open Series: 2025: Konferencijos „Lietuvos magistrantų informatikos ir IT tyrimai“ darbai. 2025
Emilija Bareikaitė, Gražina Korvel, Ieva Kilienė, Matematinių uždavinių klasifikavimas taikant natūralios kalbos apdorojimo ir mašininio mokymosi metodus , Vilnius University Open Series: 2026: Konferencijos „Lietuvos magistrantų informatikos ir IT tyrimai“ darbai
Vytautas Lėveris, Gražina Korvel, Investigation of VITS Text-to-Speech for the Lithuanian Language , Vilnius University Open Series: 2026: Konferencijos „Lietuvos magistrantų informatikos ir IT tyrimai“ darbai
Ignas Černiauskas, Gražina Korvel, Teksto požymių analizė ir jų efektyvumo vertinimas emocijų klasifikavimo uždavinyje , Vilnius University Open Series: 2026: Konferencijos „Lietuvos magistrantų informatikos ir IT tyrimai“ darbai