Intelektualinės virtualios mokymo(si) sistemos: Markovo sprendimo priėmimo proceso taikymas
Straipsniai
Dalia Baziukaitė
Klaipėdos universitetas image/svg+xml
Publikuota 2004-12-17
https://doi.org/10.15388/LMR.2004.32273
PDF

Kaip cituoti

Baziukaitė, D. (2004) „Intelektualinės virtualios mokymo(si) sistemos: Markovo sprendimo priėmimo proceso taikymas“, Lietuvos matematikos rinkinys, 44(spec.), p. 797–801. doi:10.15388/LMR.2004.32273.

Anotacija

Straipsnyje aptariamos baigtinio Markovo sprendimo priėmimo proceso taikymo prielaidos virtualioms mokymosi sistemoms intelektualizuoti parodant, jog virtualioje mokymosi sistemoje veikiančių agentų būsenų aibė, agentų priimami sprendimai ir perėjimai iš vienos būsenos į kitą gali būti modeliuojami taikant Markovo sprendimo priėmimo procesų ir sustiprinto mokymosi (Reinforcement-Learning) teori­jos rezultatus. Intelektuali mokymosi sistema suprantama kaip gebanti parinkti optimalų mokymosi kelią besimokančiajam ir koreguoti savo veiksmus atsižvelgdama į laikui bėgant įgytą patyrimą. Sustiprinto mokymosi problemai, optimalios vertės funkcijos V* (x) radimui, spręsti galima taikyti įvairius algoritmus. Vienas jų – tai Q-mokymosi (Q-learning) algoritmas, leidžiantis surasti optimalią Q* (x, a) funkciją. Stochastinės aproksimacijos teoremos sąlygų įvykdymas Q-mokymosi algoritme užtikrina algoritmo konvergavimą į optimalią Q* (x, a), o tai reiškia ir į optimalią vertės funkciją V* (x).

PDF

Nuorodos

Creative Commons License

Šis darbas apsaugotas Creative Commons priskyrimo 4.0 viešąja licencija.

Atsisiuntimai

Nėra atsisiuntimų.

Dažniausiai skaitomi to paties autoriaus (-ių) straipsniai