Skatinamojo mokymosi taikymas automobiliui apmokyti sėkmingai pravažiuoti duotu maršrutu
Straipsniai
Oskaras Klimašauskas
Vilniaus universitetas image/svg+xml
Gintautas Dzemyda
Vilniaus universitetas image/svg+xml
Publikuota 2025-05-12
https://doi.org/10.15388/LMITT.2025.12
PDF

Anotacija

Šiame straipsnyje analizuojamas gilaus skatinamojo mokymosi (DRL) pritaikymas autonominiam automobilio valdymui simuliuotoje 2D lenktynių trasoje. Tyrimo metu lyginami du skirtingi įvesties duomenų tipai: spindulių pagrindu veikianti sistema, naudojanti atstumo iki trasos kraštų matavimus ir automobilio būsenos duomenis, bei vaizdo pagrindu veikianti sistema, apdorojanti aplink automobilį esančius vaizdus. Agentų mokymui naudojamas DDQN algoritmas, o jų veiklos efektyvumas vertinamas pagal nuvažiuotą atstumą. Eksperimentai atliekami su trimis skirtingomis mokymosi strategijomis: pradedant nuo trasos pradžios, pradedant atsitiktinėse trasos vietose ir mokant agentą dviejose skirtingose trasose. Tyrimo tikslas – nustatyti, kaip skirtingi įvesties duomenų tipai ir mokymosi strategijos veikia agentų mokymosi efektyvumą.

PDF

Nuorodos

Creative Commons License

Šis darbas apsaugotas Creative Commons priskyrimo 4.0 viešąja licencija.

Atsisiuntimai

Nėra atsisiuntimų.

Dažniausiai skaitomi to paties autoriaus (-ių) straipsniai