Emne
Reinforcement Learning (E-DAT504)
Kunstig intelligens har blitt synonymt med veiledet og ikke veiledet læring. Veiledet læring er best egnet for situasjoner som har et stort sett med treningsdata, og målet er å lære basert på slike treningsdata for å gi gode resultater med bruk av nye, ukjente inndata. Forsterkende læring (RL) ligger et sted mellom veiledet og ikke veiledet læring.
Dette er emnebeskrivelsen for studieåret 2025-2026. Merk at det kan komme endringer.
Fakta
Emnekode
E-DAT504
Vekting (stp)
5
Semester undervisningsstart
Vår
Undervisningsspråk
Engelsk
Antall semestre
1
Vurderingssemester
Vår
Innhold
Kunstig intelligens har blitt synonymt med veiledet og ikke veiledet læring. Veiledet læring er best egnet for situasjoner som har et stort sett med treningsdata, og målet er å lære basert på slike treningsdata for å gi gode resultater med bruk av nye, ukjente inndata. Tekstklassifisering, bildeklassifisering, objektplassering og regresjonsoppgaver er områder hvor veiledet læring er mye brukt. Mens ikke veiledet læring brukes for å oppdage en skjult struktur av dataene uten å måtte ha den spesifikke kunnskapen om datasettet. Slike læringsteknikker brukes ofte for gruppering og klassifisering av data.
Forsterkende læring (RL) ligger et sted mellom veiledet og ikke veiledet læring. På den ene siden bygger den på etablerte metoder for veiledet læring, som funksjonstilnærming, stokastisk gradientnedstigning og tilbakepropagasjon for å lære datarepresentasjon. På den annen side kreves det ikke veiledet læring for å oppdage skjulte mønstre og relasjoner i data. Forsterkende læring fokuserer først og fremst på problemet med automatisk læring av optimale beslutninger over tid i et komplekst miljø ved å bygge på fremskritt innen informatikk, atferdspsykologi og nevrovitenskap. På grunn av sin fleksibilitet og generalitet utvikler RL-feltet seg veldig raskt og tiltrekker seg mye oppmerksomhet, både fra forskere som prøver å forbedre eksisterende metoder eller lage nye metoder, og fra utviklere som er interessert i å løse sine problemer på den mest effektive måten.
Målgruppen for dette kurset vil være fagfolk og studenter som arbeider eller er interessert i områder innen kunstig intelligens, maskinlæring, spillteori, kontrollteori, informasjonsteori, simuleringsbasert optimalisering, multiagentsystemer, svermintelligens og statistikk.
Læringsutbytte
Kurset gir relevant teoretisk og praktisk programmeringskunnskap. Hver del av emnet demonstreres ved hjelp av enkle eksempler fra den virkelige verden. Følgende emner vil bli dekket i løpet av kurset:
- Topic 1: Reinforcement Learning - an introduction
- Topic 2: Course Materials, Supplementary Resources, and Development Environment
- Topic 3: Tabular Methods
- Topic 4: Dynamic Programming
- Topic 5: Monte-Carlo & Temporal Difference and Q-Learning
- Topic 6: Policy Gradients
- Topic 7: The Actor-Critic Method
- Topic 8: Deep Q-Network - an Overview
- Topic 9: Further Exploration
Forkunnskapskrav
Eksamen / vurdering
Vurderingsform | Vekting | Varighet | Karakter | Hjelpemiddel |
---|---|---|---|---|
Individuell hjemmeeksamen | 1/1 | Bokstavkarakterer |
Tre obligatoriske oppgaver - godkjent / ikke godkjent
Innleveringer skal gi kodeløsninger på de respektive problemene med riktig dokumentasjon
Fagperson(er)
Instituttleder:
Tom RyenEmneansvarlig:
Antorweep ChakravortyArbeidsformer
- 10 - 12 videoforelesninger via nett.
- Tre "use-case"-baserte innleveringsoppgaver.
- 4 nettbaserte samlinger med foreleser til stede for gjennomgang av oppgaver.