Emne

Reinforcement Learning (E-DAT504)

Kunstig intelligens har blitt synonymt med veiledet og ikke veiledet læring. Veiledet læring er best egnet for situasjoner som har et stort sett med treningsdata, og målet er å lære basert på slike treningsdata for å gi gode resultater med bruk av nye, ukjente inndata. Forsterkende læring (RL) ligger et sted mellom veiledet og ikke veiledet læring.


Dette er emnebeskrivelsen for studieåret 2025-2026. Merk at det kan komme endringer.

Fakta

Emnekode

E-DAT504

Vekting (stp)

5

Semester undervisningsstart

Vår

Undervisningsspråk

Engelsk

Antall semestre

1

Vurderingssemester

Vår

Innhold

Kunstig intelligens har blitt synonymt med veiledet og ikke veiledet læring. Veiledet læring er best egnet for situasjoner som har et stort sett med treningsdata, og målet er å lære basert på slike treningsdata for å gi gode resultater med bruk av nye, ukjente inndata. Tekstklassifisering, bildeklassifisering, objektplassering og regresjonsoppgaver er områder hvor veiledet læring er mye brukt. Mens ikke veiledet læring brukes for å oppdage en skjult struktur av dataene uten å måtte ha den spesifikke kunnskapen om datasettet. Slike læringsteknikker brukes ofte for gruppering og klassifisering av data.

Forsterkende læring (RL) ligger et sted mellom veiledet og ikke veiledet læring. På den ene siden bygger den på etablerte metoder for veiledet læring, som funksjonstilnærming, stokastisk gradientnedstigning og tilbakepropagasjon for å lære datarepresentasjon. På den annen side kreves det ikke veiledet læring for å oppdage skjulte mønstre og relasjoner i data. Forsterkende læring fokuserer først og fremst på problemet med automatisk læring av optimale beslutninger over tid i et komplekst miljø ved å bygge på fremskritt innen informatikk, atferdspsykologi og nevrovitenskap. På grunn av sin fleksibilitet og generalitet utvikler RL-feltet seg veldig raskt og tiltrekker seg mye oppmerksomhet, både fra forskere som prøver å forbedre eksisterende metoder eller lage nye metoder, og fra utviklere som er interessert i å løse sine problemer på den mest effektive måten.

Målgruppen for dette kurset vil være fagfolk og studenter som arbeider eller er interessert i områder innen kunstig intelligens, maskinlæring, spillteori, kontrollteori, informasjonsteori, simuleringsbasert optimalisering, multiagentsystemer, svermintelligens og statistikk.

Læringsutbytte

Kurset gir relevant teoretisk og praktisk programmeringskunnskap. Hver del av emnet demonstreres ved hjelp av enkle eksempler fra den virkelige verden. Følgende emner vil bli dekket i løpet av kurset:

  • Topic 1: Reinforcement Learning - an introduction
  • Topic 2: Course Materials, Supplementary Resources, and Development Environment
  • Topic 3: Tabular Methods
  • Topic 4: Dynamic Programming
  • Topic 5: Monte-Carlo & Temporal Difference and Q-Learning
  • Topic 6: Policy Gradients
  • Topic 7: The Actor-Critic Method
  • Topic 8: Deep Q-Network - an Overview
  • Topic 9: Further Exploration

Forkunnskapskrav

Ingen

Eksamen / vurdering

Vurderingsform Vekting Varighet Karakter Hjelpemiddel
Individuell hjemmeeksamen 1/1 Bokstavkarakterer


Tre obligatoriske oppgaver - godkjent / ikke godkjent

Innleveringer skal gi kodeløsninger på de respektive problemene med riktig dokumentasjon

Fagperson(er)

Instituttleder:

Tom Ryen

Arbeidsformer

  • 10 - 12 videoforelesninger via nett.
  • Tre "use-case"-baserte innleveringsoppgaver.
  • 4 nettbaserte samlinger med foreleser til stede for gjennomgang av oppgaver.

Åpent for

Enkeltemner Teknisk-naturvitenskaplig fakultet - masternivå

Emneevaluering

Det skal være en tidligdialog mellom emneansvarlig, studenttillitsvalgt og studentene. Formålet er tilbakemelding fra studentene for endringer og justering i emnet inneværende semester.I tillegg skal det gjennomføres en digital emneevaluering minimum hvert tredje år. Den har som formål å innhente studentenes erfaringer med emnet.
Emnebeskrivelsen er hentet fra Felles studentsystem Versjon 1