Emne

Maskinlæring (ELE520)


Dette er emnebeskrivelsen for studieåret 2012-2013. Merk at det kan komme endringer.

Se emnebeskrivelse og eksamens-/vurderingsinfo for dette studieåret (2024-2025)

Semesters

Fakta

Emnekode

ELE520

Vekting (stp)

10

Semester undervisningsstart

Vår

Undervisningsspråk

Engelsk

Antall semestre

1

Vurderingssemester

Vår

Innhold

Kurset starter med å gi en innføring i den grunnleggende teorien, Bayes desisjonsteori. Denne statistisk funderte teorien lar oss definere optimale desisjonsgrenser for å kunne skille dataelementene, representert ved såkalte egenskapsvektorer, fra hverandre. Disse desisjonsgrensene er optimale i forhold til at de minimerer den forventede feilraten eller mer generelt, forventet risiko. Den innledende teorien forutsetter at de statistiske funksjonene som beskriver dataene i de ulike klassene er kjent. I praksis vil dette som regel ikke være tilfelle, og derfor må disse funksjonene estimeres ved bruk av parametriske og ikke-parametriske metoder. Alternativt til å estimere de statistiske funksjonene direkte, kan en estimere koeffisientene i polynomer som beskriver desisjonsgrensene direkte. Dette introduseres med lineære diskriminantfunksjoner hvor en søker å bestemme de polynomkoeffisientene som minimerer feilraten uttrykt ved en kriteriefunksjon. Til denne minimeringen benyttes iterative nedstigningsteknikker. Videre presenteres nevrale nett som kan benyttes til å løse problemer der lineære diskriminantfunksjoner ikke strekker til. I teknikkene presentert så langt forutsetter en at dataenes klassetilhørighet er kjent. Ved bruk av klyngeinndeling antas ikke lenger noe om klassetilhørighet og en søker å finne naturlige grupperinger i datamaterialet. Til slutt presenteres metoder for å evaluere klassifiserere. Et annet viktig trekk ved klassifisering er hvordan datamaterialet karakteriseres ved egenskapsvektorer. Underveis i kurset vises illustrerende eksempler fra pågående forskningsprosjekter innen biomedisink dataanalyse.

Læringsutbytte

Etter å ha tatt dette emnet skal studenten kunne kjenne igjen problemstillinger som kan håndteres ved bruk av mønstergjenkjenningsmetoder. Videre skal studenten kunne presisere og formulere problemstillingen ved bruk av fagterminologien som er tilegnet gjennom kurset. Løsning av problemet innebærer at studenten skal kunne implementere en klassifiserer ved å trene denne opp ved hjelp av et representativt datasett og gjøre denne i stand til å håndtere innkommende data. Studenten skal kunne håndtere ulike typer klassifiserere og kjenne teorien for disse slik at spesialtilpassede løsninger skal kunne utvikles.

Forkunnskapskrav

Ingen

Anbefalte forkunnskaper

Grunnleggende programmering (BID230), Matematiske metoder 1 (ÅMA100), Sannsynlighetsregning med statistikk (ÅMA110), Matematiske metoder 2 (ÅMA260)

Eksamen / vurdering

Vurderingsform Vekting Varighet Karakter Hjelpemiddel Exam system Withdrawal deadline Exam date
Skriftlig eksamen 1/1 4 Timer Bokstavkarakterer Ingen trykte eller håndskrevne hjelpemidler tillatt. Godkjent, enkel kalkulator tillatt Inspera assessment


Vilkår for å gå opp til eksamen/vurdering

Øvingsoppgaver

Fagperson(er)

Instituttleder:

Tom Ryen

Arbeidsformer

I gjennomsnitt 4,5 timer forelesning, 1,7 timer dataøvinger med bruk av Matlab og 0.8 timer teoretiske regneøvinger pr. uke. 70% av obligatoriske av hver type dataøvinger og regnepøvinger kreves bestått. Obligatoriske arbeidskrav (som innlevering, laboratorieoppgaver, prosjektoppgaver og lignende) skal være godkjent av faglærer innen 3 uker før eksamensdato. Undervisningsspråket er engelsk.

Åpent for

Form and/or discussion

Emneevaluering

Skjer vanligvis gjennom skjema og/eller samtaler i henhold til gjeldende retningslinjer

Litteratur

R.O. Duda, P.E. Hart, D.G. Stork: Pattern Classification (2nd. ed.).
Emnebeskrivelsen er hentet fra Felles studentsystem Versjon 1