Emne
Maskinlæring (ELE520)
Dette er emnebeskrivelsen for studieåret 2012-2013. Merk at det kan komme endringer.
Semesters
Fakta
Emnekode
ELE520
Vekting (stp)
10
Semester undervisningsstart
Vår
Undervisningsspråk
Engelsk
Antall semestre
1
Vurderingssemester
Vår
Timeplan
Innhold
Kurset starter med å gi en innføring i den grunnleggende teorien, Bayes desisjonsteori. Denne statistisk funderte teorien lar oss definere optimale desisjonsgrenser for å kunne skille dataelementene, representert ved såkalte egenskapsvektorer, fra hverandre. Disse desisjonsgrensene er optimale i forhold til at de minimerer den forventede feilraten eller mer generelt, forventet risiko. Den innledende teorien forutsetter at de statistiske funksjonene som beskriver dataene i de ulike klassene er kjent. I praksis vil dette som regel ikke være tilfelle, og derfor må disse funksjonene estimeres ved bruk av parametriske og ikke-parametriske metoder. Alternativt til å estimere de statistiske funksjonene direkte, kan en estimere koeffisientene i polynomer som beskriver desisjonsgrensene direkte. Dette introduseres med lineære diskriminantfunksjoner hvor en søker å bestemme de polynomkoeffisientene som minimerer feilraten uttrykt ved en kriteriefunksjon. Til denne minimeringen benyttes iterative nedstigningsteknikker. Videre presenteres nevrale nett som kan benyttes til å løse problemer der lineære diskriminantfunksjoner ikke strekker til. I teknikkene presentert så langt forutsetter en at dataenes klassetilhørighet er kjent. Ved bruk av klyngeinndeling antas ikke lenger noe om klassetilhørighet og en søker å finne naturlige grupperinger i datamaterialet. Til slutt presenteres metoder for å evaluere klassifiserere. Et annet viktig trekk ved klassifisering er hvordan datamaterialet karakteriseres ved egenskapsvektorer. Underveis i kurset vises illustrerende eksempler fra pågående forskningsprosjekter innen biomedisink dataanalyse.
Læringsutbytte
Etter å ha tatt dette emnet skal studenten kunne kjenne igjen problemstillinger som kan håndteres ved bruk av mønstergjenkjenningsmetoder. Videre skal studenten kunne presisere og formulere problemstillingen ved bruk av fagterminologien som er tilegnet gjennom kurset. Løsning av problemet innebærer at studenten skal kunne implementere en klassifiserer ved å trene denne opp ved hjelp av et representativt datasett og gjøre denne i stand til å håndtere innkommende data. Studenten skal kunne håndtere ulike typer klassifiserere og kjenne teorien for disse slik at spesialtilpassede løsninger skal kunne utvikles.
Forkunnskapskrav
Ingen
Anbefalte forkunnskaper
Grunnleggende programmering (BID230), Matematiske metoder 1 (ÅMA100), Sannsynlighetsregning med statistikk (ÅMA110), Matematiske metoder 2 (ÅMA260)
Eksamen / vurdering
Vurderingsform | Vekting | Varighet | Karakter | Hjelpemiddel | Exam system | Withdrawal deadline | Exam date |
---|---|---|---|---|---|---|---|
Skriftlig eksamen | 1/1 | 4 Timer | Bokstavkarakterer | Ingen trykte eller håndskrevne hjelpemidler tillatt. Godkjent, enkel kalkulator tillatt | Inspera assessment | — | — |
Vilkår for å gå opp til eksamen/vurdering
Øvingsoppgaver
Fagperson(er)
Emneansvarlig:
Trygve Christian EftestølInstituttleder:
Tom RyenArbeidsformer
I gjennomsnitt 4,5 timer forelesning, 1,7 timer dataøvinger med bruk av Matlab og 0.8 timer teoretiske regneøvinger pr. uke. 70% av obligatoriske av hver type dataøvinger og regnepøvinger kreves bestått. Obligatoriske arbeidskrav (som innlevering, laboratorieoppgaver, prosjektoppgaver og lignende) skal være godkjent av faglærer innen 3 uker før eksamensdato. Undervisningsspråket er engelsk.
Åpent for
Form and/or discussion
Emneevaluering
Skjer vanligvis gjennom skjema og/eller samtaler i henhold til gjeldende retningslinjer
Litteratur
R.O. Duda, P.E. Hart, D.G. Stork: Pattern Classification (2nd. ed.).
Emnebeskrivelsen er hentet fra Felles studentsystem Versjon 1