Skip to content

TTC8030 - Datan esikäsittely

Kurssin tiedot

Nimi Datan esikäsittely
Koodi TTC8030
Osa moduulia DATA-ANALYTIIKKA JA TEKOÄLY
Opettaja(t) Antti Häkkinen
Ajoitus
Toteutusten määrä 1
Peppi Katso Peppi kuvaus

Miksi valitsisin tämän kurssin?

Suoritettuaan opintojakson opiskelija ymmärtää menetelmät datan esikäsittelyyn liittyen. Oleellisena osana datan esikäsittelyä on datan tuominen valitusta lähteestä, viallisen datan siivoaminen ja ei-haluttujen arvojen suodattaminen ennen datan vientiä analysointivaiheeseen.

Sisältö

  • Datan lukeminen ja esikäsittely Pandas-kirjaston avulla
  • Datan noutaminen Rest API -rajapinnasta
  • SQLite-tietokantadatan käsittely
  • Datan suodattaminen säännöllisen lausekkeen (REGEX) avulla
  • XML-datan käsittely

Arviointi

Opintojaksolla arvioidaan edellä esitettyihin teemoihin liittyvät harjoitukset sekä harjoitustyö, jossa sovelletaan useita eri teemoja.

Edited by Juho Pekki