TTC8030 - Datan esikäsittely
Kurssin tiedot
Nimi | Datan esikäsittely |
Koodi | TTC8030 |
Osa moduulia | DATA-ANALYTIIKKA JA TEKOÄLY |
Opettaja(t) | Antti Häkkinen |
Ajoitus | |
Toteutusten määrä | 1 |
Peppi | Katso Peppi kuvaus |
Miksi valitsisin tämän kurssin?
Suoritettuaan opintojakson opiskelija ymmärtää menetelmät datan esikäsittelyyn liittyen. Oleellisena osana datan esikäsittelyä on datan tuominen valitusta lähteestä, viallisen datan siivoaminen ja ei-haluttujen arvojen suodattaminen ennen datan vientiä analysointivaiheeseen.
Sisältö
- Datan lukeminen ja esikäsittely Pandas-kirjaston avulla
- Datan noutaminen Rest API -rajapinnasta
- SQLite-tietokantadatan käsittely
- Datan suodattaminen säännöllisen lausekkeen (REGEX) avulla
- XML-datan käsittely
Arviointi
Opintojaksolla arvioidaan edellä esitettyihin teemoihin liittyvät harjoitukset sekä harjoitustyö, jossa sovelletaan useita eri teemoja.
Edited by Juho Pekki