Analiza velikih podatkov
Ure predavanj: 30
Ure seminarjev: 30
Ure vaj: 0
ECTS točke: 9
1. Veliki podatki:
1. definicije, organizacija in shranjevanje,
2. podatkovna skladišča,
3. predpriprava in strukturiranje podatkov,
4. osnovna analitična orodja in pristopi: Hadoop in MapReduce,
5. manjkajoče vrednosti,
6. osamelci,
7. izbira spremenljivk,
8. metode segmentacije,
2. Pregled metod podatkovnega rudarjenja:
1. Napovedni modeli: linearna regresija, logistična regresija, odločitvena drevesa, nevronske mreže, podporni vektorji,
2. Ocenjevanje in ovrednotenje napovednih modelov,
3. Opisna analitika: asociacijska pravila, segmentacija.
3. Tekstovno rudarjenje:
1. Pridobivanje podatkov,
2. Črpanje informacij;
4. Spletno rudarjenje:
1. Pridobivanje spletnih podatkov,
2. Analiza spletnih vsebin,
5. Področja uporabe podatkovnega rudarjenja:
1. Napovedovanje kreditnega tveganja,
2. Odkrivanje goljufij,
3. Napovedovanje osipa uporabnikov,
4. Priporočilni sistemi,
5. Spletna analitika,
6. Analiza družbenih medijev,
7. Analiza poslovnih procesov.
Obvezna literatura:
1. Bart Baesens. Analytics in a Big Data World: The Essential Guide to Data Science and its Applications, Wiley, 2014. https://plus.cobiss.net/cobiss/si/sl/bib/fflj/2560000000148561
2. Richard Boire. Data Mining for Managers. How to Use Data (Big and Small) to Solve Business Challenges. ISBN: 978-1-349-48786-8 (Print) 978-1-137-40619-4 (Online). https://plus.cobiss.net/cobiss/si/sl/bib/fflj/4200000000000024
Dodatna literatura/Additional Readings:
3. CHAKRABARTI, Soumen. Mining the Web : discovering knowledge from hypertext data / Soumen Chakrabarti. - Amsterdam [etc.] : Morgan Kaufmann, 2007, cop. 2003. - XVIII, 345 str. : graf. prikazi ; 25 cm. - (The Morgan Kaufmann series in data management systems). https://plus.cobiss.net/cobiss/si/sl/bib/fflj/111087028168028
4. HASTIE, Trevor. The elements of statistical learning : data mining, inference, and prediction / Trevor Hastie, Robert Tibshirani, Jerome Friedman. - 2nd ed., corrected at 5th printing 2011. - New York : Springer, 2011, cop. 2009. - XXII, 745 str. : ilustr. ; 24 cm. - (Springer series in statistics, ISSN 0172-7397). COBISS.SI-ID – 40339554 https://plus.cobiss.net/cobiss/si/sl/bib/fflj/1000000000746280