Získávání znalostí z databází

Zkratka předmětu KMI/KZZD
Název předmětu Získávání znalostí z databází
Akademický rok 2019/2020
Pracoviště / Zkratka KMI/KZZD
Název Získávání znalostí z databází
Akreditováno/Kredity Ano/6
Rozsah hodin Přednáška 18 HOD/SEM
Vyučovací jazyk čeština
Nahrazovaný předmět KMI/ZZD
Vyloučené předměty
Podmiňující
Způsob zakončení Zkouška
Forma zakončení Kombinovaná
Zápočet před zkouškou Ano
Vyučovaný semestr Zimní
Cíle předmětu (anotace)

Cílem předmětu je seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů podniku, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat uložených v podnikových systémech i mimo ně. Seznámit studenty s používanými technikami a nástroji a podat celkový přehled problematiky, která se stává stále více používaným nástrojem pro analýzu a podporu rozhodování na různých řídících úrovních společností. Často je tato oblast označována jako business inteligence.

Požadavky na studenta

Požadavky k zápočtu:
Ověření nabytých znalostí bude realizováno prostřednictvím 2 testů. Jednoho zápočtového a jednoho zkouškového testu (oba písemné).

Obsah

1. Úvod do data miningu.
2. Datové zdroje. Relační DB. OLAP. Datové sklady. Příprava dat
3. Statistické metody uplatnitelné v DM
4. Strojové učení. Rozhodovací stromy
5. Asociační pravidla. Rozhodovací pravidla
6. Shluková analýza - různé metody a přístupy
7. Hodnocení modelů, kombinace modelů, bagging, boosting
8. Jazyk SQL - pokročilé dotazy, objektově relační mapování
9. Použití uložených procedur, trigerů
10. Data wrangling, tidying
11. Řešení jednoduchých dm úloh. Zobrazení dat prostřednictvím formulářů a tabulek
12. Vytváření jednoduchých aplikací

Předpoklady - další informace k podmíněnosti studia předmětu

Prerekvizita: KMI/DBS1 Databázové systémy, KMI/TPS2 nebo KMI/TPS2A Teorie pravděpodobnosti a statistika 2

Získané způsobilosti

Student si osvojí znalosti nutné pro používání nástrojů pro dolování dat. Student bude znát vybrané teoretické základy data miningu, ale také vědět, jak je aplikovat v praxi.

Garanti a vyučující
  • Garanti: Ing. Michael Rost, Ph.D.
  • Přednášející: RNDr. Josef Milota, Ing. Michael Rost, Ph.D.
Literatura
  • Hendl, J. Přehled statistických metod zpracování dat. Praha, Portál, 2016. ISBN 80-7367-123-9.
  • Weka 3. Data Mining Software in Java [online]. 1998.
  • Humphries, M., Hawkins, W.,M., Dy. M.C. Data warehousing Návrh a implementace. Computer Press, 2002. ISBN 8072265601. Computer Press, 2002. ISBN 8072265601.
  • LACKO, M. Databáze: datové sklady, OLAP a dolování dat. Computer Press, 2003. ISBN 80-7226-969-0. Computer Press, 2003. ISBN 80-7226-969-0.
  • Berka, P. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9.
  • Venables, W., N., Ripley, B.D. Modern Applied Statistics with S. New York : 4th ed, 2002. ISBN 0-387-95457-0.
  • Anděl, J. Statistické metody 3. vyd., Praha, Marfyzpress.2003.ISBN 80-86732-08-8.
Vyučovací metody

Monologická (výklad, přednáška, instruktáž), Demonstrace, E-learning

Hodnotící metody

Kombinovaná zkouška, Seminární práce

Stáhnout jako PDF