Detail předmětu
Základy zpracování dat
FSI-SZD-A Ak. rok: 2025/2026 Zimní semestr
Předmět je zaměřen na základní práci s daty: představení databází a efektivní práci s nimi; základy statistického zpracování – lineární regrese, strojové učení; vizualizace výsledků, včetně geografických výstupů. Hlavní důraz předmětu je na praktické aspekty, všechny představené koncepty jsou implementovány v programovacím jazyce python.
Jazyk výuky
angličtina
Počet kreditů
6
Garant předmětu
Zajišťuje ústav
Vstupní znalosti
Základy programování.
Základy popisné statistiky, teorie pravděpodobnosti a matematické statistiky.
Pravidla hodnocení a ukončení předmětu
Během semestru budou studenti pracovat na dvou vlastních projektech zaměřených na i) práci s databázemi ii) zpracování a prezentaci dat (interaktivní dashboad).
Tyto projekty jsou povinné pro udělení zápočtu. Ať už s využitím těchto dílčích projektů nebo nezávisle na nich student zpracuje individuálně finální projekt zaměřený na zpracování dat, jehož téma bude s vyučujícím dopředu zkonzultováno. Zkouška probíhá ústně formou rozpravy nad tímto projektem, jenž bude ohodnocen na stupnici 0 – 100.
Hodnocení podle bodů: výborně (90 až 100 bodů), velmi dobře (80 až 89), dobře (70 až 79 bodů), uspokojivě (60 až 69 bodů), dostatečně (50 až 59 bodů), nevyhovující (0 až 49 bodů).
Účast na cvičeních je povinná. Během semestru jsou tolerovány dvě neomluvené absence. Nahrazení zameškané výuky určí vedoucí cvičení.
Učební cíle
Základní koncepty a nástroje pro manipulaci s daty. Tato témata budou probírána i s ukázkou implementace:
- databáze (dotazování, indexování)
- vizualizace
- základní statistika
- regresní analýza a strojové učení
- práce s geografickými daty
Použití předmětu ve studijních plánech
Program N-LAN-A: Logistics Analytics, magisterský navazující, povinný
Typ (způsob) výuky
Přednáška
26 hod., nepovinná
Osnova
Úvod do databází
Základní dotazy a jednoduché příkazy
Větší instance a indexování databází (výpočetní aspekty vs. velikost databáze)
Projekt 1: vlastní projekt s db
Popisná statistika a základní statistické metody
Vizualizace, seznámení s různými knihovnami, různé typy grafů
Pokročilejší vizualizace, dashboardy
GIS + python – mapové podklady – vizualizace
Analýzy na mapě
Projekt 2: vlastní dashboard
Lineární regrese a logistická regrese – základní ekonometrie
Lineární regrese II; strojové učení: neuronové sítě
Strojové učení: boosted trees
Shrnutí a připomenutí vědomostí a metod používaných v předcházejících kurzech – pravděpodobnost, náhodná proměnná.
Cvičení s počítačovou podporou
26 hod., povinná
Osnova
Úvod do databází
Základní dotazy a jednoduché příkazy
Větší instance a indexování databází (výpočetní aspekty vs. velikost databáze)
Projekt 1: vlastní projekt s db
Popisná statistika a základní statistické metody
Vizualizace, seznámení s různými knihovnami, různé typy grafů
Pokročilejší vizualizace, dashboardy
GIS + python – mapové podklady – vizualizace
Analýzy na mapě
Projekt 2: vlastní dashboard
Lineární regrese a logistická regrese – základní ekonometrie
Lineární regrese II; strojové učení: neuronové sítě
Strojové učení: boosted trees
Shrnutí a připomenutí vědomostí a metod používaných v předcházejících kurzech – pravděpodobnost, náhodná proměnná.