Detail předmětu

Základy zpracování dat

FSI-SZD-A Ak. rok: 2025/2026 Zimní semestr

Předmět je zaměřen na základní práci s daty: představení databází a efektivní práci s nimi; základy statistického zpracování – lineární regrese, strojové učení; vizualizace výsledků, včetně geografických výstupů. Hlavní důraz předmětu je na praktické aspekty, všechny představené koncepty jsou implementovány v programovacím jazyce python.

Jazyk výuky

angličtina

Počet kreditů

6

Zajišťuje ústav

Vstupní znalosti

Základy programování.

Základy popisné statistiky, teorie pravděpodobnosti a matematické statistiky.

Pravidla hodnocení a ukončení předmětu

Během semestru budou studenti pracovat na dvou vlastních projektech zaměřených na i) práci s databázemi ii) zpracování a prezentaci dat (interaktivní dashboad).
Tyto projekty jsou povinné pro udělení zápočtu. Ať už s využitím těchto dílčích projektů nebo nezávisle na nich student zpracuje individuálně finální projekt zaměřený na zpracování dat, jehož téma bude s vyučujícím dopředu zkonzultováno. Zkouška probíhá ústně formou rozpravy nad tímto projektem, jenž bude ohodnocen na stupnici 0 – 100.

Hodnocení podle bodů: výborně (90 až 100 bodů), velmi dobře (80 až 89), dobře (70 až 79 bodů), uspokojivě (60 až 69 bodů), dostatečně (50 až 59 bodů), nevyhovující (0 až 49 bodů).

Účast na cvičeních je povinná. Během semestru jsou tolerovány dvě neomluvené absence. Nahrazení zameškané výuky určí vedoucí cvičení.

Učební cíle

Základní koncepty a nástroje pro manipulaci s daty. Tato témata budou probírána i s ukázkou implementace:

  • databáze (dotazování, indexování)
  • vizualizace
  • základní statistika
  • regresní analýza a strojové učení
  • práce s geografickými daty

Použití předmětu ve studijních plánech

Program N-LAN-A: Logistics Analytics, magisterský navazující, povinný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Osnova

Úvod do databází 
Základní dotazy a jednoduché příkazy
Větší instance a indexování databází (výpočetní aspekty vs. velikost databáze)


Projekt 1: vlastní projekt s db
Popisná statistika a základní statistické metody 
Vizualizace, seznámení s různými knihovnami, různé typy grafů
Pokročilejší vizualizace, dashboardy
GIS + python – mapové podklady – vizualizace
Analýzy na mapě
Projekt 2: vlastní dashboard
Lineární regrese a logistická regrese – základní ekonometrie
Lineární regrese II; strojové učení: neuronové sítě
Strojové učení: boosted trees
Shrnutí a připomenutí vědomostí a metod používaných v předcházejících kurzech – pravděpodobnost, náhodná proměnná.

Cvičení s počítačovou podporou

26 hod., povinná

Osnova

Úvod do databází
Základní dotazy a jednoduché příkazy
Větší instance a indexování databází (výpočetní aspekty vs. velikost databáze)


Projekt 1: vlastní projekt s db
Popisná statistika a základní statistické metody
Vizualizace, seznámení s různými knihovnami, různé typy grafů
Pokročilejší vizualizace, dashboardy
GIS + python – mapové podklady – vizualizace
Analýzy na mapě
Projekt 2: vlastní dashboard
Lineární regrese a logistická regrese – základní ekonometrie
Lineární regrese II; strojové učení: neuronové sítě
Strojové učení: boosted trees
Shrnutí a připomenutí vědomostí a metod používaných v předcházejících kurzech – pravděpodobnost, náhodná proměnná.