Detail předmětu
Programování v Pythonu – Data Science
FSI-VPD Ak. rok: 2025/2026 Letní semestr
Studenti budou s využitím programovacího jazyka Python a jeho knihoven, řešit úlohy z oblasti Data Science.
Student bude seznámem s ekosystémem aplikací a prostředků vývoje v Pythonu pro různé úlohy v oblasti Data Science.
Jazyk výuky
čeština
Počet kreditů
4
Garant předmětu
Zajišťuje ústav
Vstupní znalosti
Základy programování na úrovni kurzu VP0 (Programování v Pythonu).
Pravidla hodnocení a ukončení předmětu
Aktivní účast a zvládnutí zadaného problému v požadované kvalitě.
Výuka běží podle týdenních plánů. Účast na cvičeních je povinná. Způsob nahrazení zameškaných cvičení je plně v kompetenci vyučujícího.
Učební cíle
Porozumět využití jazyka Python a jeho knihoven (pandas, numpy, matplotlib aj.) pro oblast Data Science. Pokročilé programování v Pythonu.
Po úspěšné zvládnutí předmětu budou studenti schopni využít znalosti v praktických oblastech Data Science. Hlavním cílem datových specialistů je vyčistit a analyzovat velká data.
Studijní opory
VANDERPLAS, J., Python Data Science Handbook: Essential Tools for Working with Data, 978-1098121228, 2023
GÉRON, A., Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems, 2022, 978-1098125974
Použití předmětu ve studijních plánech
Program N-AIŘ-P: Aplikovaná informatika a řízení, magisterský navazující, povinný
Program N-MAI-P: Matematické inženýrství, magisterský navazující, volitelný
Typ (způsob) výuky
Přednáška
26 hod., nepovinná
Osnova
P1: Přehled základních metod strojového učení a aplikované statistiky.
P2: Pokročilé metody strojového učení. Kombinace učících algoritmů. Učení v multirelačních datech. Dolování v grafech a sekvencích.
P3: Big data analytics. Teorie strojového učení Bias-varinace tradeoff. Modely učení. Vizualizace dat.
P4: Hledání častých vzorů a asociačních pravidel: algoritmus Apriori; alternativy; časté vzory v multirelačních datech. Detekce odlehlých bodů.
P5: Dobývání znalostí z vybraných typů dat: dolování v textu, dolování v temporálních a časově prostorových datech, dobývání znalostí z webu, biologické vědy a bioinformatika.
Cvičení s počítačovou podporou
26 hod., povinná
Osnova
1. Seznámení s prostředím.
2.-12. Projektovou formou reflektuje cvičení obsah přednášek (4 projekty i s obhajobou, checkpointy).
13. Prezentace projektů, opakování, konzultace.