Course objectives:
|
The main aim of this course is the application of advanced statistical tools tolarge multidimensional datasets and time series. The emphasis lies on practical questions of statistical computing and real-world datasets are analyzed in R.
|
Requirements on student
|
There will be several assignments consisting of analyses of real datasets. The exam consists of practical and oral parts.
|
Content
|
1. Classification of large datasets.
2. Data visualization
3. Time series - stationary
4. Time series - nonstationary
5. Time series - ARIMA
6. Dimension reduction - factor analysis, PCA
7. Cluster analysis
8. Bayes methods - basic principles
9. Bayes methods - parameter estimations
10. Comparison of classical and bayes approach
11. Caterogical data
12. Panel data
13. Revision
|
Activities
|
|
Fields of study
|
|
Guarantors and lecturers
|
|
Literature
|
-
Basic:
Reif J. Metody matematické statistiky. 2000.
-
Basic:
Kamath C. Scientific Data Mining. 2009.
-
Recommended:
Teetor P. R Cookbook. 2011.
-
Recommended:
Matloff N. The Art of R Programming. 2011.
-
On-line library catalogues
|
Time requirements
|
All forms of study
|
Activities
|
Time requirements for activity [h]
|
Contact hours
|
65
|
Individual project (40)
|
40
|
Preparation for an examination (30-60)
|
55
|
Total
|
160
|
|
Prerequisites
|
Knowledge - students are expected to possess the following knowledge before the course commences to finish it successfully: |
ovládat základní principy teorie pravděpodobnosti a matematické statistiky |
ovládat základní principy výpočtové statistiky |
rozumět pojmům teorie časových řad a vícerozměrné statistické teorie |
rozumět základním pojmům z teorie testování hypotéz |
Skills - students are expected to possess the following skills before the course commences to finish it successfully: |
implementovat základní simulační metody |
ovládat některý statistický SW pro statistické zpracování dat (např. Excel, Matlab, R, Mathematica nebo Statistica) |
provést jednoduché datové analýzy |
vizualizovat základní charakteristiky datových souborů |
Competences - students are expected to possess the following competences before the course commences to finish it successfully: |
N/A |
N/A |
|
Learning outcomes
|
Knowledge - knowledge resulting from the course: |
klasifikovat rozsáhlé datové soubory a následně volit vhodné metody pro jejich zpracování |
ovládat základní techniky pro statistické zpracování mnohorozuměrných datových souborů |
rozumět technikám pro redukci dimenzi dat (faktorová analýza, PCA...) |
rozumět základním principům Bayesovských metod, odhadů parametrů a srovnání s klasickými metodami |
Skills - skills resulting from the course: |
implementovat techniky pro redukci dimenze dat (faktorová analýza, PCA...) |
provést jednoduché Bayesovské testování hypotéz |
statisticky zpracovat rozsáhlé datové soubory |
vizualizovat statistické charakteristiky rozsáhlých datových souborů |
Competences - competences resulting from the course: |
N/A |
|
Assessment methods
|
Knowledge - knowledge achieved by taking this course are verified by the following means: |
Oral exam |
Practical exam |
Skills - skills achieved by taking this course are verified by the following means: |
Test |
Competences - competence achieved by taking this course are verified by the following means: |
Oral exam |
|
Teaching methods
|
Knowledge - the following training methods are used to achieve the required knowledge: |
Lecture |
Practicum |
Skills - the following training methods are used to achieve the required skills: |
Lecture |
Practicum |
Competences - the following training methods are used to achieve the required competences: |
Lecture |
Practicum |
|