Uniwersytet Mikołaja Kopernika w Toruniu - Centralny punkt logowania

Data mining i big data

Informacje ogólne

Kod przedmiotu:	1100-12-E21-AG-DMBD
Kod Erasmus / ISCED:	(brak danych) / (0311) Ekonomia Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu:	Data mining i big data
Jednostka:	Katedra Ekonometrii i Statystyki
Grupy:	Ekonomia - plan studiów 1 rok 2 stopnia Ekonomia, 1 rok II stopnia, PRK, sp. analityka gospodarcza
Punkty ECTS i inne:	3.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS: roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS; tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h; 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się; tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS; nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta. zobacz reguły punktacji
Język prowadzenia:	polski
Wymagania wstępne:	Zakłada się, że student posiada wiedzę z zakresu statystyki oraz narzędzi informatycznych wykorzystywanych w analizie danych
Całkowity nakład pracy studenta:	1. Godziny realizowane z udziałem nauczyciela 15 godz. 2. Konsultacje indywidualne 15 godz. 3. Konsultacje projektów zaliczeniowych 10 godz. 4. Praca indywidualna studenta potrzebna do pomyślnego zaliczenia przedmiotu (przygotowanie i uzupełnienie notatek; zebranie i wybór odpowiednich materiałów do zajęć, wymagane powtórzenie materiału,, czytanie literatury, zapoznanie się z materiałami dydaktycznymi umieszczonymi na platformie e-learningowej, wykonanie zadań) 10 godz. 5. Liczba godzin wymaganych do przygotowania projektu końcowego – 10 godz.; 6. Praca własna studenta 20 godzin. Łącznie: 80 godzin
Efekty uczenia się - wiedza:	W1: Absolwenta zna i rozumie metody i narzędzia, w tym techniki pozyskiwania danych, właściwe dla nauk ekonomicznych, pozwalające opisywać struktury i instytucje społeczno-ekonomiczne, procesy w nich zachodzące, a także relacje między nimi; metody i narzędzia służące do zaawansowanych rodzajów badań ekonomicznych – K_W06
Efekty uczenia się - umiejętności:	U1: Absolwent potrafi analizować i prognozować procesy społeczno-gospodarcze z wykorzystaniem metod eksploracji nadzorowanej oraz nienadzorowanej - K_U04 U2: Absolwent potrafi korzystać z różnorodnych źródeł danych Big data, potrafi wyciągać z nich wiedzę oraz interpretować wyniki – K_U03 U3: Absolwent potrafi samodzielnie identyfikować problemy ekonomiczne i biznesowe oraz poszukiwać ich rozwiązań w dużych zbiorach danych Big data - K_U06
Efekty uczenia się - kompetencje społeczne:	K1: Absolwent jest gotów samodzielnie i efektywnie pracować z dużymi zbiorami danych - Big data, formułować pytania badawcze, identyfikować ukryte w zależności w danych, oraz poprawnie wnioskować z otrzymanych wyników - K_K01
Metody dydaktyczne podające:	- wykład informacyjny (konwencjonalny)
Metody dydaktyczne poszukujące:	- ćwiczeniowa - laboratoryjna
Skrócony opis:	Skrócony opis: Celem zajęć jest zapoznanie studentów z algorytmami data mining oraz metodami statystycznymi, które umożliwiają odkrywanie nieznanych zależności (prawidłowości, wzorców, trendów) między danymi w zbiorach danych. Metody te pozwalają z danych tworzyć wiedzę. W badaniach ekonomicznych wykorzystuje się je do prognozowania, klasyfikowania, analizy skupień obiektów, odkrywania asocjacji i sekwencji zdarzeń. Poszczególne metody zostaną omówione z przedstawieniem ich zastosowań. W części praktycznej studenci wykonają analizy przy wykorzystaniu środowiska analizy danych IBM SPSS
Pełny opis:	1. Big data i hurtownie danych, architektura systemów business inteligance, 2. Data science a data mining - algorytmy analizy danych, 3. EKSPLORACJA NIENADZOROWANA. Techniki redukcji wymiarowości danych - metoda PCA (principal component analysis), CFA (common factor analysis), 4. Analiza skupień - grupowanie obiektów, 5. Badanie asocjacji – analiza koszykowa (basket market analysis), 6. EKSPLORACJA NADZOROWANA. Metody klasyfikacji obiektów - (metody LDA/QDA, drzewa klasyfikacyjne oraz lasy losowe), 7. Regresja logistyczna oraz sztuczne sieci neuronowe w analizie problemów klasyfikacyjnych
Literatura:	Literatura podstawowa: Walesiak M., Gatnar E. (red.) Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa, 2009. An Introduction to R:A Programming Environment for Data Analysis and Graphics, Version 3.3.2 (2016) (źródło internetowe: https://cran.r-project.org/doc/manuals/R-intro.pdf) Literatura uzupełniająca: Larose D.T., Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15467-7, Warszawa 2008. Mendrala D., Szeliga M. Microsoft SQL Server. Modelowanie i eksploracja danych, Helion, 2012. oraz artykuły dostępne w sieci związane z zastosowaniem algorytmów data mining w analizach ekonomicznych i biznesowych,
Metody i kryteria oceniania:	W1, U1, U2, U3, K1: projekt końcowy teoretyczno - praktyczny, który sprawdza wiedzę i umiejętności z analizy wybranych zbiorów danych i odkrywania z nich wiedzy z wykorzystaniem środowiska analizy danych IBM SPSS. U1, U2, U3: zadania dodatkowe do samodzielnego rozwiązania przez studentów.

Zajęcia w cyklu "Semestr zimowy 2021/22" (zakończony)

Okres:	2021-10-01 - 2022-02-20	Wybrany podział planu: tygodniowy cykl przedmiotu Przejdź do planu PN WT ŚR CW CZ PT
Typ zajęć:	Ćwiczenia, 15 godzin, 30 miejsc więcej informacji
Koordynatorzy:	Andrzej Geise
Prowadzący grup:	Andrzej Geise
Lista studentów:	(nie masz dostępu)
Zaliczenie:	Przedmiot - Zaliczenie na ocenę Ćwiczenia - Zaliczenie na ocenę
Pełny opis:	1. Big data i hurtownie danych, architektura systemów business inteligance, 2. Data science a data mining - algorytmy analizy danych, 3. EKSPLORACJA NIENADZOROWANA. Techniki redukcji wymiarowości danych - metoda PCA (principal component analysis), CFA (common factor analysis), 4. Analiza skupień - grupowanie obiektów, 5. Badanie asocjacji – analiza koszykowa (basket market analysis), 6. EKSPLORACJA NADZOROWANA. Metody klasyfikacji obiektów - (metody LDA/QDA, drzewa klasyfikacyjne oraz lasy losowe), 7. Regresja logistyczna oraz sztuczne sieci neuronowe w analizie problemów klasyfikacyjnych
Literatura:	Literatura podstawowa: Walesiak M., Gatnar E. (red.) Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa, 2009. An Introduction to R:A Programming Environment for Data Analysis and Graphics, Version 3.3.2 (2016) (źródło internetowe: https://cran.r-project.org/doc/manuals/R-intro.pdf) Literatura uzupełniająca: Larose D.T., Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15467-7, Warszawa 2008. Mendrala D., Szeliga M. Microsoft SQL Server. Modelowanie i eksploracja danych, Helion, 2012. oraz artykuły dostępne w sieci związane z zastosowaniem algorytmów data mining w analizach ekonomicznych i biznesowych,

Zajęcia w cyklu "Semestr zimowy 2022/23" (zakończony)

Okres:	2022-10-01 - 2023-02-19	Wybrany podział planu: tygodniowy cykl przedmiotu Przejdź do planu PN WT ŚR CW CZ PT
Typ zajęć:	Ćwiczenia, 15 godzin, 30 miejsc więcej informacji
Koordynatorzy:	Andrzej Geise
Prowadzący grup:	Andrzej Geise
Lista studentów:	(nie masz dostępu)
Zaliczenie:	Przedmiot - Zaliczenie na ocenę Ćwiczenia - Zaliczenie na ocenę
Pełny opis:	1. Big data i hurtownie danych, architektura systemów business inteligance, 2. Data science a data mining - algorytmy analizy danych, 3. EKSPLORACJA NIENADZOROWANA. Techniki redukcji wymiarowości danych - metoda PCA (principal component analysis), CFA (common factor analysis), 4. Analiza skupień - grupowanie obiektów, 5. Badanie asocjacji – analiza koszykowa (basket market analysis), 6. EKSPLORACJA NADZOROWANA. Metody klasyfikacji obiektów - (metody LDA/QDA, drzewa klasyfikacyjne oraz lasy losowe), 7. Regresja logistyczna oraz sztuczne sieci neuronowe w analizie problemów klasyfikacyjnych
Literatura:	Literatura podstawowa: Walesiak M., Gatnar E. (red.) Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa, 2009. An Introduction to R:A Programming Environment for Data Analysis and Graphics, Version 3.3.2 (2016) (źródło internetowe: https://cran.r-project.org/doc/manuals/R-intro.pdf) Literatura uzupełniająca: Larose D.T., Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15467-7, Warszawa 2008. Mendrala D., Szeliga M. Microsoft SQL Server. Modelowanie i eksploracja danych, Helion, 2012. oraz artykuły dostępne w sieci związane z zastosowaniem algorytmów data mining w analizach ekonomicznych i biznesowych,
Uwagi:	W1, U1, U2, U3, K1: projekt końcowy teoretyczno - praktyczny, który sprawdza wiedzę i umiejętności z analizy wybranych zbiorów danych i odkrywania z nich wiedzy z wykorzystaniem środowiska analizy danych IBM SPSS. U1, U2, U3: zadania dodatkowe do samodzielnego rozwiązania przez studentów.

Zajęcia w cyklu "Semestr zimowy 2023/24" (zakończony)

Okres:	2023-10-01 - 2024-02-19	Wybrany podział planu: tygodniowy cykl przedmiotu Przejdź do planu PN WT CW ŚR CZ PT
Typ zajęć:	Ćwiczenia, 15 godzin, 30 miejsc więcej informacji
Koordynatorzy:	Andrzej Geise
Prowadzący grup:	Andrzej Geise
Lista studentów:	(nie masz dostępu)
Zaliczenie:	Przedmiot - Zaliczenie na ocenę Ćwiczenia - Zaliczenie na ocenę
Pełny opis:	1. Big data i hurtownie danych, architektura systemów business inteligance, 2. Data science a data mining - algorytmy analizy danych, 3. EKSPLORACJA NIENADZOROWANA. Techniki redukcji wymiarowości danych - metoda PCA (principal component analysis), CFA (common factor analysis), 4. Analiza skupień - grupowanie obiektów, 5. Badanie asocjacji – analiza koszykowa (basket market analysis), 6. EKSPLORACJA NADZOROWANA. Metody klasyfikacji obiektów - (metody LDA/QDA, drzewa klasyfikacyjne oraz lasy losowe), 7. Regresja logistyczna oraz sztuczne sieci neuronowe w analizie problemów klasyfikacyjnych
Literatura:	Literatura podstawowa: Walesiak M., Gatnar E. (red.) Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa, 2009. An Introduction to R:A Programming Environment for Data Analysis and Graphics, Version 3.3.2 (2016) (źródło internetowe: https://cran.r-project.org/doc/manuals/R-intro.pdf) Literatura uzupełniająca: Larose D.T., Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15467-7, Warszawa 2008. Mendrala D., Szeliga M. Microsoft SQL Server. Modelowanie i eksploracja danych, Helion, 2012. oraz artykuły dostępne w sieci związane z zastosowaniem algorytmów data mining w analizach ekonomicznych i biznesowych,
Uwagi:	W1, U1, U2, U3, K1: projekt końcowy teoretyczno - praktyczny, który sprawdza wiedzę i umiejętności z analizy wybranych zbiorów danych i odkrywania z nich wiedzy z wykorzystaniem środowiska analizy danych IBM SPSS. U1, U2, U3: zadania dodatkowe do samodzielnego rozwiązania przez studentów.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.