Uniwersytet Mikołaja Kopernika w Toruniu - Centralny punkt logowania
Strona główna

Data mining i big data

Informacje ogólne

Kod przedmiotu: 1100-12-E21-AG-DMBD
Kod Erasmus / ISCED: (brak danych) / (0311) Ekonomia Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Data mining i big data
Jednostka: Katedra Ekonometrii i Statystyki
Grupy: Ekonomia - plan studiów 1 rok 2 stopnia
Ekonomia, 1 rok II stopnia, PRK, sp. analityka gospodarcza
Punkty ECTS i inne: 3.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: polski
Wymagania wstępne:

Zakłada się, że student posiada wiedzę z zakresu statystyki oraz narzędzi informatycznych wykorzystywanych w analizie danych

Całkowity nakład pracy studenta:

1. Godziny realizowane z udziałem nauczyciela 15 godz.

2. Konsultacje indywidualne 15 godz.

3. Konsultacje projektów zaliczeniowych 10 godz.

4. Praca indywidualna studenta potrzebna do pomyślnego zaliczenia przedmiotu (przygotowanie i uzupełnienie notatek; zebranie i wybór odpowiednich materiałów do zajęć, wymagane powtórzenie materiału,, czytanie literatury, zapoznanie się z materiałami dydaktycznymi umieszczonymi na platformie e-learningowej, wykonanie zadań) 10 godz.

5. Liczba godzin wymaganych do przygotowania projektu końcowego – 10 godz.;

6. Praca własna studenta 20 godzin.


Łącznie: 80 godzin

Efekty uczenia się - wiedza:

W1: Absolwenta zna i rozumie metody i narzędzia, w tym techniki pozyskiwania danych, właściwe dla nauk ekonomicznych, pozwalające opisywać struktury i instytucje społeczno-ekonomiczne, procesy w nich zachodzące, a także relacje między nimi; metody i narzędzia służące do zaawansowanych rodzajów badań ekonomicznych – K_W06


Efekty uczenia się - umiejętności:

U1: Absolwent potrafi analizować i prognozować procesy społeczno-gospodarcze z wykorzystaniem metod eksploracji nadzorowanej oraz nienadzorowanej - K_U04

U2: Absolwent potrafi korzystać z różnorodnych źródeł danych Big data, potrafi wyciągać z nich wiedzę oraz interpretować wyniki – K_U03

U3: Absolwent potrafi samodzielnie identyfikować problemy ekonomiczne i biznesowe oraz poszukiwać ich rozwiązań w dużych zbiorach danych Big data - K_U06


Efekty uczenia się - kompetencje społeczne:

K1: Absolwent jest gotów samodzielnie i efektywnie pracować z dużymi zbiorami danych - Big data, formułować pytania badawcze, identyfikować ukryte w zależności w danych, oraz poprawnie wnioskować z otrzymanych wyników - K_K01

Metody dydaktyczne podające:

- wykład informacyjny (konwencjonalny)

Metody dydaktyczne poszukujące:

- ćwiczeniowa
- laboratoryjna

Skrócony opis:

Skrócony opis: Celem zajęć jest zapoznanie studentów z algorytmami data mining oraz metodami statystycznymi, które umożliwiają odkrywanie nieznanych zależności (prawidłowości, wzorców, trendów) między danymi w zbiorach danych. Metody te pozwalają z danych tworzyć wiedzę. W badaniach ekonomicznych wykorzystuje się je do prognozowania, klasyfikowania, analizy skupień obiektów, odkrywania asocjacji i sekwencji zdarzeń. Poszczególne metody zostaną omówione z przedstawieniem ich zastosowań. W części praktycznej studenci wykonają analizy przy wykorzystaniu środowiska analizy danych IBM SPSS

Pełny opis:

1. Big data i hurtownie danych, architektura systemów business inteligance,

2. Data science a data mining - algorytmy analizy danych,

3. EKSPLORACJA NIENADZOROWANA. Techniki redukcji wymiarowości danych - metoda PCA (principal component analysis), CFA (common factor analysis),

4. Analiza skupień - grupowanie obiektów,

5. Badanie asocjacji – analiza koszykowa (basket market analysis),

6. EKSPLORACJA NADZOROWANA. Metody klasyfikacji obiektów - (metody LDA/QDA, drzewa klasyfikacyjne oraz lasy losowe),

7. Regresja logistyczna oraz sztuczne sieci neuronowe w analizie problemów klasyfikacyjnych

Literatura:

Literatura podstawowa:

Walesiak M., Gatnar E. (red.) Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa, 2009.

An Introduction to R:A Programming Environment for Data Analysis and Graphics, Version 3.3.2 (2016) (źródło internetowe: https://cran.r-project.org/doc/manuals/R-intro.pdf)

Literatura uzupełniająca:

Larose D.T., Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15467-7, Warszawa 2008.

Mendrala D., Szeliga M. Microsoft SQL Server. Modelowanie i eksploracja danych, Helion, 2012.

oraz artykuły dostępne w sieci związane z zastosowaniem algorytmów data mining w analizach ekonomicznych i biznesowych,

Metody i kryteria oceniania:

W1, U1, U2, U3, K1: projekt końcowy teoretyczno - praktyczny, który sprawdza wiedzę i umiejętności z analizy wybranych zbiorów danych i odkrywania z nich wiedzy z wykorzystaniem środowiska analizy danych IBM SPSS.

U1, U2, U3: zadania dodatkowe do samodzielnego rozwiązania przez studentów.

Zajęcia w cyklu "Semestr zimowy 2021/22" (zakończony)

Okres: 2021-10-01 - 2022-02-20
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Ćwiczenia, 15 godzin, 30 miejsc więcej informacji
Koordynatorzy: Andrzej Geise
Prowadzący grup: Andrzej Geise
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Ćwiczenia - Zaliczenie na ocenę
Pełny opis:

1. Big data i hurtownie danych, architektura systemów business inteligance,

2. Data science a data mining - algorytmy analizy danych,

3. EKSPLORACJA NIENADZOROWANA. Techniki redukcji wymiarowości danych - metoda PCA (principal component analysis), CFA (common factor analysis),

4. Analiza skupień - grupowanie obiektów,

5. Badanie asocjacji – analiza koszykowa (basket market analysis),

6. EKSPLORACJA NADZOROWANA. Metody klasyfikacji obiektów - (metody LDA/QDA, drzewa klasyfikacyjne oraz lasy losowe),

7. Regresja logistyczna oraz sztuczne sieci neuronowe w analizie problemów klasyfikacyjnych

Literatura:

Literatura podstawowa:

Walesiak M., Gatnar E. (red.) Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa, 2009.

An Introduction to R:A Programming Environment for Data Analysis and Graphics, Version 3.3.2 (2016) (źródło internetowe: https://cran.r-project.org/doc/manuals/R-intro.pdf)

Literatura uzupełniająca:

Larose D.T., Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15467-7, Warszawa 2008.

Mendrala D., Szeliga M. Microsoft SQL Server. Modelowanie i eksploracja danych, Helion, 2012.

oraz artykuły dostępne w sieci związane z zastosowaniem algorytmów data mining w analizach ekonomicznych i biznesowych,

Zajęcia w cyklu "Semestr zimowy 2022/23" (zakończony)

Okres: 2022-10-01 - 2023-02-19
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Ćwiczenia, 15 godzin, 30 miejsc więcej informacji
Koordynatorzy: Andrzej Geise
Prowadzący grup: Andrzej Geise
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Ćwiczenia - Zaliczenie na ocenę
Pełny opis:

1. Big data i hurtownie danych, architektura systemów business inteligance,

2. Data science a data mining - algorytmy analizy danych,

3. EKSPLORACJA NIENADZOROWANA. Techniki redukcji wymiarowości danych - metoda PCA (principal component analysis), CFA (common factor analysis),

4. Analiza skupień - grupowanie obiektów,

5. Badanie asocjacji – analiza koszykowa (basket market analysis),

6. EKSPLORACJA NADZOROWANA. Metody klasyfikacji obiektów - (metody LDA/QDA, drzewa klasyfikacyjne oraz lasy losowe),

7. Regresja logistyczna oraz sztuczne sieci neuronowe w analizie problemów klasyfikacyjnych

Literatura:

Literatura podstawowa:

Walesiak M., Gatnar E. (red.) Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa, 2009.

An Introduction to R:A Programming Environment for Data Analysis and Graphics, Version 3.3.2 (2016) (źródło internetowe: https://cran.r-project.org/doc/manuals/R-intro.pdf)

Literatura uzupełniająca:

Larose D.T., Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15467-7, Warszawa 2008.

Mendrala D., Szeliga M. Microsoft SQL Server. Modelowanie i eksploracja danych, Helion, 2012.

oraz artykuły dostępne w sieci związane z zastosowaniem algorytmów data mining w analizach ekonomicznych i biznesowych,

Uwagi:

W1, U1, U2, U3, K1: projekt końcowy teoretyczno - praktyczny, który sprawdza wiedzę i umiejętności z analizy wybranych zbiorów danych i odkrywania z nich wiedzy z wykorzystaniem środowiska analizy danych IBM SPSS.

U1, U2, U3: zadania dodatkowe do samodzielnego rozwiązania przez studentów.

Zajęcia w cyklu "Semestr zimowy 2023/24" (zakończony)

Okres: 2023-10-01 - 2024-02-19
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Ćwiczenia, 15 godzin, 30 miejsc więcej informacji
Koordynatorzy: Andrzej Geise
Prowadzący grup: Andrzej Geise
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Ćwiczenia - Zaliczenie na ocenę
Pełny opis:

1. Big data i hurtownie danych, architektura systemów business inteligance,

2. Data science a data mining - algorytmy analizy danych,

3. EKSPLORACJA NIENADZOROWANA. Techniki redukcji wymiarowości danych - metoda PCA (principal component analysis), CFA (common factor analysis),

4. Analiza skupień - grupowanie obiektów,

5. Badanie asocjacji – analiza koszykowa (basket market analysis),

6. EKSPLORACJA NADZOROWANA. Metody klasyfikacji obiektów - (metody LDA/QDA, drzewa klasyfikacyjne oraz lasy losowe),

7. Regresja logistyczna oraz sztuczne sieci neuronowe w analizie problemów klasyfikacyjnych

Literatura:

Literatura podstawowa:

Walesiak M., Gatnar E. (red.) Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa, 2009.

An Introduction to R:A Programming Environment for Data Analysis and Graphics, Version 3.3.2 (2016) (źródło internetowe: https://cran.r-project.org/doc/manuals/R-intro.pdf)

Literatura uzupełniająca:

Larose D.T., Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, ISBN 978-83-01-15467-7, Warszawa 2008.

Mendrala D., Szeliga M. Microsoft SQL Server. Modelowanie i eksploracja danych, Helion, 2012.

oraz artykuły dostępne w sieci związane z zastosowaniem algorytmów data mining w analizach ekonomicznych i biznesowych,

Uwagi:

W1, U1, U2, U3, K1: projekt końcowy teoretyczno - praktyczny, który sprawdza wiedzę i umiejętności z analizy wybranych zbiorów danych i odkrywania z nich wiedzy z wykorzystaniem środowiska analizy danych IBM SPSS.

U1, U2, U3: zadania dodatkowe do samodzielnego rozwiązania przez studentów.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.
ul. Jurija Gagarina 11, 87-100 Toruń tel: +48 56 611-40-10 https://usosweb.umk.pl/ kontakt deklaracja dostępności mapa serwisu USOSweb 7.0.3.0-2 (2024-04-26)