Uniwersytet Mikołaja Kopernika w Toruniu - Centralny punkt logowania
Strona główna

Techniki i narzędzia wizualizacji dużych zbiorów danych

Informacje ogólne

Kod przedmiotu: 117209-M1-TiNWDZD
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Techniki i narzędzia wizualizacji dużych zbiorów danych
Jednostka: Wydział Nauk Ekonomicznych i Zarządzania
Grupy: KD "Działania w zakresie kompetencji dot. zarządzania informacją"
Punkty ECTS i inne: (brak) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: polski
Wymagania wstępne:

Podstawowa umiejętność posługiwania się komputerem z systemem operacyjnym Windows.

Całkowity nakład pracy studenta:

Liczba godzin kontaktowych: 30

Praca indywidualna uczestnika: samodzielne uczenie się – 60 godzin, instalacja oprogramowania i zapoznanie się z nim – 30 godzin, odrabianie zadań domowych – 30 godzin.


Efekty uczenia się - wiedza:

TiNWDZD-W01 Zna najważniejsze techniki wizualizacji danych.

TiNWDZD-W02 Orientuje się w dostępnym na rynku oprogramowaniu do wizualizacji danych.


Efekty uczenia się - umiejętności:

TiNWDZD-U01 Umie ocenić poprawność danych i przekształcić je do postaci wymaganej przez konkretny program i wybraną metodę wizualizacji.

TiNWDZD-U02 Umie zaproponować odpowiedni sposób wizualizacji wybranych zmiennych.

TiNWDZD-U03 Umie posługiwać się w stopniu co najmniej podstawowym programem PS IMAGO (IBM SPSS Statistics), środowiskiem R i językiem programowania Python.


Efekty uczenia się - kompetencje społeczne:

TiNWDZD-K01 Rozumie potrzebę pozyskiwania wiedzy w oparciu o dane.

TiNWDZD-K02 Potrafi prezentować skomplikowane zależności pomiędzy zmiennymi w sposób zrozumiały zarówno dla ekspertów jak i dla studentów.

TiNWDZD-K03 Potrafi dostrzec zagadnienia związane z pozyskiwaniem wiedzy z danych w nauczanych przez siebie przedmiotach oraz wspomóc studentów w doborze odpowiednich rodzajów wizualizacji danych w ich pracy.


Metody dydaktyczne:

Metoda laboratoryjna.

Metody dydaktyczne podające:

- wykład informacyjny (konwencjonalny)
- wykład problemowy

Metody dydaktyczne poszukujące:

- laboratoryjna

Skrócony opis:

Przedmiot ma na celu zapoznanie uczestników z podstawowymi programami i narzędziami wizualizacji dużych zbiorów danych.

Pełny opis:

Realizowane tematy:

1. Podstawy wizualizacji danych: od najprostszych wykresów do skomplikowanych grafik. Zasady dobrej wizualizacji danych. Typowe błędy w tworzeniu oraz interpretacji wykresów (1 h).

2. Program PS IMAGO (IBM SPSS Statistics) – instalacja, wczytywanie danych (1 h).

3. Przekształcanie zbiorów danych: rekodowanie, obliczanie wartości, restrukturyzacja, agregacja, wybór obserwacji (2 h).

4. Tworzenie podstawowych wykresów w kreatorze wykresów i szablonach wizualizacji danych (3 h).

5. Kartogramy i inne wykresy na mapach (2 h).

6. Wykresy animowane (1 h).

7. Pakiet R i RStudio – instalacja, zarządzanie pakietami, wczytywanie i podstawowe operacje na danych (2h).

8. Zarządzanie zbiorem danych – selekcja, agregacja, restrukturyzacja (2h).

9. Podstawowe typy wykresów z pakietu graphics (1h).

10. Zaawansowane tworzenie wykresów, wykresy interaktywne – pakiety ggplot2 i rCharts (3h).

11. Wykresy trójwymiarowe, wykresy na mapach – przegląd najważniejszych pakietów (2h).

12. Python – instalacja dystrybucji i pakietów. Notatniki Jupyter i środowisko Spyder (1h).

13. Wczytywanie i przekształcanie zbiorów danych – pakiety numpy i pandas (3h).

14. Tworzenie podstawowych wykresów przy pomocy pakietu matplotlib (2h).

15. Wizualizacja danych statystycznych – pakiet seaborn (2h).

16. Wykresy 3d, animacje, wykresy na mapach – przegląd dostępnych pakietów (2h).

Literatura:

1. Przemysław Biecek: ,,Odkrywać! Ujawniać! Objaśniać! Zbiór esejów o sztuce prezentowania danych’’. Wydawnictwo Uniwersytetu Warszawskiego, Warszawa, 2014 (dostępne na stronie http://www.biecek.pl/Eseje/).

2. Julie Steele. Noah Iliinsky: ,,Beautiful Visualization’’, O’Reilly, 2010.

3. Jarosław Górniak, Janusz Wachnicki: ,,Pierwsze kroki w analizie danych – SPSS for Windows’’, SPSS Polska, Kraków, 2004.

4. Przemysław Biecek: „Przewodnik po pakiecie R”, Oficyna Wydawnicza GiS, 2014.

5. Przemysław Biecek: „Analiza danych z programem R”, PWN, Warszawa 2013.

6. Marek Gągolewski, Maciej Bartoszuk, Anna Cena: „Przetwarzanie i analiza danych w języku Python”, PWN, Warszawa 2017.

7. Igor Milovanović: „Python Data Visualization Cookbook”, Packt Publishing, 2013.

Metody i kryteria oceniania:

Uczestnictwo w zajęciach, zadania domowe.

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.
ul. Jurija Gagarina 11, 87-100 Toruń tel: +48 56 611-40-10 https://usosweb.umk.pl/ kontakt deklaracja dostępności mapa serwisu USOSweb 7.1.1.0-7 (2025-03-24)