Uniwersytet Mikołaja Kopernika w Toruniu - Centralny punkt logowania
Strona główna

Eksploracja dużych zbiorów danych

Informacje ogólne

Kod przedmiotu: 0800-EDZBIOD
Kod Erasmus / ISCED: (brak danych) / (0612) Database and network design and administration Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Eksploracja dużych zbiorów danych
Jednostka: Wydział Fizyki, Astronomii i Informatyki Stosowanej
Grupy: Informatyka Stosowana s2. Przedmioty do wyboru specjalistyczne (wszystkie)
Punkty ECTS i inne: 5.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Wymagania wstępne:

Algorytmika, Programowanie w języku Python i Java. Podstawowe koncepcje relacyjnych i nie-relacyjnych baz danych. Podstawy uczenia maszynowego, analizy danych i statystycznej analizy danych

Całkowity nakład pracy studenta:

Uczestnictwo w wykładach- 30h

Uczestnictwo w laboratoriach- 30 h

Praca indywidulana- 60 h

Przygotowanie i udział w egzaminie- 30 h

Razem: 150 h ( 5 ECTS)

Efekty uczenia się - wiedza:

K_W02- posiada rozszerzoną wiedzę w zakresie zaawansowanej konstrukcji i analizy algorytmów, metod optymalizacji, posiada rozszerzoną wiedzę w zakresie zagadnień metod numerycznych

K_W03 - posiada rozbudowaną wiedzę w zakresie zaawansowanych języków programowania i zaawansowanych konstrukcji w językach programowania, posiada wiedzę o przydatnych narzędziach czy bibliotekach narzędzi/funkcji

K_W04 - posiada wiedzę pozwalającą w ponadpodstawowy sposób pracować samodzielnie, jak i w grupie, pełniąc różnego typu role zawodowe

K_W06 - posiada szczegółową wiedzę związaną ze studiowaną specjalnością

Efekty uczenia się - umiejętności:

K_U01 - efektywnie umie szukać niezbędnych informacji do rozwiązywania problemów informatycznych, posiada umiejętność samodzielnego wyszukiwania i wykorzystywania informacji z zakresu informatyki i powiązanych dziedzin

K_U02 - potrafi efektywnie wymieniać informacje związane z projektami informatycznymi, używając języka ojczystego a także angielskiego, umie korzystać z wiedzy zapisanej w języku ojczystym i języku angielskim, potrafi przygotować dokumentację, prezentację oraz omówić projekt w języku angielskim

K_U03 - posiada rozszerzone umiejętności samodzielnej pracy, potrafi określić niezbędny zakres wiedzy, jaki trzeba zdobyć, by zrealizować określony projekt informatyczny, posiada umiejętność zdobywania wiedzy/douczania się, rozwijania swojej wiedzy, wykorzystuje przy tym różnorodne techniki dostępu do informacji

K_U05 - posiada rozszerzone umiejętności pracy grupowej, potrafi efektywnie pracować w grupie i efektywnie wykorzystywać niezbędne narzędzia (programistyczne, diagnostyczne), wykorzystuje czas swój i współpracowników, potrafi rozwiązać proste problemy badawcze

K_U10 - potrafi wykorzystywać właściwe narzędzia programistyczne pozwalające na realizację projektów w zakresie studiowanej specjalnośc

K_U11 - ma przygotowanie niezbędne w środowisku przemysłowym oraz zna zasady bezpieczeństwa związane z tą pracą w zakresie studiowanej specjalności


Efekty uczenia się - kompetencje społeczne:

K_K01 - rozumie potrzebę uczenia się przez całe życie, potrafi inspirować proces uczenia się innych osób

K_K04 - ma świadomość skutków wadliwie działających systemów informatycznych, które mogą doprowadzić do strat moralnych i finansowych, a nawet utraty zdrowia czy zagrożenia życia

K_K05 - rozumie potrzebę zachowań profesjonalnych i przestrzegania zasad etyki

Pełny opis:

Program

(1h) Masywne Dane (3V), Uczenie Maszynowe,

(2h) Map/Reduce

(2h) Wyszukiwanie podobnych obiektów

(2h) Przetwarzanie strumieni Danych

(2h) Analiza sieci społecznościowych

(2h) Systemy Rekomendujące

(2h) Redukcja wymiarowości

Program (Laboratorium 30h):

(2h) Powtórzenie modeli danych, indeksów oraz funkcje skrótu

(2h) Map/Reduce - wstęp

(2h) Algorytmy Map/Reduce

(2h) Wyszukiwanie bliskiego sąsiedztwa, Lokalnie czułe funkcje skrótu dla dokumentów - implementacja na przykładzie

(2h) Strumienie danych - wstęp, próbkowanie i filtrowanie

(2h) Strumienie danych - Estymowanie momentów

(2h) Page Rank / Hub-Authority Score

(2h) Znajdowanie komponentów w grafach

(2h) Zbiory częstościowe

(2h) Masywne klastrowanie

(2h) Systemy rekomendujace -- implementacja jednego z wybranych modeli

(2h) Redukcja wymiarów - PCA, SVD

(2h) Omówienie projektów zaliczeniowych

(2h) Prezentacje projektów zaliczeniowych

Literatura:

1. Jure Leskovec, Anand Rajaraman, Jeff Ullman “Mining of Massive Datasets”

2. Chakrabarti, Soumen. Mining the Web: Discovering knowledge from hypertext data. Elsevier

Metody i kryteria oceniania:

Wykład - egzamin ustny

Laboratorium - projekt + referat

Zajęcia w cyklu "Semestr letni 2021/22" (zakończony)

Okres: 2022-02-21 - 2022-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Michał Meina
Prowadzący grup: (brak danych)
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.
ul. Jurija Gagarina 11, 87-100 Toruń tel: +48 56 611-40-10 https://usosweb.umk.pl/ kontakt deklaracja dostępności USOSweb 7.0.2.0-1 (2024-03-12)