Uniwersytet Mikołaja Kopernika w Toruniu - Centralny punkt logowaniaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Eksploracja dużych zbiorów danych

Informacje ogólne

Kod przedmiotu: 0800-EDZBIOD Kod Erasmus / ISCED: (brak danych) / (0612) Database and network design and administration
Nazwa przedmiotu: Eksploracja dużych zbiorów danych
Jednostka: Wydział Fizyki, Astronomii i Informatyki Stosowanej
Grupy: Informatyka Stosowana s2. Przedmioty do wyboru specjalistyczne (wszystkie)
Punkty ECTS i inne: 5.00
Język prowadzenia: polski
Wymagania wstępne:

Algorytmika, Programowanie w języku Python i Java. Podstawowe koncepcje relacyjnych i nie-relacyjnych baz danych. Podstawy uczenia maszynowego, analizy danych i statystycznej analizy danych

Całkowity nakład pracy studenta:

Uczestnictwo w wykładach- 30h

Uczestnictwo w laboratoriach- 30 h

Praca indywidulana- 60 h

Przygotowanie i udział w egzaminie- 30 h

Razem: 150 h ( 5 ECTS)

Efekty uczenia się - wiedza:

K_W02- posiada rozszerzoną wiedzę w zakresie zaawansowanej konstrukcji i analizy algorytmów, metod optymalizacji, posiada rozszerzoną wiedzę w zakresie zagadnień metod numerycznych

K_W03 - posiada rozbudowaną wiedzę w zakresie zaawansowanych języków programowania i zaawansowanych konstrukcji w językach programowania, posiada wiedzę o przydatnych narzędziach czy bibliotekach narzędzi/funkcji

K_W04 - posiada wiedzę pozwalającą w ponadpodstawowy sposób pracować samodzielnie, jak i w grupie, pełniąc różnego typu role zawodowe

K_W06 - posiada szczegółową wiedzę związaną ze studiowaną specjalnością

Efekty uczenia się - umiejętności:

K_U01 - efektywnie umie szukać niezbędnych informacji do rozwiązywania problemów informatycznych, posiada umiejętność samodzielnego wyszukiwania i wykorzystywania informacji z zakresu informatyki i powiązanych dziedzin

K_U02 - potrafi efektywnie wymieniać informacje związane z projektami informatycznymi, używając języka ojczystego a także angielskiego, umie korzystać z wiedzy zapisanej w języku ojczystym i języku angielskim, potrafi przygotować dokumentację, prezentację oraz omówić projekt w języku angielskim

K_U03 - posiada rozszerzone umiejętności samodzielnej pracy, potrafi określić niezbędny zakres wiedzy, jaki trzeba zdobyć, by zrealizować określony projekt informatyczny, posiada umiejętność zdobywania wiedzy/douczania się, rozwijania swojej wiedzy, wykorzystuje przy tym różnorodne techniki dostępu do informacji

K_U05 - posiada rozszerzone umiejętności pracy grupowej, potrafi efektywnie pracować w grupie i efektywnie wykorzystywać niezbędne narzędzia (programistyczne, diagnostyczne), wykorzystuje czas swój i współpracowników, potrafi rozwiązać proste problemy badawcze

K_U10 - potrafi wykorzystywać właściwe narzędzia programistyczne pozwalające na realizację projektów w zakresie studiowanej specjalnośc

K_U11 - ma przygotowanie niezbędne w środowisku przemysłowym oraz zna zasady bezpieczeństwa związane z tą pracą w zakresie studiowanej specjalności


Efekty uczenia się - kompetencje społeczne:

K_K01 - rozumie potrzebę uczenia się przez całe życie, potrafi inspirować proces uczenia się innych osób

K_K04 - ma świadomość skutków wadliwie działających systemów informatycznych, które mogą doprowadzić do strat moralnych i finansowych, a nawet utraty zdrowia czy zagrożenia życia

K_K05 - rozumie potrzebę zachowań profesjonalnych i przestrzegania zasad etyki

Pełny opis:

Program

(1h) Masywne Dane (3V), Uczenie Maszynowe,

(2h) Map/Reduce

(2h) Wyszukiwanie podobnych obiektów

(2h) Przetwarzanie strumieni Danych

(2h) Analiza sieci społecznościowych

(2h) Systemy Rekomendujące

(2h) Redukcja wymiarowości

Program (Laboratorium 30h):

(2h) Powtórzenie modeli danych, indeksów oraz funkcje skrótu

(2h) Map/Reduce - wstęp

(2h) Algorytmy Map/Reduce

(2h) Wyszukiwanie bliskiego sąsiedztwa, Lokalnie czułe funkcje skrótu dla dokumentów - implementacja na przykładzie

(2h) Strumienie danych - wstęp, próbkowanie i filtrowanie

(2h) Strumienie danych - Estymowanie momentów

(2h) Page Rank / Hub-Authority Score

(2h) Znajdowanie komponentów w grafach

(2h) Zbiory częstościowe

(2h) Masywne klastrowanie

(2h) Systemy rekomendujace -- implementacja jednego z wybranych modeli

(2h) Redukcja wymiarów - PCA, SVD

(2h) Omówienie projektów zaliczeniowych

(2h) Prezentacje projektów zaliczeniowych

Literatura:

1. Jure Leskovec, Anand Rajaraman, Jeff Ullman “Mining of Massive Datasets”

2. Chakrabarti, Soumen. Mining the Web: Discovering knowledge from hypertext data. Elsevier

Metody i kryteria oceniania:

Wykład - egzamin ustny

Laboratorium - projekt + referat

Zajęcia w cyklu "Semestr letni 2018/19" (zakończony)

Okres: 2019-02-25 - 2019-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Michał Meina
Prowadzący grup: Michał Meina
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin

Zajęcia w cyklu "Semestr letni 2019/20" (zakończony)

Okres: 2020-02-29 - 2020-09-20
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Tomasz Andrysiak
Prowadzący grup: Michał Meina
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin

Zajęcia w cyklu "Semestr letni 2020/21"

Okres: 2021-02-22 - 2021-09-20
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Tomasz Andrysiak
Prowadzący grup: Tomasz Andrysiak
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin

Zajęcia w cyklu "Semestr letni 2021/22" (jeszcze nie rozpoczęty)

Okres: 2022-02-21 - 2022-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 30 godzin więcej informacji
Wykład, 30 godzin więcej informacji
Koordynatorzy: Tomasz Andrysiak
Prowadzący grup: Tomasz Andrysiak
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.