Eksploracja dużych zbiorów danych
Informacje ogólne
Kod przedmiotu: | 0800-EDZBIOD |
Kod Erasmus / ISCED: |
(brak danych)
/
(0612) Database and network design and administration
|
Nazwa przedmiotu: | Eksploracja dużych zbiorów danych |
Jednostka: | Wydział Fizyki, Astronomii i Informatyki Stosowanej |
Grupy: |
Informatyka Stosowana s2. Przedmioty do wyboru specjalistyczne (wszystkie) |
Punkty ECTS i inne: |
5.00
|
Język prowadzenia: | polski |
Wymagania wstępne: | Algorytmika, Programowanie w języku Python i Java. Podstawowe koncepcje relacyjnych i nie-relacyjnych baz danych. Podstawy uczenia maszynowego, analizy danych i statystycznej analizy danych |
Całkowity nakład pracy studenta: | Uczestnictwo w wykładach- 30h Uczestnictwo w laboratoriach- 30 h Praca indywidulana- 60 h Przygotowanie i udział w egzaminie- 30 h Razem: 150 h ( 5 ECTS) |
Efekty uczenia się - wiedza: | K_W02- posiada rozszerzoną wiedzę w zakresie zaawansowanej konstrukcji i analizy algorytmów, metod optymalizacji, posiada rozszerzoną wiedzę w zakresie zagadnień metod numerycznych K_W03 - posiada rozbudowaną wiedzę w zakresie zaawansowanych języków programowania i zaawansowanych konstrukcji w językach programowania, posiada wiedzę o przydatnych narzędziach czy bibliotekach narzędzi/funkcji K_W04 - posiada wiedzę pozwalającą w ponadpodstawowy sposób pracować samodzielnie, jak i w grupie, pełniąc różnego typu role zawodowe K_W06 - posiada szczegółową wiedzę związaną ze studiowaną specjalnością |
Efekty uczenia się - umiejętności: | K_U01 - efektywnie umie szukać niezbędnych informacji do rozwiązywania problemów informatycznych, posiada umiejętność samodzielnego wyszukiwania i wykorzystywania informacji z zakresu informatyki i powiązanych dziedzin K_U02 - potrafi efektywnie wymieniać informacje związane z projektami informatycznymi, używając języka ojczystego a także angielskiego, umie korzystać z wiedzy zapisanej w języku ojczystym i języku angielskim, potrafi przygotować dokumentację, prezentację oraz omówić projekt w języku angielskim K_U03 - posiada rozszerzone umiejętności samodzielnej pracy, potrafi określić niezbędny zakres wiedzy, jaki trzeba zdobyć, by zrealizować określony projekt informatyczny, posiada umiejętność zdobywania wiedzy/douczania się, rozwijania swojej wiedzy, wykorzystuje przy tym różnorodne techniki dostępu do informacji K_U05 - posiada rozszerzone umiejętności pracy grupowej, potrafi efektywnie pracować w grupie i efektywnie wykorzystywać niezbędne narzędzia (programistyczne, diagnostyczne), wykorzystuje czas swój i współpracowników, potrafi rozwiązać proste problemy badawcze K_U10 - potrafi wykorzystywać właściwe narzędzia programistyczne pozwalające na realizację projektów w zakresie studiowanej specjalnośc K_U11 - ma przygotowanie niezbędne w środowisku przemysłowym oraz zna zasady bezpieczeństwa związane z tą pracą w zakresie studiowanej specjalności |
Efekty uczenia się - kompetencje społeczne: | K_K01 - rozumie potrzebę uczenia się przez całe życie, potrafi inspirować proces uczenia się innych osób K_K04 - ma świadomość skutków wadliwie działających systemów informatycznych, które mogą doprowadzić do strat moralnych i finansowych, a nawet utraty zdrowia czy zagrożenia życia K_K05 - rozumie potrzebę zachowań profesjonalnych i przestrzegania zasad etyki |
Pełny opis: |
Program (1h) Masywne Dane (3V), Uczenie Maszynowe, (2h) Map/Reduce (2h) Wyszukiwanie podobnych obiektów (2h) Przetwarzanie strumieni Danych (2h) Analiza sieci społecznościowych (2h) Systemy Rekomendujące (2h) Redukcja wymiarowości Program (Laboratorium 30h): (2h) Powtórzenie modeli danych, indeksów oraz funkcje skrótu (2h) Map/Reduce - wstęp (2h) Algorytmy Map/Reduce (2h) Wyszukiwanie bliskiego sąsiedztwa, Lokalnie czułe funkcje skrótu dla dokumentów - implementacja na przykładzie (2h) Strumienie danych - wstęp, próbkowanie i filtrowanie (2h) Strumienie danych - Estymowanie momentów (2h) Page Rank / Hub-Authority Score (2h) Znajdowanie komponentów w grafach (2h) Zbiory częstościowe (2h) Masywne klastrowanie (2h) Systemy rekomendujace -- implementacja jednego z wybranych modeli (2h) Redukcja wymiarów - PCA, SVD (2h) Omówienie projektów zaliczeniowych (2h) Prezentacje projektów zaliczeniowych |
Literatura: |
1. Jure Leskovec, Anand Rajaraman, Jeff Ullman “Mining of Massive Datasets” 2. Chakrabarti, Soumen. Mining the Web: Discovering knowledge from hypertext data. Elsevier |
Metody i kryteria oceniania: |
Wykład - egzamin ustny Laboratorium - projekt + referat |
Zajęcia w cyklu "Semestr letni 2021/22" (zakończony)
Okres: | 2022-02-21 - 2022-09-30 |
Przejdź do planu
PN WYK
WT LAB
ŚR CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Michał Meina | |
Prowadzący grup: | (brak danych) | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Egzamin
Laboratorium - Zaliczenie na ocenę Wykład - Egzamin |
Zajęcia w cyklu "Semestr zimowy 2024/25" (w trakcie)
Okres: | 2024-10-01 - 2025-02-23 |
Przejdź do planu
PN WT LAB
ŚR WYK
CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin
Wykład, 30 godzin
|
|
Koordynatorzy: | Michał Meina | |
Prowadzący grup: | Piotr Przymus, Krzysztof Rykaczewski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Egzamin
Laboratorium - Zaliczenie na ocenę Wykład - Egzamin |
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.