Seminarium dyplomowe I [1000-MS1-Sem1]
Semestr letni 2019/20
Seminarium,
grupa nr 2
Przedmiot: | Seminarium dyplomowe I [1000-MS1-Sem1] |
Zajęcia: |
Semestr letni 2019/20 [2019/20L]
(zakończony)
Seminarium [SEM], grupa nr 2 [pozostałe grupy] |
Termin i miejsce:
|
|
Terminy najbliższych spotkań:
Kliknij w datę by zobaczyć tygodniowy plan z zaznaczonym spotkaniem. |
Wszystkie zajęcia tej grupy już się odbyły - pokaż terminy wszystkich spotkań. |
Liczba osób w grupie: | 8 |
Limit miejsc: | 8 |
Zaliczenie: | Zaliczenie |
Prowadzący: | Marta Burzańska |
Literatura: |
Metody i modele eksploracji danych / Daniel T. Larose Eksploracja danych : metody i algorytmy / Tadeusz Morzy Zastosowanie języka SQL do analizy statystycznej i eksploracji danych / Robert P. Trueblood, John N. Lovet Python w analizie danych / Wes McKinney Python : uczenie maszynowe / Sebastian Raschka Portal dane.gov.pl |
Zakres tematów: |
Tematyką seminarium będzie zastosowanie różnorodnych narzędzi bazodanowych w analizie masywnych zbiorów danych. Szczególny nacisk będzie położony na przygotowanie danych do analizy. Przykładowe tematy: - algorytmy równoważenia grup uczących (Overbalancing i Underbalancing) - analiza zachowań użytkowników wikipedii (kiedy są największe szanse na szybkie zatwierdzenie zmiany, kiedy najdłużej nie wykrywany jest wandalizm, itp.) - przegląd dostępnych dużych, otwartych zbiorów danych i ich potencjał w nauce algorytmów eksploracji danych - wykorzystanie baz NoSQL do przechowywania i analizy danych hydrologicznych - analiza wydajności różnych bibliotek uczenia maszynowego (np. wersje dla Pythona, języka R i SPSS) - biblioteka Tensorflow/algorytmy deep learning dla Pythona - zalety, wady i obszary zastosowań. Analiza teoretyczno-empiryczna - rozpoznawanie emocji w tekście za pomocą języka Python - opracowanie bazy ROLAP na potrzeby przechowywania danych medycznych - porównanie wydajności SZBD MS SQL Server i PostgreSQL w zakresie zapytań analitycznych - analiza trendów w publikacjach badawczych nt. zarządzania projektami - analiza zastosowania metodyk lekkich w wybranej gałęzi przemysłu wraz z przykładowym scenariuszem przebiegu wybranego procesu |
Metody i kryteria oceniania: |
Aby uczestniczyć w seminarium niezbędna będzie podstawowa znajomość języka Python i bibliotek pandas i scikitlearn. Warunkiem zaliczenia semestru będzie przygotowanie 3 referatów we wskazanej tematyce |
Uwagi: |
3mst |
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.