Zajęcia projektowe dedykowane są dla studentów i studentek semestrów V do VII studiów I i I semestru II stopnia Wydziału IMiI.
Zakres merytoryczny szkolenia obejmuje następującą tematykę:
- Dokumentacja hurtowni danych. Model analityczny. Model logiczny i fizyczny. Przypadki użycia.
- Instalacja środowiska hurtowni danych. Wybór bazy danych – MySQL, PGSQL
- Narzędzia klienckie i praca w konsoli. Sterowniki i macierz uprawnień.
- DDL – Data Definition Language. Tworzenie struktur. Modele danych. Postać normalna. Redundancja.
- Modele hurtowni – model relacyjny vs model gwiazdy.
- Ekstrakcja danych z systemów zewnętrznych – sposoby pozyskiwania danych.
- Warstwy hurtowni danych. model transportowy, warstwa detaliczna (STG, DDS, CRD).
- Wymagania funkcjonalne vs procesy przetwarzania danych. PL/SQL.
- Procesy ETL. Narzędzia natywne, niskopoziomowe.
- Narzędzia wysokopoziomowe. SAS, IBM InfoSphere, Narzędzia OpenETL
- Wyodrębnienie miar i wymiarów. Warstwa agregowana (struktury płaskie, data mart). Wykorzystanie PL/SQL i narzędzi ETL.
- Wersjonowane źródło danych. Wersje rekordu. Sposoby zamykania rekordów. SCD.
- Flow i harmonogramowanie procesów ETL.
- Wydajność hurtowni danych. Przetwarzanie bez transakcji i transakcyjna baza danych. Indeksy. Partycjonowanie.
- Warstwa raportowa, Bussiness Inteligence.