Školenie je ideálne pre dátových profesionálov, ktorí chcú posunúť svoje zručnosti a plne ovládnuť Data Engineering v prostredí Microsoft Fabric. Toto školenie spolu so školením Data Analysis v Microsoft Fabric [GOC682] tvoria dohromady [...]
  • GOC681
  • Dĺžka 3 dni
  • 30 ITK bodov
  • 1 termín
  • SR (1 250 €)

    ČR (29 600 Kč)

  • Pokročilý

Školenie je ideálne pre dátových profesionálov, ktorí chcú posunúť svoje zručnosti a plne ovládnuť Data Engineering v prostredí Microsoft Fabric. Toto školenie spolu so školením Data Analysis v Microsoft Fabric [GOC682] tvoria dohromady dôkladnú prípravu na certifikačnú skúšku DP-600: Fabric Analytics Engineer Associate. Naučíte sa princípy medaillon architektúry, preskúmate metódy získavania dát pomocou Dataflows Gen2, Pipelines a Notebooks. Kurz pokrýva ukladanie dát, rozdiely medzi dátovými skladmi a Lakehouses, ich dotazovanie a komponenty ako stored procedures, functions, data masking atď. Automatizácia procesov pomocou orchestračných pipelines vás naučí koordinovať data workflows a integrovať s medaillon architektúrou. Z pohľadu optimalizácie výkonu sa zameriate na techniky ako partitioning a kompresia. Naučíte sa monitorovať kapacity a merať efektivitu spracovania dát. Skúsite si verzovanie a nasadzovanie zmien pomocou Git integrácie a deployment pipelines.

»
  • Porozumiete princípom a komponentom medallion architektúry
  • Naučíte sa, ako efektívne nastaviť prostredie a konfigurovať nastavenia tenantu
  • Preskúmate rôzne metódy extrakcie a načítania dát pomocou Dataflows Gen2, Pipelines a Notebooks
  • Zvládnete techniky kopírovania a opätovného použitia dát v OneLake
  • Ovládnete profilovanie, čistenie a transformáciu dát pomocou praktických príkladov
  • Ponoríte sa do možností ukladania dát, vrátane Data Warehouse a Data Lakes, a naučíte sa, ako zabezpečiť dáta
  • Objavíte, ako automatizovať Dataflows pomocou orchestračných pipelines
  • Naučíte sa, ako monitorovať a optimalizovať výkon pomocou pokročilých techník
  • Pochopíte verzovanie a nasadzovanie zmien pomocou Git integrácie a deployment pipelines

Kurz je zameraný na dátových inžinierov a vývojárov, ktorí sa chcú naučiť efektívne pracovať v prostredí Microsoft Fabric. Ďalej je kurz vhodný pre business analytikov a dátových architektov, ktorí si chcú zlepšiť svoje zručnosti v oblasti správy a optimalizácie dát.

  • Základná znalosť relačných databáz a jazyka SQL
  • Základné skúsenosti s data warehouses alebo data lakes
  • Základné porozumenie konceptom extrakcie, načítania, profilovania a transformácie dát
  • Základné skúsenosti s nástrojmi pre dátovú analýzu a integráciu dát (napr. ETL procesy, data pipelines)
  • Znalosť verzovania a Git integrácie výhodou
1. Nastavenie prostredia a vysvetlenie princípov
  • Medaillon architecture – princípy a komponenty:
    • Data Lakes, Data Warehouses, štruktúrovaná analytika, sémantické modely, analytické engines
    • Nastavenie tenantov, ako vybrať kapacitu, ako nad tým uvažovať
2. Data Ingestion a kopírovanie dát
  • Prieskum spôsobov načítania dát
    • Dataflows Gen2
    • Pipelines
    • Notebooks
  • Kopírovanie a prepoužitie dát v rámci OneLake
    • Shortcuts
    • Rozhodovacia metodika prístupu
    • Kedy, akú metódu zvoliť, ako nad tým architektonicky premýšľať + praktická aplikácia, výroba
3. Data profiling, čistenie a transformácia
  • Data profiling
    • Princípy
    • Implementácia a možnosti v notebooks a dataflows gen2
  • Data cleaning and transforming
    • Zostavenie čistiacich mechanizmov na základe výsledkov dátovej profilácie
    • Implementácia dátových transformácií
    • Slowly changing dimensions atď.
4. Uloženie dát
  • Rozdiely medzi Data Warehouse a Lakehouse a ich vytvorenie
  • Dotazovanie na dáta v rámci DWH a Lakehouse
    • SQL dotazy a visual queries
    • Vnútroitemové dotazy, medziitemové dotazy
  • Komponenty v rámci DWH a Lakehouse
    • Store procedures, functions, roles, schemas, RLS, CLS, data masking atď.
    • Kedy použiť warehouse, lakehouse, ako pracovať s ich dátami, ako vytvárať ich podružné komponenty, ako zabezpečiť dáta
5. Automatizácia
  • Orchestračné pipeline
    • Koordinácia – sekvencovanie data workflows
    • Závislosti – správa poradia exekúcií
    • Integrácia – prepojenie s komponentmi medallion architektúry
  • Vnútorná orchestrácia notebookov
    • Ako využiť data pipelines pre orchestráciu nadväzných pipelines, notebookov, dataflows, store procedures
    • Ako orchestrovať notebooky v rámci aktívnej session
    • Implementácia fail-over scenárov
6. Monitoring & optimalizácia
  • Optimalizácia výkonu
  • Bližší pohľad na techniky vylepšujúce výkon
    • Partitioning
    • Kompresia
    • V-order
    • Vacuuming
  • Admin perspektíva
    • Monitoring kapacít – sledovanie využitia zdrojov
    • Metriky efektivity – meranie efektivity spracovania dát
7. Verzovanie a nasadzovanie zmien
  • Git integrácia
  • Deployment pipelines
Aktuálna ponuka
Školiace miesto
Jazyk kurzu

Uvedené ceny sú bez DPH.

Školenie na mieru

Nenašli ste vhodný termín, alebo chcete školenie prispôsobiť špecifickým potrebám vášho tímu? Radi pre vás pripravíme školenie na mieru.