Project Description

Corsi on site / Data & Analytics

Corso Hadoop administration avanzato

Il corso, disponibile anche in lingua inglese, presenta nozioni di amministrazione avanzata di Hadoop. Il percorso, pensato per un massimo di 10 partecipanti e rivolto esclusivamente a personale interno, si svolge presso la sede dell’azienda cliente.
  • 3 giornate da 8 ore ciascuna
  • Max partecipanti: 10
Hadoop
Data Science
Advanced Analytics
Il corso, disponibile anche in lingua inglese, presenta nozioni di amministrazione avanzata di Hadoop. Il percorso, pensato per un massimo di 10 partecipanti e rivolto esclusivamente a personale interno, si svolge presso la sede dell’azienda cliente.
  • 3 giornate da 8 ore ciascuna
  • Max partecipanti: 10

Temi affrontati

  • Prima giornata

    Hadoop Cluster

    1. Gestione Cluster , aggiunta nodi o dischi, dismissione e patching, deploy parcel /rpm
    2. Verifica KPI su Cloudera Manager stato di salute del sistema
    3. Analisi Log e troubleshooting Cluster Hadoop
  • Seconda giornata

    HDFS

    1. HDFS management: snapshot, backup, caching , permission & ACL
    2. Performance analysis , advanced tuning e testing HDFS filesystem
    3. HBase: gestione, multinancy & replicazione
    4. HBase: performance analysis & bottleneck & split problem
  • Terza giornata

    Yarn

    1. Yarn: log analysis
    2. Yarn: pool management administration & ACL & group mapping
    3. Yarn: fine tuning
    4. Sentry & Kerberized Cluster security

Requisiti

Per poter seguire le lezioni i partecipanti dovranno avere a disposizione 4 nodi (virtuali o su cloud – consigliato AWS) e un account GitHub, oltre ad essere già in possesso di una formazione base su Hadoop.