Project Description

Corsi on site / Data & Analytics

Corso Hadoop administration base

Il corso si concentra sulle basi di Hadoop. Il percorso, pensato per un massimo di 10 partecipanti e rivolto esclusivamente a personale interno, si svolge presso la sede del cliente.
  • 5 giornate da 8 ore ciascuna

  • Max partecipanti: 10
Hadoop
Data Science
Advanced Analytics
Il corso si concentra sulle basi di Hadoop. Il percorso, pensato per un massimo di 10 partecipanti e rivolto esclusivamente a personale interno, si svolge presso la sede del cliente.
  • 5 giornate da 8 ore ciascuna

  • Max partecipanti: 10

Temi affrontati

  • Prima giornata

    Introduzione

    1. Big data introduzione
    2. Problematiche risolvibili con Hadoop
    3. Architettura introduzione base
    4. Architettura CDH e Cloudera manager
  • Seconda giornata

    Amministrazione

    1. Installazione Cluster 4 nodi
    2. HDFS: basi e teoria
    3. HDFS: hands on
    4. HBase: basi e teoria
    5. HBase: hands on
  • Terza giornata

    Amministrazione

    1. Flume e Sqoop2: basi e teoria
    2. Flume e Sqoop2: hands on (esercitazioni pratiche)
  • Quarta giornata

    Developer

    1. Kafka: hands on
    2. Hive & Impala: basi e teoria
    3. Pig: basi e teoria
    4. Hive, Pig, Impala: deploy e hands on
    5. Kafka: basi e teoria

    Amministrazione

    1. Yarn: teoria
    2. Yarn: Scheduling e Resource Pool hands on
  • Quinta giornata

    Developer

    1. Spark: teoria
    2. Spark: hands on introduttiva
    3. Permission e Security

    Amministrazione

    1. Sentry

Requisiti

Per poter seguire le lezioni i partecipanti dovranno avere a disposizione 4 nodi (virtuali o su cloud – consigliato AWS) e un account GitHub.