Docker

Big Data

Durante este curso vamos a aprender los conceptos y componentes que nos permitirán trabajar con un entorno de BigData y Hadoop y montar un clúster con esta tecnología. También veremos los productos y herramientas más habituales de este ecosistema. Este curso es válido para Hadoop y Spark.

BedaTec Formación tiene planes de formación en tecnologías y técnicas en BigData.

Temario Hadoop

  • Introducción
  • Descargar e instalar Hadoop manualmente
  • Instalar y configurar Hadoop con Ambari
  • HDFS para entender la gestión de ficheros en Hadoop
  • Instalación y configuración Map Reduce y YARN
  • Productos y herramientas del ecosistema: HIVE, SQOOP, SPARK, ZooKeeper, HBASE, FLUME

Temario Spark

  • Introducción
  • Los RDDs o Resilient Distributed DataSets
  • Crear, transformar y operar con RDDs para procesar nuestros archivos
  • Soluciones de alto nivel: Spark SQL, Spark Streaming, Spark ML y GraphX
  • Acceso a datos almacenados: Cassandra, HBase, Hive, Tachyon y Hadoop.