Contidos básicos de Big data aplicado conforme ao Real Decreto 279/2021, de 20 de abril

De MediaWiki
Ir a la navegación Ir a la búsqueda

Gestión de soluciones con sistemas de almacenamiento y herramientas del centro de datos para la resolución de problemas

  • Almacenamiento de datos masivo.
  • Procesamiento de datos.
  • Analítica de Big Data en los ecosistemas de almacenamiento.
  • Big Data y Cloud.

Gestión de sistemas de almacenamiento y ecosistemas Big Data

  • Computación distribuida. Computación paralela,
  • Sistemas de almacenamiento distribuidos. Tolerancia a fallos.
  • Herramientas:
  • Map Reduce.
  • Pig, Hive, Flume.
  • Sqoop, Oozie.
  • Automatización de Jobs.
  • Consultas Pig y Hive.
  • Otras herramientas.

Generación de mecanismos de Integridad de los datos. Comprobación de mantenimiento de sistemas de ficheros

  • Calidad de los datos.
  • Comprobación de la integridad de datos de los sistemas de ficheros distribuidos.Sumas de verificación.
  • Movimiento de datos entre clusters. Actualización y migración. Metadatos.

Monitorización, optimización y solución de problemas

  • Herramientas de monitorización: Interfaz web del Jobtracker y Namenode, entre otras.
  • Análisis de los históricos.
  • Monitorización del clúster: Ganglia, entre otros.

Validación de técnicas Big Data en la toma de decisiones en Inteligencia de negocios BI

  • Modelos de Inteligencia de negocios.
  • Proceso del modelo KDD (Knowledge Discovery in Databases).
  • Etapas: Selección, limpieza, transformación de datos, minería de datos, interpretación y evaluación de datos.
  • Implantación de modelos de inteligencia de negocios BI.
  • Técnicas de validación de modelos BI.

Referencias