top of page

DBRICKS-DE_INT | Data Engineering with Databricks

 

Este es un curso introductorio que constituye un punto de partida adecuado para aprender Ingeniería de Datos con Databricks.

 

Objetivos del curso

Este curso prepara a los participantes para presentar el examen de certificación Associate Data Engineer de Databricks y proporciona la base necesaria para avanzar al curso Advanced Data Engineering with Databricks.


Perfil de audiencia

  • Profesionales encargados de construir, mantener y optimizar pipelines de datos.
  • Analistas con conocimientos de SQL o Python.
  • Responsables de diseñar la infraestructura de datos


Prerrequisitos

Experiencia con el entorno de Databricks, conocimientos básicos de Python, experiencia con SQL y Bases de Datos, nociones de flujos ETL/ELT.


Versión de la tecnología

  • 1


Esquema del curso

Capítulo 1: Ingesta de Datos con Delta Lake

  • Objetivos
  • 1.1 Delta Lake y objetos de datos
  • 1.2 Configuración y carga de tablas Delta
  • 1.3 Transformaciones básicas
  • 1.4 Laboratorio: Carga de datos
  • 1.5 Limpieza de datos
  • 1.6 Transformaciones complejas
  • 1.7 Funciones definidas por el usuario en SQL (SQL UDFs)
  • 1.8 Funcionalidades avanzadas de Delta Lake
  • 1.9 Laboratorio: Manipulación de tablas Delta
  • Resumen
  • Referencias bibliográficas

Capítulo 2: Despliegue de Cargas de Trabajo con Databricks Workflows

  • Objetivos
  • 2.1 Introducción a Workflows
  • 2.2 Recursos de cómputo para Jobs
  • 2.3 Programación de tareas con la interfaz Jobs UI
  • 2.4 Laboratorio: Ejecución de flujos de trabajo
  • 2.5 Funcionalidades clave de Jobs
  • 2.6 Exploración de opciones de programación
  • 2.7 Tareas condicionales y recuperación de ejecuciones fallidas
  • 2.8 Orquestación modular
  • 2.9 Buenas prácticas en Databricks Workflows
  • Resumen
  • Referencias bibliográficas

Capítulo 3: Construcción de Pipelines con Delta Live Tables

  • Objetivos
  • 3.1 Arquitectura Medallion
  • 3.2 Introducción a Delta Live Tables
  • 3.3 Uso de la interfaz Delta Live Tables UI
  • 3.4 Pipelines con SQL
  • 3.5 Pipelines con Python
  • 3.6 Modos de ejecución de Delta Live Tables
  • 3.7 Resultados del pipeline
  • 3.8 Registros de eventos del pipeline
  • 3.9 Incorporación de nuevos datos (Land New Data)
  • 3.10 Laboratorio: Creación de Pipelines con Delta Live Tables
  • Resumen
  • Referencias bibliográficas

Capítulo 4: Gestión y Gobernanza de Datos con Unity Catalog

  • Objetivos
  • 4.1 Introducción a la gobernanza de datos
  • 4.2 Población del metastore
  • 4.3 Laboratorio: Navegación en el metastore
  • 4.4 Organización y patrones de acceso a los datos
  • 4.5 Actualización de tablas al esquema de Unity Catalog
  • 4.6 Seguridad y administración en Unity Catalog
  • 4.7 Introducción al Databricks Marketplace
  • 4.8 Gestión de privilegios en Unity Catalog
  • 4.9 Control de acceso a los datos
  • 4.10 Control de acceso detallado (Fine-Grained Access Control)
  • 4.11 Laboratorio: Migración y administración de datos en Unity Catalog
  • Resumen
  • Referencias bibliográficas

 

Descargue el temario para conocer el detalle completo de los contenidos.

 

Debido a las constantes actualizaciones de los contenidos de los cursos por parte del fabricante, el contenido de este temario puede variar con respecto al publicado en el sitio oficial, sin embargo, Netec siempre entregará la versión actualizada de éste.

DBRICKS-DE_INT | Data Engineering with Databricks

SKU: NETEC-DBRICKS-DE_INT
bottom of page