DBRICKS-DE_INT | Data Engineering with Databricks
Este es un curso introductorio que constituye un punto de partida adecuado para aprender Ingeniería de Datos con Databricks.
Objetivos del curso
Este curso prepara a los participantes para presentar el examen de certificación Associate Data Engineer de Databricks y proporciona la base necesaria para avanzar al curso Advanced Data Engineering with Databricks.
Perfil de audiencia
- Profesionales encargados de construir, mantener y optimizar pipelines de datos.
- Analistas con conocimientos de SQL o Python.
- Responsables de diseñar la infraestructura de datos
Prerrequisitos
Experiencia con el entorno de Databricks, conocimientos básicos de Python, experiencia con SQL y Bases de Datos, nociones de flujos ETL/ELT.
Versión de la tecnología
- 1
Esquema del curso
Capítulo 1: Ingesta de Datos con Delta Lake
- Objetivos
- 1.1 Delta Lake y objetos de datos
- 1.2 Configuración y carga de tablas Delta
- 1.3 Transformaciones básicas
- 1.4 Laboratorio: Carga de datos
- 1.5 Limpieza de datos
- 1.6 Transformaciones complejas
- 1.7 Funciones definidas por el usuario en SQL (SQL UDFs)
- 1.8 Funcionalidades avanzadas de Delta Lake
- 1.9 Laboratorio: Manipulación de tablas Delta
- Resumen
- Referencias bibliográficas
Capítulo 2: Despliegue de Cargas de Trabajo con Databricks Workflows
- Objetivos
- 2.1 Introducción a Workflows
- 2.2 Recursos de cómputo para Jobs
- 2.3 Programación de tareas con la interfaz Jobs UI
- 2.4 Laboratorio: Ejecución de flujos de trabajo
- 2.5 Funcionalidades clave de Jobs
- 2.6 Exploración de opciones de programación
- 2.7 Tareas condicionales y recuperación de ejecuciones fallidas
- 2.8 Orquestación modular
- 2.9 Buenas prácticas en Databricks Workflows
- Resumen
- Referencias bibliográficas
Capítulo 3: Construcción de Pipelines con Delta Live Tables
- Objetivos
- 3.1 Arquitectura Medallion
- 3.2 Introducción a Delta Live Tables
- 3.3 Uso de la interfaz Delta Live Tables UI
- 3.4 Pipelines con SQL
- 3.5 Pipelines con Python
- 3.6 Modos de ejecución de Delta Live Tables
- 3.7 Resultados del pipeline
- 3.8 Registros de eventos del pipeline
- 3.9 Incorporación de nuevos datos (Land New Data)
- 3.10 Laboratorio: Creación de Pipelines con Delta Live Tables
- Resumen
- Referencias bibliográficas
Capítulo 4: Gestión y Gobernanza de Datos con Unity Catalog
- Objetivos
- 4.1 Introducción a la gobernanza de datos
- 4.2 Población del metastore
- 4.3 Laboratorio: Navegación en el metastore
- 4.4 Organización y patrones de acceso a los datos
- 4.5 Actualización de tablas al esquema de Unity Catalog
- 4.6 Seguridad y administración en Unity Catalog
- 4.7 Introducción al Databricks Marketplace
- 4.8 Gestión de privilegios en Unity Catalog
- 4.9 Control de acceso a los datos
- 4.10 Control de acceso detallado (Fine-Grained Access Control)
- 4.11 Laboratorio: Migración y administración de datos en Unity Catalog
- Resumen
- Referencias bibliográficas
Descargue el temario para conocer el detalle completo de los contenidos.
Debido a las constantes actualizaciones de los contenidos de los cursos por parte del fabricante, el contenido de este temario puede variar con respecto al publicado en el sitio oficial, sin embargo, Netec siempre entregará la versión actualizada de éste.
DBRICKS-DE_INT | Data Engineering with Databricks
Duración 4 días Versión 1 Temario Descarga aquí ⇩ Fechas Netec Consultar Métodos de entrega 👤 💻