[BDN-060] Cassandra
Este curso cubre desde los fundamentos de Big Data y bases de datos NoSQL hasta la instalación y configuración de Apache Cassandra. Incluye arquitectura de Cassandra, modelo de datos, y uso de herramientas como Cqlsh y nodetool. También aborda conceptos avanzados como consistencia, particionado, y operaciones CRUD mediante CQL.
Duración: 25 horas
Perfil: Avanzado
Dirigido a
Esta formación está dirigida a desarrolladores, arquitectos de sistemas, administradores de Big Data y bases de datos que desean aprender Cassandra.
Requisitos previos
Los alumnos necesitarán tener conocimientos básicos de bases de datos relacionales o NoSQL, sistemas operativos Linux, Java y Hadoop.
Objetivos
Entender los conceptos clave de Big Data y bases de datos NoSQL.
Conocer la arquitectura y funcionalidades de Apache Cassandra.
Aprender a instalar y configurar Cassandra en entornos locales y distribuidos.
Dominar el uso de herramientas como Cqlsh, nodetool, y Cassandra-Stress.
Diseñar modelos de datos eficientes y realizar operaciones CRUD con Cassandra Query Language (CQL).
Contenido
Introducción a Big Data
Conceptos clave de Big Data
Introducción a las Bases de Datos NoSQL
Tipos de bases de datos NoSQL: documentales, clave-valor, gráficas y de columnas
Comparativa y características principales
Introducción a Apache Cassandra
Características y funcionalidades de Cassandra
Arquitectura y componentes principales
Instalación de Cassandra
Requisitos del sistema operativo
Instalación de Cassandra
Configuración de un nodo único
Arranque y parada del servicio
Herramientas de Cassandra
Uso de Cqlsh para interactuar con Cassandra
Pruebas de rendimiento con Cassandra-Stress
Gestión y monitoreo con nodetool
Uso de CCM (Cassandra Cluster Manager) para simulaciones locales
Arquitectura de Cassandra
Estructura de un clúster de Cassandra
Nodo coordinador y protocolo Gossip
Hashing y particionado de datos
Nodos virtuales y factor de réplica
Mecanismos como Hinted Handoff y Anti-entropía
Niveles de consistencia y System Keyspaces
Gestión de nodos y configuración del protocolo Snitch
Modelo de Datos en Cassandra
Diseño de modelos de datos optimizados
Claves primarias y particionadas
Diferencias entre datos y metadatos
Limitaciones del modelo de Cassandra
Cassandra Query Language (CQL)
Column Families en CQL
Creación y manejo de tablas y vistas
Uso de colecciones (listas, mapas y conjuntos)
Operaciones CRUD (Create, Read, Update, Delete)
Ordenación de datos con Clustering Order
Creación de índices y uso de comandos Batch
Procesos de Escritura y Lectura en Cassandra
Flujo de datos durante las escrituras
Procesamiento de consultas de lectura
Estrategias de compactación y optimización
Documentación Recomendada
Mastering Apache Cassandra 3.x - Third Edition
By Aaron Ploetz , Tejaswi Malepati , Nishant Neeraj
October 2018 | 348 pages
https://www.packtpub.com/product/mastering-apache-cassandra-3x-third-edition/9781789131499