[BDN-060] Cassandra
- Pronoide Wiki Web
Este curso cubre desde los fundamentos de Big Data y bases de datos NoSQL hasta la instalación y configuración de Apache Cassandra. Incluye arquitectura de Cassandra, modelo de datos, y uso de herramientas como Cqlsh y nodetool. También aborda conceptos avanzados como consistencia, particionado, y operaciones CRUD mediante CQL.
Duración: 25 horas
Perfil: Avanzado
Dirigido a
Esta formación está dirigida a desarrolladores, arquitectos de sistemas, administradores de Big Data y bases de datos que desean aprender Cassandra.
Requisitos previos
Los alumnos necesitarán tener conocimientos básicos de bases de datos relacionales o NoSQL, sistemas operativos Linux, Java y Hadoop.
Objetivos
- Entender los conceptos clave de Big Data y bases de datos NoSQL.
- Conocer la arquitectura y funcionalidades de Apache Cassandra.
- Aprender a instalar y configurar Cassandra en entornos locales y distribuidos.
- Dominar el uso de herramientas como Cqlsh, nodetool, y Cassandra-Stress.
- Diseñar modelos de datos eficientes y realizar operaciones CRUD con Cassandra Query Language (CQL).
Contenido
- Introducción a Big Data
- Conceptos clave de Big Data
- Introducción a las Bases de Datos NoSQL
- Tipos de bases de datos NoSQL: documentales, clave-valor, gráficas y de columnas
- Comparativa y características principales
- Introducción a Apache Cassandra
- Características y funcionalidades de Cassandra
- Arquitectura y componentes principales
- Instalación de Cassandra
- Requisitos del sistema operativo
- Instalación de Cassandra
- Configuración de un nodo único
- Arranque y parada del servicio
- Herramientas de Cassandra
- Uso de Cqlsh para interactuar con Cassandra
- Pruebas de rendimiento con Cassandra-Stress
- Gestión y monitoreo con nodetool
- Uso de CCM (Cassandra Cluster Manager) para simulaciones locales
- Arquitectura de Cassandra
- Estructura de un clúster de Cassandra
- Nodo coordinador y protocolo Gossip
- Hashing y particionado de datos
- Nodos virtuales y factor de réplica
- Mecanismos como Hinted Handoff y Anti-entropía
- Niveles de consistencia y System Keyspaces
- Gestión de nodos y configuración del protocolo Snitch
- Modelo de Datos en Cassandra
- Diseño de modelos de datos optimizados
- Claves primarias y particionadas
- Diferencias entre datos y metadatos
- Limitaciones del modelo de Cassandra
- Cassandra Query Language (CQL)
- Column Families en CQL
- Creación y manejo de tablas y vistas
- Uso de colecciones (listas, mapas y conjuntos)
- Operaciones CRUD (Create, Read, Update, Delete)
- Ordenación de datos con Clustering Order
- Creación de índices y uso de comandos Batch
- Procesos de Escritura y Lectura en Cassandra
- Flujo de datos durante las escrituras
- Procesamiento de consultas de lectura
- Estrategias de compactación y optimización
Documentación Recomendada
Mastering Apache Cassandra 3.x - Third Edition
By Aaron Ploetz , Tejaswi Malepati , Nishant Neeraj
October 2018 | 348 pages
https://www.packtpub.com/product/mastering-apache-cassandra-3x-third-edition/9781789131499