/
[BDN-060] Cassandra

[BDN-060] Cassandra

Este curso cubre desde los fundamentos de Big Data y bases de datos NoSQL hasta la instalación y configuración de Apache Cassandra. Incluye arquitectura de Cassandra, modelo de datos, y uso de herramientas como Cqlsh y nodetool. También aborda conceptos avanzados como consistencia, particionado, y operaciones CRUD mediante CQL.

Duración:                     25 horas

Perfil:                            Avanzado

Dirigido a

Esta formación está dirigida a desarrolladores, arquitectos de sistemas, administradores de Big Data y bases de datos que desean aprender Cassandra.

Requisitos previos 

Los alumnos necesitarán tener conocimientos básicos de bases de datos relacionales o NoSQL, sistemas operativos Linux, Java y Hadoop. 

Objetivos

  • Entender los conceptos clave de Big Data y bases de datos NoSQL.
  • Conocer la arquitectura y funcionalidades de Apache Cassandra.
  • Aprender a instalar y configurar Cassandra en entornos locales y distribuidos.
  • Dominar el uso de herramientas como Cqlsh, nodetool, y Cassandra-Stress.
  • Diseñar modelos de datos eficientes y realizar operaciones CRUD con Cassandra Query Language (CQL).


Contenido

  1. Introducción a Big Data
    1. Conceptos clave de Big Data
  2. Introducción a las Bases de Datos NoSQL
    1. Tipos de bases de datos NoSQL: documentales, clave-valor, gráficas y de columnas
    2. Comparativa y características principales
  3. Introducción a Apache Cassandra
    1. Características y funcionalidades de Cassandra
    2. Arquitectura y componentes principales
  4. Instalación de Cassandra
    1. Requisitos del sistema operativo
    2. Instalación de Cassandra
    3. Configuración de un nodo único
    4. Arranque y parada del servicio
  5. Herramientas de Cassandra
    1. Uso de Cqlsh para interactuar con Cassandra
    2. Pruebas de rendimiento con Cassandra-Stress
    3. Gestión y monitoreo con nodetool
    4. Uso de CCM (Cassandra Cluster Manager) para simulaciones locales
  6. Arquitectura de Cassandra
    1. Estructura de un clúster de Cassandra
    2. Nodo coordinador y protocolo Gossip
    3. Hashing y particionado de datos
    4. Nodos virtuales y factor de réplica
    5. Mecanismos como Hinted Handoff y Anti-entropía
    6. Niveles de consistencia y System Keyspaces
    7. Gestión de nodos y configuración del protocolo Snitch
  7. Modelo de Datos en Cassandra
    1. Diseño de modelos de datos optimizados
    2. Claves primarias y particionadas
    3. Diferencias entre datos y metadatos
    4. Limitaciones del modelo de Cassandra
  8. Cassandra Query Language (CQL)
    1. Column Families en CQL
    2. Creación y manejo de tablas y vistas
    3. Uso de colecciones (listas, mapas y conjuntos)
    4. Operaciones CRUD (Create, Read, Update, Delete)
    5. Ordenación de datos con Clustering Order
    6. Creación de índices y uso de comandos Batch
  9. Procesos de Escritura y Lectura en Cassandra
    1. Flujo de datos durante las escrituras
    2. Procesamiento de consultas de lectura
    3. Estrategias de compactación y optimización


Documentación Recomendada

Mastering Apache Cassandra 3.x - Third Edition
By Aaron Ploetz , Tejaswi Malepati , Nishant Neeraj
October 2018 | 348 pages

https://www.packtpub.com/product/mastering-apache-cassandra-3x-third-edition/9781789131499

Related pages