[BDN-060] Cassandra

[BDN-060] Cassandra

Este curso cubre desde los fundamentos de Big Data y bases de datos NoSQL hasta la instalación y configuración de Apache Cassandra. Incluye arquitectura de Cassandra, modelo de datos, y uso de herramientas como Cqlsh y nodetool. También aborda conceptos avanzados como consistencia, particionado, y operaciones CRUD mediante CQL.

Duración:                     25 horas

Perfil:                            Avanzado

Dirigido a

Esta formación está dirigida a desarrolladores, arquitectos de sistemas, administradores de Big Data y bases de datos que desean aprender Cassandra.

Requisitos previos 

Los alumnos necesitarán tener conocimientos básicos de bases de datos relacionales o NoSQL, sistemas operativos Linux, Java y Hadoop. 

Objetivos

  • Entender los conceptos clave de Big Data y bases de datos NoSQL.

  • Conocer la arquitectura y funcionalidades de Apache Cassandra.

  • Aprender a instalar y configurar Cassandra en entornos locales y distribuidos.

  • Dominar el uso de herramientas como Cqlsh, nodetool, y Cassandra-Stress.

  • Diseñar modelos de datos eficientes y realizar operaciones CRUD con Cassandra Query Language (CQL).



Contenido

  1. Introducción a Big Data

    1. Conceptos clave de Big Data

  2. Introducción a las Bases de Datos NoSQL

    1. Tipos de bases de datos NoSQL: documentales, clave-valor, gráficas y de columnas

    2. Comparativa y características principales

  3. Introducción a Apache Cassandra

    1. Características y funcionalidades de Cassandra

    2. Arquitectura y componentes principales

  4. Instalación de Cassandra

    1. Requisitos del sistema operativo

    2. Instalación de Cassandra

    3. Configuración de un nodo único

    4. Arranque y parada del servicio

  5. Herramientas de Cassandra

    1. Uso de Cqlsh para interactuar con Cassandra

    2. Pruebas de rendimiento con Cassandra-Stress

    3. Gestión y monitoreo con nodetool

    4. Uso de CCM (Cassandra Cluster Manager) para simulaciones locales

  6. Arquitectura de Cassandra

    1. Estructura de un clúster de Cassandra

    2. Nodo coordinador y protocolo Gossip

    3. Hashing y particionado de datos

    4. Nodos virtuales y factor de réplica

    5. Mecanismos como Hinted Handoff y Anti-entropía

    6. Niveles de consistencia y System Keyspaces

    7. Gestión de nodos y configuración del protocolo Snitch

  7. Modelo de Datos en Cassandra

    1. Diseño de modelos de datos optimizados

    2. Claves primarias y particionadas

    3. Diferencias entre datos y metadatos

    4. Limitaciones del modelo de Cassandra

  8. Cassandra Query Language (CQL)

    1. Column Families en CQL

    2. Creación y manejo de tablas y vistas

    3. Uso de colecciones (listas, mapas y conjuntos)

    4. Operaciones CRUD (Create, Read, Update, Delete)

    5. Ordenación de datos con Clustering Order

    6. Creación de índices y uso de comandos Batch

  9. Procesos de Escritura y Lectura en Cassandra

    1. Flujo de datos durante las escrituras

    2. Procesamiento de consultas de lectura

    3. Estrategias de compactación y optimización



 

Documentación Recomendada

Mastering Apache Cassandra 3.x - Third Edition
By Aaron Ploetz , Tejaswi Malepati , Nishant Neeraj
October 2018 | 348 pages

https://www.packtpub.com/product/mastering-apache-cassandra-3x-third-edition/9781789131499