BASE DE DATOS MULTIDIMENSIONALES

Description

MAPA MENTAL DE LAS BASES DE DATOS MULTIDIMENCIONALES
Yolanda Eloisa S
Mind Map by Yolanda Eloisa S, updated more than 1 year ago
Yolanda Eloisa S
Created by Yolanda Eloisa S over 9 years ago
1349
0

Resource summary

BASE DE DATOS MULTIDIMENSIONALES
  1. MODELO CONCEPTUAL MULTIDIMENSIONAL
    1. Los datos en un DW se modelan en data cubes (“cubos de datos”), estructuras multidimensionales (hipercubos) cuyas operaciones más comunes son:
      1. Roll up
        1. Drill down
          1. Slice
            1. Dice
              1. Pivotaje o rotación
              2. Compuestos por:
                1. Dimensiones
                  1. Miembros
                    1. Jerarquías
                      1. Hechos
                        1. Medidas
                      2. ESQUEMA Y MODELAMIENTO DE UNA BDM
                        1. BDM ¿?
                          1. BD de estructura basada en dimensiones orientada a consultas complejas y alto rendimiento
                            1. Se utilizan principalmente para crear aplicaciones OLAP
                              1. Su peculiaridad es que por cada dimensión tienen un campo (o columna), y otro campo por cada métrica o hecho
                          2. Esquemas Multidimensionales
                            1. ESQUEMA ESTRELLA
                              1. Compuesta por una tabla central - tabla de hechos. Y un conjunto de tablas organizadas alrededor de esta - tablas de dimensiones.
                                  1. Caracteriticas
                                    1. El centro de la estrella es la tabla de hechos.
                                      1. Los puntos de la estrella son las tablas de dimensiones.
                                        1. Cada esquema esta compuesto por una sola tabla de hechos.
                                    2. ESQUEMA COPO DE NIEVE
                                      1. Variación del esquema estrella donde alguna punta de la estrella se explota en mas tablas.
                                        1. las tablas de dimensión copo de nieve se encuentran normalizadas para eliminar redundancia de datos.
                                          1. Caracteristicas
                                            1. La dimensión esta normalizada.
                                              1. Los distintos niveles se encuentran almacenados en tablas separadas.
                                                1. Se argumenta el ahorro de espacio.
                                        2. ARQUITECTURA MODELO MULTIDIMENSIONAL
                                          1. Las fuentes de información pueden incluir bases de datos relacionales, bases de conocimiento, documentos en distintos formatos (p.ej. XML)
                                            1. Los wrappers (encapsuladores) se encargan de extraer los datos de las distintas fuentes y transmitirlos al data warehouse.
                                              1. Los monitores están en contacto directo con las fuentes de datos para detectar los cambios que se puedan producir en ellas.
                                                1. El integrador es el responsable de filtrar, resumir y unificar la información proveniente de las distintas fuentes.
                                                  1. HYPERCUBO Y SUS OPERACIONES
                                                    1. Los cubos OLAP tienen un número indefinido de dimensiones, razón por la cual también reciben el nombre de hipercubos
                                                      1. Un cubo OLAP contendrá datos de una determinada variable que se desea analizar, proporcionando una vista lógica de los datos provistos por el sistema de información hacia el data warehouse
                                                      2. Operaciones
                                                        1. Operacion de Corte y corte de cubo
                                                          1. permite observar partes o subconjuntos de cubos OLAP
                                                          2. Operaciones Filtrar y Pivotear.
                                                            1. Filtrar  permite realizar una seleccion de los datos dentro de un cubo
                                                              1. Pivotear nos permite visualizar desde cierta perspectiva del cubo
                                                          3. DEFINICION BDM
                                                            1. Almacena sus datos con varias dimensiones, es decir que en vez de un valor, encontramos varios dependiendo de los "ejes" definidos. La información se representa como matrices multidimensionales
                                                              1. VENTAJAS BDM
                                                                1. Tiene acceso a grandes cantidades de informacion
                                                                  1. Analiza las relaciones entre muchos tipos de elementos empresariales
                                                                    1. Involucra grandes datos
                                                                      1. Compra datos agregados a traves de periodos jerarquicos
                                                                        1. Presentan los dtos en diferentes perspectivas
                                                                          1. Involucran calculos complejos entre elementos de datos
                                                                            1. Pueden responder rapidamente a los usuarios
                                                                            2. DESVENTAJAS BDM
                                                                              1. Sus fallas reciden en la imposibilidad de realizar cambios en su estructura
                                                                          2. CUBO MULTIDIMENCIONAL
                                                                            1. Un cubo es una estructura multidimensional que contiene información con fines analíticos
                                                                              1. sus componentes principales son las dimensiones y las medidas.
                                                                                1. Las dimensiones definen la estructura del cubo que se utiliza para segmentar y dividir los datos
                                                                                  1. las medidas proporcionan valores numéricos agregados importantes para el usuario final.
                                                                                2. DEFINICION DE OLAP
                                                                                  1. Procesamiento analítico en línea. Solución utilizada en BI, el objetivo es agilizar la consulta de grandes cantidades de datos.
                                                                                    1. Para ello utiliza los cubos OLAP que contiene datos resumidos en grandes BD o sist. transaccionales OLTP
                                                                                    2. HERRAMIENTAS OLAP
                                                                                      1. presentan al usuario una visión multidimensional de los datos (esquema multidimensional)
                                                                                        1. El usuario formula consultas seleccionando atributos de este esquema multidimensional sin conocer la estructura interna, del almacén de datos
                                                                                          1. Estas herramientas genera la correspondiente consulta y la envía al gestor de consultas del sistema
                                                                                            1. Operadores de refinamiento o manipulación de consultas.
                                                                                              1. DRILL
                                                                                                1. ROLL
                                                                                                  1. SLICE & DICE
                                                                                                    1. PIVOT
                                                                                              2. DEFINICION OLTP
                                                                                                1. Procesamiento de Transacciones En Línea. Tipo de procesamiento que facilita y administra aplicaciones transaccionales, usualmente para entrada de datos y recuperación y procesamiento de transacciones.
                                                                                                2. CARACTERISTICAS DE UN DATA WAREHOUSE
                                                                                                  1. Integrado: deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas.
                                                                                                    1. Temático: Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales.
                                                                                                      1. De tiempo variante (Historico):el tiempo es parte implícita de la información contenida en un datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente.
                                                                                                        1. No Volátil: El almacén de información de un datawarehouse existe para ser leído, pero no modificado.
                                                                                                          1. Contiene metadatos:es decir, datos sobre los datos. Los metadatos permiten saber la procedencia de la información, su periodicidad de refresco, su fiabilidad, forma de cálculo... etc.
                                                                                                            1. Extracción: obtención de información de las distintas fuentes tanto internas como externas.
                                                                                                              1. Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la información.
                                                                                                                1. Carga: organización y actualización de los datos y los metadatos en la base de datos.
                                                                                                                2. ROLAP
                                                                                                                  1. Procesamiento Analítico OnLine Relacional: Es una implementación OLAP que almacena los datos en un motor relacional. Diseñadas para realizar un análisis de los datos a través de modelos de datos multidimensionales, estos modelos no se implementan sobre un sistema multidimensional, sino son de un sistema relacional clásico.
                                                                                                                  2. MOLAP
                                                                                                                    1. Procesamiento Analítico Multidimensional OnLine: Es una implementación de OLAP que almacena los datos en una base de datos multinacional. MOLAP requiere un procesamientos y almacenamiento de la información contenida en un cubo. Almacena estos datos en una matriz de almacenamiento multidimensional optimizada, mas que en una base de datos relacional ( o ROLAP)
                                                                                                                    2. COMPARACION ENTRE MOLAP Y ROLAP
                                                                                                                      1. DATA MINING
                                                                                                                        1. (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos.
                                                                                                                          1. surge para intentar ayudar a comprender el contenido de un repositorio de datos.
                                                                                                                            1. etapas principales:
                                                                                                                              1. Determinación de los objetivos.
                                                                                                                                1. Preprocesamiento de los datos.
                                                                                                                                  1. Determinación del modelo.
                                                                                                                                    1. Análisis de los resultados.
                                                                                                                                  2. YOLANDA SIAS N°10480386
                                                                                                                                    Show full summary Hide full summary

                                                                                                                                    Similar

                                                                                                                                    Novedades en los Sistemas gestores de Bases de Datos (SGBD)
                                                                                                                                    john prieto
                                                                                                                                    BASES DE DATOS REQUERIDA POR SISTEMA COMPUTACIONAL
                                                                                                                                    lucho ibarguen
                                                                                                                                    Repaso 1 Certificación BD MTA
                                                                                                                                    Emilio José Peña López
                                                                                                                                    Seguridad en bases de datos
                                                                                                                                    KATERINE MARCELES
                                                                                                                                    CONVERSION MER -MR (MODELO ENTIDAD RELACION - MODELO RACIONAL)
                                                                                                                                    aydeantonio
                                                                                                                                    base de datos acces
                                                                                                                                    jose alberto antonio sanchez
                                                                                                                                    CONSTRUCCION PASO A PASO (MER) MODELO ENTIDAD RELACION
                                                                                                                                    aydeantonio
                                                                                                                                    Datacenter
                                                                                                                                    proyectoFinla 43GRU
                                                                                                                                    BASE DE DATOS 2DO EXAMEN
                                                                                                                                    JL Px
                                                                                                                                    Final
                                                                                                                                    SenaTest