Almacén de datos
En informática, un almacén de datos (DW o DWH, por sus siglas en inglés), también conocido como almacén de datos empresariales (EDW, por sus siglas en inglés), es un sistema utilizado para la elaboración de informes y el análisis de datos, y se considera un componente básico de la inteligencia empresarial[1]. Los almacenes de datos son depósitos centrales de datos integrados procedentes de una o varias fuentes dispares. Almacenan datos actuales e históricos en un único lugar[2] que se utilizan para crear informes analíticos para los trabajadores de toda la empresa[3]. Esto es beneficioso para las empresas, ya que les permite interrogar y extraer información de sus datos y tomar decisiones[4].
Los datos almacenados en el almacén se cargan desde los sistemas operativos (como los de marketing o ventas). Los datos pueden pasar por un almacén de datos operativos y pueden requerir una limpieza de datos[2] para realizar operaciones adicionales que garanticen la calidad de los datos antes de que se utilicen en el almacén de datos para la elaboración de informes.
El típico almacén de datos basado en extracción, transformación y carga (ETL)[5] utiliza capas de preparación, integración de datos y acceso para albergar sus funciones clave. La capa de preparación o base de datos de preparación almacena los datos en bruto extraídos de cada uno de los sistemas de datos de origen dispares. La capa de integración integra los conjuntos de datos dispares transformando los datos de la capa de preparación, y a menudo almacena estos datos transformados en una base de datos de almacenamiento de datos operativos (ODS). A continuación, los datos integrados se trasladan a otra base de datos, a menudo denominada base de datos del almacén de datos, donde los datos se organizan en grupos jerárquicos, a menudo denominados dimensiones, y en hechos y hechos agregados. La combinación de hechos y dimensiones se denomina a veces esquema en estrella. La capa de acceso ayuda a los usuarios a recuperar los datos[6].
Arquitectura de almacén de datos de 3 niveles
Cuando los almacenes de datos aparecieron en escena a finales de los años 80, su objetivo era facilitar el flujo de datos desde los sistemas operativos a los sistemas de apoyo a la toma de decisiones (DSS). Estos primeros almacenes de datos requerían una enorme redundancia. La mayoría de las organizaciones contaban con múltiples entornos DSS que daban servicio a sus distintos usuarios. Aunque los entornos DSS utilizaban muchos de los mismos datos, la recopilación, limpieza e integración de los datos a menudo se replicaba para cada entorno.
A medida que los almacenes de datos se hicieron más eficientes, evolucionaron de almacenes de información que daban soporte a las plataformas de BI tradicionales a amplias infraestructuras de análisis que dan soporte a una gran variedad de aplicaciones, como el análisis operativo y la gestión del rendimiento.
Cada uno de estos cinco pasos ha requerido una variedad cada vez mayor de conjuntos de datos. Los tres últimos pasos, en particular, crean el imperativo de una gama aún más amplia de datos y capacidades analíticas.
Hoy en día, la IA y el aprendizaje automático están transformando casi todos los sectores, servicios y activos empresariales, y los almacenes de datos no son una excepción. La expansión del big data y la aplicación de nuevas tecnologías digitales están impulsando el cambio en los requisitos y capacidades de los almacenes de datos.
Sistemas de almacén de datos: arquitectura, desarrollo
Ventajas del almacenamiento de datosUn almacén de datos bien diseñado es la base del éxito de cualquier programa de BI o análisis. Su función principal es alimentar los informes, cuadros de mando y herramientas analíticas que se han convertido en indispensables para las empresas de hoy en día. Un almacén de datos proporciona la información para sus decisiones basadas en datos – y le ayuda a tomar la decisión correcta en todo, desde el desarrollo de nuevos productos a los niveles de inventario. Las ventajas de un almacén de datos son muchas. He aquí algunas de ellas: Captura de pantalla de un almacén de datos que muestra el linaje de los datos.
¿Qué puede almacenar un almacén de datos? Cuando los almacenes de datos empezaron a popularizarse a finales de los 80, se diseñaron para guardar información sobre personas, productos y transacciones. Estos datos, denominados datos estructurados, se organizaban y formateaban para facilitar el acceso. Sin embargo, las empresas pronto quisieron almacenar, recuperar y analizar datos no estructurados, como documentos, imágenes, vídeos, correos electrónicos, publicaciones en redes sociales y datos sin procesar procedentes de sensores de máquinas. Un almacén de datos moderno puede albergar tanto datos estructurados como no estructurados. Al fusionar estos tipos de datos y romper los silos entre ambos, las empresas pueden obtener una imagen completa y exhaustiva de los datos más valiosos.
Qué es un almacén de datos
El almacenamiento de datos implica la construcción e integración de datos procedentes de diferentes fuentes y, en consecuencia, la consulta y otros análisis de datos. El almacenamiento de datos se ha convertido en un aspecto importante para que todas las empresas y nuevas empresas puedan tratar sus datos de forma eficaz y, al mismo tiempo, garantizar que permanezcan seguros y libres de infiltraciones. El diseño de Data Warehouse es esencial para comprender los componentes subyacentes y el funcionamiento de un Data Warehouse. La integración del procesamiento de consultas con los Almacenes de Datos depende en gran medida de su arquitectura y funcionalidad de diseño.
En este artículo, explorará los diferentes componentes de funcionamiento de la Arquitectura del Almacén de Datos, el Diseño del Almacén de Datos, los tipos de Almacenes de Datos y las características de diseño típicas para comprender el funcionamiento completo de los Almacenes de Datos.
La Arquitectura del Almacén de Datos puede entenderse como una estructura de tres niveles con funcionalidades interconectadas. Cada capa o nivel cumple una función diferente e integra distintas herramientas/operaciones con el sistema de Almacén de Datos. Los componentes primarios de la Arquitectura de Almacén de Datos pueden entenderse como sigue:
Relacionados

Soy Romuald Fons, en mi viaje a Peru descubri FluyezCambios y desde entonces soy redactor jefe de la seccion de Posicionamiento Web. Gracias por leer mis excelentes posts sobre FluyezCambios. Saludos y hasta otra.