¿Qué es el almacenamiento de datos?
El almacenamiento de datos es el almacenamiento electrónico de una gran cantidad de información por parte de una empresa u organización. El almacenamiento de datos es un componente vital de la inteligencia empresarial que emplea técnicas analíticas sobre datos comerciales.
El concepto de almacenamiento de datos fue introducido en 1988 por los investigadores de IBM Barry Devlin y Paul Murphy. La necesidad de almacenar datos evolucionó a medida que los sistemas informáticos se volvieron más complejos y manejaron cantidades crecientes de datos. Un libro clave sobre el almacenamiento de datos es WH Inmon "Building the Data Warehouse", que se publicó por primera vez en 1990 y se ha reimpreso varias veces desde entonces.
Cómo funciona el almacenamiento de datos
El almacenamiento de datos se utiliza para proporcionar una mayor comprensión del rendimiento de una empresa al comparar los datos consolidados de múltiples fuentes heterogéneas. Un almacén de datos está diseñado para ejecutar consultas y análisis sobre datos históricos derivados de fuentes transaccionales.
Una vez que los datos se han incorporado al almacén, no cambian y no pueden modificarse, ya que un almacén de datos ejecuta análisis de eventos que ya han ocurrido al centrarse en los cambios en los datos a lo largo del tiempo. Los datos almacenados deben almacenarse de manera segura, confiable, fácil de recuperar y fácil de administrar.
Hay ciertos pasos que se toman para crear un almacén de datos. El primer paso es la extracción de datos, que consiste en reunir grandes cantidades de datos de múltiples puntos de origen. Una vez que los datos han sido compilados, pasan por la limpieza de datos, el proceso de peinar los datos en busca de errores y corregir o excluir cualquier error encontrado.
Los datos limpiados se convierten de un formato de base de datos a un formato de almacén. Una vez que se almacena en el almacén, los datos pasan por la clasificación, consolidación, resumen, etc. para que sea más coordinado y más fácil de usar. Con el tiempo, se agregan más datos al almacén a medida que se actualizan las múltiples fuentes de datos.
Para llevar clave
- El almacenamiento de datos es el almacenamiento electrónico de una gran cantidad de información por parte de una empresa u organización. Un almacenamiento de datos está diseñado para ejecutar consultas y análisis sobre datos históricos derivados de fuentes transaccionales para fines de inteligencia empresarial y minería de datos. El almacenamiento de datos se utiliza para proporcionar mayor información sobre el rendimiento de una empresa al comparar datos consolidados de múltiples fuentes heterogéneas.
Consideraciones especiales: minería de datos
Las empresas pueden almacenar datos para su uso en exploración y minería de datos, buscando patrones de información que los ayuden a mejorar sus procesos comerciales. Un buen sistema de almacenamiento de datos también puede facilitar el acceso a los datos de los demás departamentos de una empresa.
Por ejemplo, un almacén de datos podría permitir a una empresa evaluar fácilmente los datos del equipo de ventas y ayudar a tomar decisiones sobre cómo mejorar las ventas o racionalizar el departamento. La empresa podría optar por centrarse en los hábitos de gasto de sus clientes para posicionar mejor sus productos y aumentar las ventas.
Con el almacenamiento de datos, la compañía puede recopilar datos históricos de los gastos de sus clientes en el pasado, por ejemplo, 20 años, y ejecutar análisis de estos datos. La información resultante podría proporcionar información sobre las preferencias de sus consumidores; la hora del día, mes o año con mayores ventas; o cliente con el gasto más alto del año.
El almacenamiento y la administración efectivos de datos también son lo que hace que los procesos, como iniciar reservas de viaje y usar cajeros automáticos sean posibles.
El proceso de minería de datos se divide en cinco pasos:
- Las organizaciones recopilan datos y los cargan en sus almacenes de datos; luego almacenan y administran los datos, ya sea en servidores internos o en la nube. Los analistas de negocios, los equipos de administración y los profesionales de tecnología de la información acceden a los datos y determinan cómo quieren organizarlos. Luego, el software de aplicación clasifica los datos según los resultados del usuario. El usuario final finalmente presenta los datos en un formato fácil de compartir, como un gráfico o una tabla.
Almacenamiento de datos versus bases de datos
Un almacén de datos no es necesariamente el mismo concepto que una base de datos estándar. Una base de datos es un sistema transaccional que está configurado para monitorear y actualizar datos en tiempo real con el fin de tener solo los datos más recientes disponibles. Un almacén de datos está programado para agregar datos estructurados durante un período de tiempo. Por ejemplo, una base de datos solo puede tener la dirección más reciente de un cliente, mientras que un almacén de datos puede tener todas las direcciones en las que el cliente ha vivido durante los últimos 10 años.