Data Virtualization: la nueva frontera…

Hay muchas definiciones de Data Virtualization, la que dan fuentes académicas o la que directamente los mismos fabricantes declaran. Podemos resumir que la virtualización de datos es cualquier enfoque de la gestión de datos que permite a una aplicación recuperar y manipular datos sin requerir detalles técnicos sobre los datos, como por ejemplo cómo se formatea en la fuente, o dónde está físicamente ubicada, y puede proporcionar una única vista al cliente de los datos globales.

La virtualización de datos representa un enfoque ágil para la integración de datos. Proporciona al consumidor de datos una capa de abstracción que oculta la mayoría de los aspectos técnicos de cómo y dónde se almacenan, procesan y acceden los datos. Permite acceder a los recursos sin entrar en detalles como:

donde se almacenan los datos,
qué tecnología o plataforma se utiliza para almacenar datos,
qué tecnologías se utilizan para procesar y almacenar datos,
qué interfaces son necesarias para acceder a los datos.

A diferencia del proceso tradicional de extracción, transformación, carga («ETL»), los datos permanecen en su lugar y se da acceso en tiempo real al sistema fuente de los datos. Esto reduce el riesgo de errores de datos, de la carga de trabajo que mueve los datos que nunca se suelen utilizar, y no intenta imponer un único modelo de datos. La tecnología también soporta la escritura de actualizaciones de datos de transacciones a los sistemas, el proceso es bidireccional si el usuario lo quiere así. Para resolver las diferencias en los formatos fuente y consumidor y la semántica, se utilizan diversas técnicas de abstracción y transformación. Este concepto y software es un subconjunto de integración de datos y se utiliza comúnmente en inteligencia de negocio, servicios de datos de arquitectura orientada a servicios, cloud computing, búsqueda empresarial y administración de metadatos.

La virtualización de datos está orientada intrínsecamente a producir una visión rápida y oportuna de múltiples fuentes sin tener que embarcarse en un importante proyecto de datos con una extensa ETL y su almacenamiento en un Data Warehouse clasico. Sin embargo, la virtualización de datos también puede ampliarse y adaptarse para satisfacer los requisitos de almacenamiento de datos tradicional.

Un mercado en alza según Gartner

En la reciente Guía del mercado para la virtualización de datos de Gartner, el gigante de la investigación tecnológica describe detalladamente qué tipo de impacto tendrá la virtualización de datos en la empresa en los próximos años. Gartner proyecta que para el año 2020, el 35% de las organizaciones empresariales implementarán la virtualización de datos de alguna forma.

Al explicar la trayectoria actual del software de virtualización de datos, Gartner declara: «Como parte cada vez más importante de una estrategia integral de integración de datos, la virtualización de datos está atrayendo un renovado interés a medida que las organizaciones reconocen su potencial para una creciente gama de casos de uso. Existen diversas formas en las que la tecnología de virtualización de datos puede añadir valor como parte de las capacidades de integración y uso compartido de datos de la infraestructura de información. La mayoría de estas oportunidades implican aumentar las estructuras de datos físicamente integradas y proporcionar enfoques coherentes orientados a servicios para que las aplicaciones y los servicios empresariales accedan a los datos. Al hacer que los recursos de datos sean útiles, independientemente de cómo se desplieguen o dónde residan, esta tecnología lee los datos «.

Hay quien dice que si “el big data” es el nuevo petróleo la virtualización de datos es la nueva refinería, no sabemos si es cierto lo que sabemos que la DV y los LDW están destinado a ser parte de las inversiones en TI en los próximos años.

Synergo! Apuesta por Querona para la Data Virtualization

Querona simula un almacén de datos virtual emulando SQL Server in modo nativo. Todas las herramientas de presentación de BI reconocen a Querona como una instancia de SQL Server que es un almacén de datos con todos los datos de todos los sistemas fuente ya cargados. Querona soporta tanto el acceso en tiempo real a los sistemas fuente, como también todas las vistas que hacen un “virtual data mart” y puede ser almacenada en caché en una base de datos separada.vComo resultado, Querona reúne fuentes de datos de la nube (Dynamics CRM Online), fuentes de datos locales (bases de datos, Dynamics AX, etc.) y un almacén de datos alojado en la nube.

Características únicas de Querona:

Totalmente compatible con Microsoft SQL Server stack
Centrado en el autoservicio
Soporta ~ 100 tipos de fuentes de datos
Permite una seguridad completa en todas las fuentes de datos (similar a SQL Server, además de seguridad de acceso a filas, enmascaramiento de datos dinámicos, pseudoanonimización transparente)
Expone un clúster HDInsight como un lago de datos virtual compatible con SQL Server con carga de datos en tres clics

Mas info aqui