¿Qué es el análisis de datos en tiempo real?
El análisis de datos en tiempo real se basa normalmente en la ingesta y el procesamiento de una secuencia de datos que se compone de una serie perpetua de datos, relacionados normalmente con eventos puntuales específicos. Por ejemplo, un flujo de datos puede contener detalles de los mensajes enviados a un sitio de micro-blogging de redes sociales o una serie de medidas medioambientales que registra un sensor meteorológico conectado a Internet.
Los datos de la secuencia se pueden usar para crear visualizaciones en tiempo real de los datos con fines de supervisión o para desencadenar acciones automatizadas si se producen determinadas condiciones. Por ejemplo, un flujo de datos de un sensor de control ambiental en un edificio de oficinas podría permitir que los sistemas de calefacción y aire acondicionado se controlen dinámicamente para optimizar la comodidad y el costo. Los datos también se pueden conservar en un almacén de datos y consultarlos más adelante, lo que permite a los analistas comprender mejor los cambios a lo largo del tiempo. Por ejemplo, una organización de marketing puede realizar análisis de sentimiento en mensajes de redes sociales para ver si una campaña publicitaria tiene como resultado comentarios más positivos sobre la empresa o sus productos, o bien una empresa agrícola podría supervisar las tendencias de temperatura y lluvia para optimizar el riego y la cosecha de cultivos.
Entre los objetivos comunes para el análisis en tiempo real se incluyen los objetivos comunes de análisis en tiempo real
- Analizar continuamente los datos para notificar problemas o tendencias.
- Describir el comportamiento del componente o del sistema bajo varias condiciones para ayudar a planear futuras mejoras.
- Desencadenar acciones o alertas específicas cuando se producen determinados eventos o se superan ciertos umbrales.
Características de las soluciones de análisis de datos en tiempo real
Las soluciones de procesamiento de flujos para el análisis de datos en tiempo real suelen mostrar las siguientes características:
- Un flujo de datos no tiene límites: los datos se añaden a la secuencia perpetuamente.
- Los registros de datos en el flujo normalmente incluyen datos temporales (basados en el tiempo) que indican el momento en que ocurrió (o se registró) el evento al que se refiere el registro.
- La agregación de datos de flujo se realiza con frecuencia en ventanas temporales: por ejemplo, registrando el número de publicaciones en redes sociales por minuto o la media de precipitaciones por hora.
- Los resultados del procesamiento de datos de streaming se pueden usar para admitir la automatización o visualización en tiempo real (o casi en tiempo real), o bien se conservan en un almacén analítico a fin de combinarse con otros datos para el análisis histórico. Muchas soluciones combinan estos enfoques para admitir los análisis históricos y en tiempo real.
Las funcionalidades de inteligencia en tiempo real de Microsoft Fabric le permiten implementar soluciones de análisis en tiempo real que incluyen las características descritas aquí con un esfuerzo mínimo de codificación (o sin) e integración en el resto del ecosistema de Microsoft Fabric.