- Definición
- Características comunes a sistemas RTBI
- Meta de un sistema RTBI
- Aplicaciones reales
- Arquitecturas RTBI
- Conclusiones
- Referencias
Definición
El concepto de Real Time Business Intelligence (RTBI) [1] se refiere a la capacidad de proporcionar información sobre las operaciones de un negocio tan pronto como éstas ocurran.
Aunque el RTBI está orientado a las operaciones en tiempo real, no significa que no pueda proveer de las funciones clásicas estratégicas y de los Almacenes de Datos. De hecho, soporta ambas perspectivas a la perfección. Por lo que sirve como relevo de éstos, ya que reemplaza el clásico almacén de datos por uno con capacidades de respuesta en tiempo real, y a la integración de aplicaciones empresariales (EAI).
Es muy importante que se decida previamente a su implantación si es realmente lo que necesita la empresa en cuestión. El coste que supone el poner en marcha un sistema RTBI es muy alto y es más que probable que la empresa no necesite de respuestas en tiempo real. Si se puede trabajar correctamente con un sistema que opere con algo menos de rapidez que la de tiempo real, se debería descartar la implantación de un sistema con estas características.
La función principal de cualquier RTBI es la de ofrecer información que pueda servir para mejorar aspectos clave de procesos empresariales así como tomar ventajas tan pronto como los eventos ocurran.
Características comunes a sistemas RTBI
Típicamente, un sistema de Business Intelligence tradicional requieren de unas horas para poner en marcha las acciones que fueron decididas en función de los eventos que se recibieron. Pero esta no es una característica propia de un sistema de Business Intelligence en tiempo real, donde se precisa de una rapidez llevada al extremo del tiempo real. Las acciones a ejecutarse por un sistema BI, deben ser llevadas a cabo en un segundo, o incluso en menos tiempo, y para que eso sea llevado a cabo, es imposible que los almacenes de datos se actualicen cada varias horas.
Por estos motivos, para que un sistema sea RTBI 100% puro, debe estar constantemente actualizado, y eso se logra reduciendo la latencia con la que se accede a la información operacional a un tiempo cercano a los 0 segundos. Generalmente, el tipo de actualización de la información se lleva a cabo mediante el goteo de las transacciones operacionales, tal y como estas se producen, son almacenadas en el almacén y desde ese momento ya son útiles para su uso. Además de la actualización en tiempo real, es conveniente que un sistema de toma de decisiones pueda analizar toda la información según va llegando al almacén a la vez que se genera una decisión de manera rápida y efectiva. A todo esto, se le considera un sistema RTBI.
Meta de un sistema RTBI
Todo sistema RTBI aspira a reducir tanto como sea posible la latencia con la que el sistema procesa las operaciones de negocio hasta que se produce una notificación o acción correctiva del sistema de Business Intelligence en cuestión. En los sistemas RTBI, existen 3 tipos de latencia que son:
Latencia de los datos: tiempo que se necesita para recoger y almacenar la información.
Latencia del análisis: el tiempo empleado en decidir cómo actuar en función de la información recibida.
Latencia de la acción: tiempo usado para realizar la acción decidida por el sistema.
Aplicaciones reales
Existen diversos campos en los que un sistema de RTBI cumple una gran utilidad para el negocio al que va dirigido. Es por ello que cada día se invierte más y más esfuerzos en hacer que dichos sistemas sean lo más rápidos posibles, para permitir ahorrar costes y otros males mayores, debidos a la inacción o la acción fuera de tiempo. Áreas en las que son ampliamente utilizados:
Detección de fraudes
Sistemas de monitorización
Software CRM
Inteligencia operacional
Control de pagos y cobros
Monitoreo de seguridad de datos
Optimización de Call centers
Industrias transportistas
Previsiones de ventas
Gestión de carteras
Arquitecturas RTBI
Existen cuatro grandes familias ampliamente extendidas de sistemas RTBI que son las siguientes:
Basada en eventos: La principal característica de esta rama consiste en emplear técnicas que permiten analizar los eventos sin ser primero almacenados en el almacén de datos. Debido a esto, la capacidad de respuesta suele ser de milisegundos.
Almacenes de datos altamente actualizados: Esta rama de RTBI se basa en realizar una gran cantidad de refrescos de la información que se tiene en los almacenes de datos, de forma que los datos en ellos sean lo más recientes posibles. Típicamente, la latencia de los datos está entre los pocos minutos y no mucho más de un par de horas. No implica un sistema completamente en tiempo real, pero a su favor tiene la mayor sencillez y el menor coste respecto a un sistema en tiempo real puro.
Tecnología sin servidor: recientemente, se ha desarrollado un modelo de sistema RTBI llamado MSSO/SD4E, que permite prescindir del servidor en el que normalmente se almacenaba la información del almacén de datos, así como de servidores intermedios. Esto es así ya que se accede en tiempo real a las fuentes de las que se alimenta el sistema. Además, dichas fuentes de datos pueden ser completamente distintas entre sí, y no deben estar estrictamente en el mismo sitio. Al accederse directamente a la información, el tiempo de latencia es cercano a cero.
Procesos conscientes: el último tipo de sistema RTBI permite que se monitoreen los procesos, que se visualicen las métricas, comparándolas con datos históricos de los almacenes de datos y todo ello en tiempo real. Este tipo se encuentra estrechamente relacionado con el software de monitorización de actividades empresariales (BAM) y con los sistemas de Inteligencia operacional, que es una forma de análisis en tiempo real.
5.1 Arquitectura basada en eventos
Esta arquitectura se centra en ofrecer una rápida respuesta conforme ocurren eventos que pueden precisar de una respuesta por parte de los administradores de una empresa. Este requerimiento surge debido a la necesidad de hoy en día de mantener la rentabilidad y la competitividad en las empresas. Es por ello, que se necesita de un software que pueda monitorizar los cambios y tendencias que indican oportunidades o problemas y que permitan a las personas adecuadas en dichas empresas, tomar una acción para cambiar el rumbo de la misma.
Por todas estas razones, la empresa Gartner, acuñó el término Business Activity Monitoring o simplemente BAM. [2] Los sistemas BAM, funcionan capturando eventos (prefijados de antemano, pudiendo ser de muchos tipos, en función del tipo de empresa o del departamento de la misma) de sistemas operacionales. Para que un sistema de estas características funcione tal y como se espera, es imprescindible que se pueda profundizar en los detalles de las operaciones, así como obtener rápidamente la información de dichos eventos. De lo contrario, esto podría incurrir en problemas de diversa índole para la organización, yendo desde la pérdida de clientes clave o al mal funcionamiento del sistema o parte del mismo, por poner unos ejemplos.
Sin embargo, los sistemas BAM no son un reemplazo de los almacenes de datos, si no que se utilizan conjuntamente con ellos, haciendo cada uno su función. Los almacenes de datos están destinados a guardar información histórica para, posteriormente, realizar análisis sobre dicha información y obtener datos relevantes para la mejora de la actividad empresarial.
1. Arquitectura de un sistema BAM.
Por otro lado, los sistemas BAM, son empleados para proveer de información actualizada y de un conjunto de reglas de negocio que dirijan las acciones a tomar para los eventos de las funciones operativas de las organizaciones (cadenas de suministro, logística, etc). Para que el sistema BAM y el almacén de datos funcione coordinadamente, ambas partes deben estar altamente acopladas entre sí, de forma que el almacén ofrezca información histórica y que el sistema BAM use dicha información en el marco de trabajo del sistema de inteligencia basado en eventos.
Los sistemas BAM son adecuados para aquellas organizaciones y/o empresas que necesitan de información operacional en tiempo real. Algunos ejemplos son:
Servicios financieros: van desde gestión de carteras, comercio sistemático, detección de fraudes, gestión y control de riesgos, márketing de clientes en tiempo real o interactivo y por último, las leyes antiterroristas que existen en diversos países.
Fabricación: previsiones de gestión y envíos, previsiones de ventas, retiradas de productos de un mercado y control de calidad.
Minoristas: análisis en tiempo real de inventarios, promociones y márketing en tiempo real y retiradas de productos.
Las características principales que conforman el funcionamiento de un sistema BAM son las siguientes:
Capturar datos en tiempo real que estén dirigidos por eventos y que se puedan obtener de una amplia variedad de fuentes.
Calcular información temporal mediante la comparación de información a lo largo del tiempo desde flujos de eventos (esta información histórica, podrá ser empleada como umbrales para determinar si realizar o no ciertas acciones).
Desarrollar modelados dinámicos mediante la integración de información contextual y de los eventos al vuelo y producir conjuntos de modelos analíticos. Dichos modelados podrán ser actualizados ellos mismos a través de la continua interacción con el sistema.
Desempeñar reglas de negocio para la creación de umbrales basados en los KPIs y otra información determinante.
Proveer de un sistema que posea de una interfaz clara, sencilla y amigable y que actualice constantemente las métricas de la organización.
5.2 Almacenes de datos altamente actualizados
Un almacén de datos altamente actualizado, no es más que un almacén de dato, aunque con la salvedad de que la información que contiene es ampliada cada vez que la información asociada de sus fuentes sufre una modificación. Es por eso que es de utilidad en el campo del RTBI. Los usos básicos de un almacén de datos son de sobra conocidos, y son:
La reducción de la carga de las bases de datos transaccionales
Simplificación de los datos
Almacenamiento de datos históricos de la empresa en cuestión
Las razones que pueden llevar a una organización a mantener un almacén de datos son varias, entre ellas, la centralización de la información para su acceso desde distintos departamentos de la misma. Y es este motivo el que nos obliga a la actualización de la información en el almacén en tiempo real, ya que es necesario para el buen funcionamiento de la empresa que la información sea correcta y esté al momento en todos los sistemas.
Para lograr este reto es imprescindible que el almacén de datos pueda acceder a las distintas fuentes de información y comprobar los cambios cuando éstos se produzcan para llevar a cabo la actualización del mismo. Para ello existen diversas alternativas, pero la más extendida es la actualización después de una transacción realizada con éxito. Por lo que el sistema supervisará las transacciones que se realizan en las fuentes de datos y modificará el almacén de datos conforme considere necesario, y al ser poca la información a actualizar, los sistemas transaccionales no se resentirán en cuanto a eficiencia. Por supuesto que existe un tiempo de latencia, que irá en función de los requerimiento de la empresa y/o de las características de los sistemas que interactúan en la misma. Típicamente, los refrescos se producen en el rango de los pocos minutos y una hora.
2. Esquema de un almacén de datos altamente actualizado.
5.3 Tecnología sin servidor
Como se ha comentado sobre la tecnología sin servidor orientada al Business Intelligence, el objetivo de la misma es prescindir de los servidores para acceder a los datos directamente desde donde están almacenados. Para ello, se desarrolló una tecnología llamada Multiple Source Single Output / Structured Data for Excel (o MSSO/SD4E), y todo ello siendo posible desde cualquier ordenador con la aplicación de Excel instalada.
Dicha tecnología pretende mostrar las bondades que puede tener Excel, como una herramienta real orientada al Business Intelligence, de forma que tenga la capacidad de manipular y analizar los datos en tiempo real, desde las mismas fuentes, de una forma sencilla y rápida. La escalabilidad es prácticamente ilimitada y el flujo de datos puede controlarse sin problemas además de ser seguro.
MSSO es la arquitectura que se dedica a la obtención de la información desde los distintos orígenes, para posteriormente, y gracias al uso de la aplicación SD4E, se le presente a la aplicación de hojas de cálculo de Microsoft y ésta reconozca dicha información de manera que la pueda procesar sin problemas. Hasta la llegada de esta combinación de aplicaciones, el problema fundamental que tenía Excel como aplicación para RTBI, era la obtención sencilla y fácilmente comprensible por Excel, además de la dificultad en el mantenimiento de la integridad de los datos y la seguridad del acceso a los mismos.
3. Arquitectura MSSO/SD4E
La simplicidad con la que trabaja la tecnología MSSO/SD4E es tal, que permite ahorros enormes para realizar informes, llegando a realizar en horas lo que otras herramientas hacen en días, y en minutos lo que otras en horas. A todas estas funciones, se le añade la posibilidad de incluir siempre que se desee mucha más información de otras fuentes, sin tener la necesidad de pagar para que se realicen dichas modificaciones, ya que la tecnología lo permite de forma completamente natural, pero sobre todo, sencilla.
La corrupción de los datos se evita gracias a la tecnología MSSO DataGuard, que almacena la información de las fuentes sin ninguna alteración, además de marcarla para reconocer de forma sencilla de qué fuente proviene y así mantenerla actualizada. Todas las modificaciones que se produzcan por parte de los usuarios sobre Excel serán seguras y no se transmitirán a las bases de datos, de forma que no habrá corrupción de datos.
En cuanto a la seguridad del acceso a la información, y dada la naturaleza de la tecnología en cuestión, saca partido de la seguridad que poseen las bases de datos y no requiere de ninguna capa de seguridad adicional para evitar accesos no autorizados, ya que los credenciales de seguridad son idénticos. Por no mencionar la carencia de necesidad de introducir capas adicionales de seguridad en servidores intermedios, debido a que los datos son siempre accedidos desde las mismas fuentes.
En resumen, la arquitectura MSSO y sus tecnologías asociadas, hacen una combinación que permite a cualquier usuario con necesidades de Business Intelligence, usar un ambiente tan familiar como lo es Excel, así como completamente seguro y fiable, así como potente y versátil. Gracias también a la cantidad ilimitada de cuadros de mandos completamente personalizables.
5.4 Procesos conscientes
Los sistemas de procesos conscientes o Process-aware Information Systems – PAIS, no están exclusivamente dedicados a los sistemas de Business Intelligence, sino que abarcan mucho más, desde sistemas de control del flujo de trabajo, sistemas de manejo de casos, sistemas de información empresariales, etc.
A grandes rasgos, un sistema PAIS, se dedica a proporcionar soporte a los procesos de negocio y el contexto de la organización que los envuelve, y son la evolución de los sistemas del manejo del flujo de trabajo. Los sistemas PAIS están estrechamente relacionados con los procesos de minería de datos, de hecho, se basan en estos procesos para descubrir nuevos modelos de negocio o para verificar la consistencia de los ya existentes. Esto es debido a que el uso de la minería de datos ha demostrado que existen grandes diferencias entre los modelos ideales usado para configurar los sistemas de negocio y los procesos reales de las empresas. En gran medida, esto ocurre porque no existe un modelo único aplicable a una situación concreta, sino que existen varios completamente válidos.
Tradicionalmente, el software se ha desarrollado de forma que está orientado a realizar un conjunto de tareas, sin embargo, los sistemas PAIS, han sido elaborados para que den soporte a los procesos. Este cambio de punto de vista ofrece una serie de ventajas respecto al antiguo paradigma, y son:
El uso de modelos de proceso explícitos proveen de una forma de comunicación entre personas.
Los sistemas dirigidos por modelos en lugar de por el código tienen menos problemas en cuanto a cambios. Por ejemplo, si un sistema de información está dirigido por modelos de proceso, tan sólo es necesario cambiar los modelos.
La representación explícita de los procesos bajo una organización permite la divulgación automatizada, por tanto podría repercutir en un mejor funcionamiento.
La representación explícita de procesos permite el apoyo a la gestión a nivel de diseño así como a nivel de control.
Es preciso anotar que los sistemas PAIS pueden ser diseñados teniendo en cuenta quién o qué controlará los procesos. Dicho con otras palabras, dependiendo de si el sistema interacciona con personas o bien con dispositivos, el sistema se clasificará en un grupo o en otro. Dichos grupos son:
Procesos Persona a Persona (P2P): las partes que interactúan con los procesos son principalmente humanos. Ejemplos de procesos P2P son: seguimiento de trabajos, gestión de proyectos o herramientas de colaboración. Generalmente en estos procesos los procesos soportados no hacen uso de ninguna tarea automatizada.
Procesos Aplicación a Aplicación (A2A): como su nombre indica, estos procesos son completamente automatizados y dirigidos por máquina. Los procesos de transacciones de sistemas, plataformas EAI y servidores web son comúnmente de este tipo.
Procesos Persona a Aplicación (P2A): este grupo de procesos requieren tanto de máquinas como de gente para su correcto desempeño. Los sistema de flujo de trabajo son de esta categoría, ya que se pretende precisamente que las personas y las aplicaciones trabajen conjuntamente.
4. Distinciones entre diferentes tipos de PAIS.
Para poder realizar esta segmentación entre los distintos tipos, es necesario definir las variables que son analizadas. Se dice que un proceso es unframed, cuando no existe un modelo de proceso asociado al mismo, siendo el caso de los procesos colaborativos soportados por los sistemas colaborativos que no ofrecen la posibilidad de definir modelos de proceso.
Un proceso es ad hoc framed si existe un modelo de proceso definido a priori pero que sólo se ejecuta una vez o unas pocas veces antes de ser eliminado o modificado. El caso que ocupa a esta categoría engloba a los entornos de gestión de proyectos, así como en entornos de computación distribuida.
Un proceso loosely framed, es uno en el cual se ha definido un modelo de proceso y un conjunto de restricciones, tales que el modelo predefinido describe la forma normal de realizar las cosas mientras aunque con ciertas libertades, definiendo unos límites de antemano (las restricciones).
Y finalmente, un proceso tightly framed, es aquel en el que existe un modelo de proceso y no permite modificaciones en el mismo.
Por último, y como ya se adelantó, los procesos de minería de datos son muy útiles para verificar la fiabilidad de los procesos de negocio, ya que parece ser bastante notable la diferencia entre lo que debería ocurrir en un proceso y lo que realmente ocurre. Para ello, es común usar los logs de eventos que producen los sistemas de información y extraer de ellos la información para dicha validación. Esto es gracias a que se supone que es posible discernir a qué actividad y a qué proceso particular se refiere cada uno de los eventos recogidos en los ficheros de log.
Con lo cual, el objetivo de la minería de datos para los sistemas PAIS es monitorizar y mejorar los procesos, y para ellos existen 3 maneras de hacerlo:
Método Discovery: no existe un modelo a priori, por lo que podría ser necesario generarlo a través de los logs usando algoritmos para ello.
Método Conformance: hay un modelo definido y es usado para comprobar que lo que se extrae de los logs es efectivamente lo que debería ocurrir y al revés.
Método Extension: existe un modelo y es ampliado con una nueva perspectiva, ya que el objetivo no es comprobar lo que realizar el método Comformance, sino enriquecer al propio modelo.
Por regla general, los modelos suelen no concordar completamente con lo que ocurre en la realidad, es por eso que se insiste en la utilización de la minería de datos para corroborar el correcto funcionamiento de los procesos. Además, existen múltiples factores que afectan al desarrollo y uso de los sistemas PAIS, como son la dificultad de capturar sin errores las características de las personas que interactúan con dichos sistemas, por nombrar uno de ellos.
Conclusiones
A lo largo de esta investigación se ha pretendido dar a conocer las bondades de los sistemas de Real Time orientados al Business Intelligence, sin embargo no es fácil obtener los problemas que conllevan cada una de las diferentes arquitecturas propuestas por las diversas empresas asociadas. Así pues, y desde un punto de vista completamente subjetivo, vamos a proceder con una comparativa sobre los mismos.
A grandes rasgos, las arquitecturas las podríamos definir como aparece en la siguiente tabla:
Arquitectura | Ventajas | Desventajas |
Basada en eventos |
| Creación de sistema de reglas de negocio Comunicación estrecha con sistema transaccional |
Almacenes altamente actualizados |
| Comunicación constante con sistema transaccional Tiempo de refresco ideal ¿cuál? |
Tecnología sin servidor |
| Limitaciones de Excel Necesidad de envío de gran cantidad de información a la aplicación Excel |
Procesos conscientes |
| Sistema muy personalizado |
Mediante esta comparación de ventajas e inconvenientes, es fácil concluir que no todo es tan sencillo como parecía a simple vista. Es decir, los sistemas RTBI no son fácilmente implementables y por supuesto, tienen problemas que deben ser tenidos en cuenta a la hora de confeccionar el sistema elegido.
Cabe anotar que la elección de una arquitectura no impide la adhesión de ciertas características (sino todas en algunos casos) de otras. Por ejemplo, las arquitecturas basadas en eventos y las de almacenes altamente actualizados, podrían convivir, sin apenas problemas. Aunque puede que fuera necesario independizar ciertos aspectos de las mismas para su correcto desempeño.
Por lo tanto, tenemos ante nosotros el dilema de elegir qué tipo de arquitectura es la adecuada para la empresa a la que vamos a implantar el sistema RTBI. Para tomar tal decisión, habría que obtener una estimación de costes de implantación, y sobre todo, dificultad a la hora de realizar la instalación del mismo. Viendo la tecnología sin servidor, podríamos pensar que es la panacea a nuestros problemas, pues se apoya en una aplicación ampliamente extendida, especialmente por personas relacionadas con el Business Intelligence. Pero por otro lado, tenemos el gran inconveniente que supone utilizar un programa como Excel, y es que aunque se pinte como que es una de las alternativas perfectas, hay que admitir que posee de ciertas limitaciones que no son fáciles de solucionar dado que no es posible modificar su código.
Así pues, finalizamos la conclusión anotando que no existe un sistema perfecto para todo el mundo, porque es imprescindible realizar un correcto informe en el que se muestren todas las variables que afectan dada la implantación de dichos sistemas. Y será sólo después del análisis de tal informe cuándo podrá afirmarse cuál es el sistema que más se adecua para una empresa determinada.
Referencias
Gravic, Inc. http://www.gravic.com/shadowbase/uses/real-timebusinessintelligenceintroduction.html
Arquitectura basada en eventos (BAM): http://www.information-management.com/issues/20040301/8177-1.html
Arquitectura basada en almacenes de datos altamente actualizados: http://www.uintelligence.cl/attachments/1163_5814_sieteestilos.pdf
Tecnología MSSO: http://research.tomsitpro.com/whitepaper760
Procesos conscientes: http://wwwis.win.tue.nl/~wvdaalst/publications/p522.pdf
Real Time Business Intelligence: http://www.gravic.com/shadowbase/uses/realtimebusinessintelligence.html
Autor:
Carlos Alberto Martínez Gadea