Comparación de Modelos Basados en Técnicas de Aprendizaje

Partes: 1, 2, 3

Introducción
Confiabilidad
Algoritmos de aprendizaje automatizado y generación de reglas
Experimentos
Conclusiones
Referencias
Anexos

Título original: Comparación de Modelos Basados en Técnicas de Aprendizaje de Máquinas para la Determinación de Expresiones Aproximadas de Confiabilidad

RESUMEN

El presente trabajo de investigación está orientado a la obtención de expresiones aproximadas de confiabilidad (EAC) a través de dos métodos de generación de reglas, basados en técnicas de aprendizaje de máquinas, a partir de un conjunto de datos tomados de manera aleatoria de una muestra, los cuales están separados en dos grupos, los datos de entrenamiento y los de prueba. El primer grupo se utiliza para entrenar el modelo y obtener un conjunto de reglas, a partir de las cuales se genera la EAC del modelo y el segundo es empleado para evaluarlo.

El primer método de clasificación, es el de Árboles de Decisión representado por una estructura de "nodos" y "hojas", que simbolizan un conjunto de decisiones, donde los datos de entrenamiento se dividen de manera recursiva mediante la utilización de métodos heurísticos. Cada "nodo" comienza con dos ramas correspondiente a dos estados diferentes, mientras que las "hojas" de los nodos definen la "clase" que determina el estado de la red.

El segundo método utilizado es el denominado "Hamming Clustering", que consiste en seleccionar de manera aleatoria, una muestra de un conjunto de datos de entrenamiento en cada iteración para generar un grupo de "clusters" de la misma clase, operativo o fallado, y agruparlos bajo el criterio de la Distancia de "Hamming".

De acuerdo con los criterios de evaluación definidos, podemos concluir, que ambos métodos producen buenas aproximaciones de las expresiones de confiabilidad. Sin embargo se debe resaltar que aunque el método de "Hamming Clustering" supera la aproximación obtenida con respecto a los "Árboles de Decisión", las reglas producidas por este implican la conversión a la forma excluyente. Con el método de "Árboles de Decisión", las reglas obtenidas permiten la construcción directa de la EAC.

INTRODUCCIÓN

El propósito de este trabajo es evaluar la confiabilidad de un sistema [1] a partir de la probabilidad de operación o falla de los elementos que lo conforman. Uno de los métodos utilizados para este fin, es la obtención de la Expresión de Confiabilidad (EC) [4]. Para ello se emplea el Álgebra Booleana [12], la topología del sistema a estudiar y un criterio de operación. Esta combinación permite definir la Función de Estructura (FES) del sistema, a través de una expresión binaria que sintetiza la operación o falla del mismo, en función de los estados de los elementos que lo constituyen. La expresión binaria posteriormente se transforma a una formulación equivalente, denominada suma de productos mutuamente excluyentes que permite, finalmente, la determinación de la EC [2].

La gran mayoría de los algoritmos desarrollados para obtener la EC, suponen que el criterio de operación a ser satisfecho es el de continuidad [6]. Sin embargo, en diversos sistemas reales tales como redes de comunicación o sistemas de distribución (agua, gas, petróleo, entre otros), no basta con el criterio de continuidad y se requieren condiciones adicionales tales como flujo manejado entre el origen y el destino. En estos casos, la determinación de la FES es mucho más complicada.

Los métodos referenciados en la literatura son desde el punto de vista computacional complejos, lo que da origen a que los investigadores desarrollen algoritmos aproximados.

En este trabajo de investigación se desarrolla una aproximación de la Expresión de Confiabilidad (EC) de un sistema, a través del uso de métodos de "Generación de Reglas" basados en técnicas de "Aprendizaje de Máquinas" (AM) [19] [21].

La idea básica es que a partir de un conjunto de datos iniciales denominados conjunto de datos de entrenamiento, se "entrena" a un procedimiento computacional con el objetivo de extraer relaciones, que permitan definir si el sistema está operativo o no. Usualmente estas relaciones se presentan como reglas de la forma if-then, por ejemplo [4]: "Si A está operativo y B está operativo, entonces el sistema está operativo".

Las reglas generadas constituyen una aproximación a la FES que posteriormente pueden ser convertidas a una Expresión Aproximada de Confiabilidad (EAC).

Organización de la tesis

Este trabajo está conformado por cuatro capítulos

1. El primer capítulo contiene conceptos sobre el marco de la investigación, tales como la teoría de confiabilidad, la descripción del proceso de los métodos para la generación de reglas y el aprendizaje automatizado [21].

2. El segundo capítulo describe en detalle los dos métodos a ser comparados. El primer método, es un método clásico dentro del AM y es el denominado "Árbol de Decisión" (AD). El segundo método es el denominado "Hamming Clustering" (HC), un método reciente de generación de reglas, utilizando como criterio de agrupamiento la Distancia de "Hamming", [25]

Partes: 1, 2, 3

Página siguiente