Comparación de Modelos Basados en Técnicas de Aprendizaje (página 3)

Partes: 1, 2, 3

Para el caso de HC, 451 datos que corresponden a la clase Y=1, estado operativo del sistema, fueron clasificados correctamente y 1 fue clasificado incorrectamente. Los 548 datos que corresponden a la clase Y=0, estado fallado del sistema, fueron clasificados correctamente y ninguno fue clasificado incorrectamente.

	AD		HC
Prueba	Positiva	Negativa	Positiva	Negativa
Hipótesis positiva	432	20	451	1
Hipótesis negativa	20	528	0	548

Tabla 3.3 Matriz de confusión para datos de prueba – Caso conectividad

Medidas de sensibilidad, especificidad y precisión y número de reglas generadas

Utilizando los datos generados en la matriz de confusión para los datos de entrenamiento (Tabla 3.2) y de prueba (Tabla 3.3) se obtienen las siguientes medidas:

*Algoritmo*	AD		HC
	Entrenamiento	Prueba	Entrenamiento	Prueba
Sensibilidad	99.05%	95.58%	100%	99.78%
Especificad	99.24%	96.35%	100%	100%
Precisión	99.15%	96.00%	100%	99.90%
Número de Reglas	4	4	1	6*

* no excluyentes

Tabla 3.4 Medidas sensibilidad, especificidad y precisión – Caso conectividad

Función EAC generada por el AD

El algoritmo de AD produce reglas para ambos estados del sistema operativo y fallado. Las reglas generadas por AD son mutuamente excluyentes, así, la aproximación de la FES se consigue sumando cada una de las reglas que corresponden al estado operativo del sistema. Para la determinación de la EAC se aplica el siguiente procedimiento:

Supongamos la siguiente regla:

(Si X8=1 y X10=1 y X20=1 entonces Sistema =1) genera el siguiente término:

Regla = X8X10X20

Llevando el término a probabilidades se tiene:

E(X8 X10 X20) = E(X8) E(X10) E(X2)

Para el caso de X8

E(X8)= X8P + X8(1-P) = 1 P8 + 0 P8 = P8

Directamente podemos decir que:

P8P10P20

Por consiguiente se tiene:

EAC = P8P10P20 + P3Q7P8P9P12Q15P19Q20P21 + Q7P8Q9P12Q15P19Q20P21 +

Q7P8Q12Q15P17P19Q20P21 + P8P10P13Q15Q19Q20P21 + P8Q10P11P12P13Q15Q19Q20P21 + P7P8Q10P11Q12P13Q15Q19Q20P21 + P8P12Q13P14Q15Q19Q20P21 + P7P8P19Q20Q21 + P1P2P4Q7P8P19Q20Q21 + Q1P2P4P6Q7P8P19Q20Q21 + P1P2P4P8P18Q19Q20Q21 + P1P2Q4P7P8P18Q19Q20Q21 + Q8P15P17P21 + P1P2P4P5Q8P13P15P16P17Q21 + P1P2P4Q8Q13P15P16P17Q21 + P1P2P4Q8P15Q16P17P19Q21 + P1P2P4Q8Q15P17P18 + P1P2P4P5Q8Q15P17Q18P19 + Q1P2P4P6Q8Q15P17P19 + Q1P2P4P6Q8Q15P17Q19P20 + P1P2P4Q8Q17P18 + P1P2P4P5Q8Q17Q18P19 + P1P2Q3P4Q5Q8Q17Q18P19 + Q1P2P4P6Q8Q17P19 + Q1P2P4P6Q8P9P11Q17Q19+ Q1P2P4P6Q8P9Q11P13Q17Q19 + P7P8Q15P19Q20P21 + P1P2P7P8Q9Q10Q12Q15Q19P20 + P2P4Q7P8P9Q10Q12P20Q21 + Q7P8Q10Q12P15Q16P17P20P21 + P7P8Q9Q10P12Q15Q19P20 + Q7P8Q10Q12P15P16P20P21 + P7P8Q9Q10P15Q19P20 + P7P8Q9Q10P19P20 + P7P8P9Q10P20 + Q7P8Q10P11P12P20 + P8P15P17Q20P21 +P8P15P16Q17Q20P21 + P8P14P15Q16Q17Q20P21 + Q7P8Q10Q11P12P14P20P21 + P7P8Q14P15Q16Q17P19Q20P21 + P5Q7P8Q10Q11P12Q14P20P21 + Q7P8P11Q14P15Q16Q17Q20P21

Función de estructura FES generada por el HC

La ejecución de HC genera las reglas de una sola clase:

Para el caso de Y=1, cada producto lógico corresponde a un camino mínimo. Es interesante hacer notar que las 16 reglas extraídas para el estado operativo del sistema, corresponden a caminos mínimos de la red.

Para Y=0, estado fallado del sistema, el algoritmo genera reglas que pueden corresponder a cortes mínimos [32]. En este ejemplo se producen 49 reglas y 41 de ellas corresponden a cortes mínimos.

En ambos casos las reglas generadas por el algoritmo son no excluyentes.

Cada término de la aproximación de la FES(X) representa un camino mínimo desde el nodo origen al nodo destino, como es representada a continuación:

X15 X17 X21+ X7 X8 X19+ X8 X10 X20+ X8 X12 X14 X21+ X7 X8 X9 X20+

X8 X10 X13 X21 + X8 X15 X16 X21+ X8 X11 X12 X20+ X1 X2 X4 X18+

X2 X4 X6 X19+ X7 X8 X9 X13 X21+ X8 X11 X12 X13 X21+ X2 X4 X6 X9 X20+ X1 X2 X4 X5 X19+ X1 X2 X3 X7 X8 X18+ X2 X4 X6 X9 X13 X21

Para obtener la EAC es necesario aplicar un procedimiento adicional que convierte estas expresiones lógicas a productos lógicos excluyentes, utilizando el algoritmo KDH88 [18] y de esta manera, de las 16 reglas no excluyentes extraídas por HC para Y=1, se obtiene 80 productos lógicos mutuamente excluyentes, correspondientes a 80 reglas.

Confiabilidad

Determinada las EAC por ambos algoritmos AD y HC, éstas se usan para evaluar la confiabilidad de la red para diferentes valores ri. La Tabla 3.5 muestra los resultados a partir de la EC y de la EAC, obtenidas por ambos algoritmos y los respectivos errores relativos.

ri	EC	*EAC-AD*	*Error Relativo*	*EAC-HC*	*Error Relativo*
0.7	0.85166	0.83747	1.666%	0.851251	0.048%
0.8	0.95362	0.94559	0.841%	0.953519	0.010%
0.9	0.99407	0.99254	0.154%	0.994074	0.0002%

Tabla 3.5 Confiabilidad de la red obtenida usando EC y EAC – Caso conectividad

2.5.2. Evaluación de capacidad

En el caso de evaluación de capacidad, la red se considera operativa si al menos 100 unidades de flujo pueden ser trasmitidas entre el nodo origen (s) y el nodo destino (t).

El sistema se evalúa considerando que la falla ocurre, cuando el flujo en el nodo destino es menor al requerido.

Al igual que el caso de evaluación de conectividad, la EC se obtuvo usando el software "APACRO" [37], un procedimiento de caminos compuestos y un algoritmo de flujo máximo y cortes mínimos [Anexo B]. En este caso, se producen 43 caminos válidos y la EC esta compuesta por 101 términos.

A través de una muestra aleatoria del espacio de estados, se obtuvo un conjunto de 7500 datos diferentes. Los primeros datos NT=5000, se usan para entrenar al algoritmo que clasifica (AD y HC) y los NE=2500 restantes para probar el modelo generado por ambos algoritmos.

2.5.2.1. Ejecución de los Algoritmos AD y HC para el caso de Evaluación de capacidad

Matriz de confusión para los datos de entrenamiento

La matriz de confusión Tabla 3.6, se obtiene a partir de los datos generados por ambos algoritmos, utilizando los 5000 datos de entrenamiento.

En el caso del algoritmo de AD, 354 datos que corresponden a la clase Y=1, estado operativo del sistema, fueron clasificados correctamente y 8 fueron clasificados incorrectamente. Los 4628 datos que corresponden a la clase Y=0, estado fallado del sistema, fueron clasificados correctamente y 10 no.

Para el caso de HC, 362 datos que corresponden a la clase Y=1, estado operativo del sistema, fueron clasificados correctamente y ninguno fue clasificado incorrectamente. Los 4638 datos que corresponden a la clase Y=0, estado fallado del sistema, fueron clasificados correctamente y ninguno fue clasificado incorrectamente.

	AD		HC
Entrenamiento	Positiva	Negativa	Positiva	Negativa
Hipótesis positiva	354	8	362	0
Hipótesis negativa	10	4628	0	4638

Tabla 3.6 Matriz de confusión para datos de entrenamiento – Caso capacidad

Matriz de confusión para los datos de prueba

La matriz de confusión Tabla 3.7, se genera en ambos algoritmos, utilizando los 2500 datos de prueba.

En el caso del algoritmo de AD, 152 datos que corresponden a la clase Y=1, estado operativo del sistema, fueron clasificados correctamente, 13 fueron clasificados incorrectamente, 2310 datos que corresponden a la clase Y=0, estado fallado del sistema fueron clasificados correctamente, 25 no.

Para el caso de HC, 160 datos que corresponden a la clase Y=1, estado operativo del sistema, fueron clasificados correctamente, 5 fueron clasificados incorrectamente, 2318 datos que corresponden a la clase Y=0, estado fallado del sistema fueron clasificados correctamente y 17 fueron clasificados incorrectamente.

	AD		HC
Prueba	Positiva	Negativa	Positiva	Negativa
Hipótesis positiva	152	13	160	5
Hipótesis negativa	25	2310	17	2318

Tabla 3.7 Matriz de confusión para datos de prueba – Caso capacidad

Medidas de sensibilidad, especificidad y precisión y número de reglas generadas

Utilizando los datos generados en la matriz de confusión para los datos de entrenamiento (Tabla 3.6) y de prueba (Tabla 3.7), se obtienen las siguientes medidas:

*Algoritmo*	AD		HC
	Entrenamiento	Prueba	Entrenamiento	Prueba
Sensibilidad	97.79%	92.12%	100%	96.97%
Especificad	99.78%	98.93%	100%	99.27%
Precisión	99.64%	98.48%	100%	99.12%
Número de Reglas	3	7	2	5*

* no excluyentes

Tabla 3.8 Medidas sensibilidad, especificidad y precisión – Caso capacidad

Función EAC generada por el AD

Para este experimento al igual que el anterior, el algoritmo de AD produce reglas para ambos estados del sistema operativo y fallado. Las reglas de AD en este caso también son excluyentes, por lo tanto la aproximación de la FES se determina directamente sumando cada una de las reglas que corresponden al estado operativo del sistema, y finalmente aplicando el mismo procedimiento explicado en el caso de conectividad se tiene:

EAC = P2 P4 P6 P8 P12 P19 P20 +P1 P2 P4 P6 Q8 P15 P17 Q18 P21 +

Q1 P2 P4 Q6 P8 P17 P19 P20 P21 +P1 P2 P4 Q8 P15 P17 P18 P21 +

Q1 P2 P4 Q6 P7 P8 Q9 P17 P19Q20 P21 +P1 P2 P4 P6 P8 P18 Q19 P20 +

P1 P2 P4 Q6 P8 P10 P18 Q19 P20 +P1 P2 P4 Q6 P8 P9 Q10 P12 P18 Q19 P20 +

P1 P2 P4 P8 P13 P18 Q19 Q20 P21 +P1 P2 P4 P8 Q13 P17 P18 Q19 Q20 P21 +

Q4 P7 P8 P15 P17 P19 Q20 P21 +Q1 P2 P4 P8 P9 P17 P18 Q19 P20 P21 +

Q1 P2 P4 P8 Q9 P13 P17 P18 Q19 P20 P21 +Q4 P7 P8 Q10 Q14 P15 P17 P20 P21 +

Q4 P7 P8 P9Q10P14 P15 P17 Q19 P20 P21+ Q4P7P8Q10 P14P15 P17P19 P20 P21+

P2 P4 P6 P8 P9 P13 Q18 Q19 P20 P21 + Q4 P8 P10 P15 P17 P20 P21 +

Q2 P4 P7 P8 P15 P17 P19 P21 +Q2 P4 P7 P8 P15P17 Q19 P20 P21 +

Q2 P4 Q7 P8 P10 P15 P17 P20 P21 + P1 P2 P4 P5 Q6 Q8 P15 P17 Q18 P19 P21 +

P1 P2 P4 Q5 Q6P7 P8 P15 Q18 P19 + Q2P4 Q7 P8 Q10 P11 P12 P15 P17 P20 P21 +

P2 P4P6 P8 Q10 P15 P19Q20 P21 + P1 P2 P4 P6 P7 P8 P18 P19 Q20 Q21 +

P2 P4 P6 P8 P10 P19 Q20 P21 + P1 P2 P4 Q6 P7 P8 P18 P19 +

P1 P2 P4Q6 Q7 P8 P18 P19 P20 +P1 P2 P4 Q6 Q7 P8 P18 P19 Q20 P21 +

Q1 P2 P4 P6 Q8 P15 P17 P19 P21 +P2 P4 P6 P8 Q10 Q12 P15 P19 P20 P21 +

P1 P2 P4 P5 Q6 P8 P9 Q 18 P19 + P1P2P4P5Q6P8Q9P17Q18 P19 +

P2P4P6P8Q10Q12 P19P20 +P1P2P4P5Q6P8Q9Q11 P14Q17 Q18 P19 +

P2 P4 P6 P7 P8 P10 Q15 P19Q20P21

Función de Estructura generada por el HC

El procedimiento de entrenamiento en HC caso capacidad, para el estado operativo del sistema, se producen 25 términos, de los cuales 21 corresponden a caminos mínimos, mientras el conjunto de reglas generadas para el estado del sistema fallado incluye 39 cortes mínimos.

Al igual que el caso de conectividad el algoritmo no genera las reglas de manera excluyente, la aproximación de la FES(X) se representa a continuación:

FES(X) = X7X8X15X17X19X21+X8X10X15X17X20X21+

X1X2X4X15X17X18X21+X2X4X6X8X10X19X20+

X8X11X12X15X17X20X21 + X1X2X4X8X13X18X21+

X1X2X4X8X10X18X20 + X7X8X9X15X17X20X21+

X2X4X6X15X17X19X21+X1X2X4X7X8X18X19+

X2X4X6X8X10X19X21+X2X4X6X8X9X12X20X21+

X2X4X6X8X11X13X18X21+X2X4X6X9X15X17X20X21+

X1X2X3X4X5X8X12X20+X1X2X4X7X8X9X18X20+

X1X2X4X5X8X16X19X21+X1X2X4X5X8X10X19X20+

X2X4X6X7X8X9X19X21+ X1X2X4X5X15X17X19X21+

X2X4X6X8X9X15X20X21

Está expresión se lleva a la forma mutuamente excluyente y se obtiene la EAC, para ello al igual que el caso anterior es necesario aplicar un procedimiento adicional y de esta manera, de las 25 reglas no excluyentes extraídas por HC para Y=1, se obtiene 69 lógicos correspondientes a 22 mutuamente excluyentes.

Confiabilidad

La siguiente tabla muestra la confiabilidad del sistema, evaluando la EC y la EAC obtenidas por ambos modelos, para distintos valores de ri.

ri	EC	EAC-AD	Error Relativo	EAC-HC	Error Relativo
0.7	0.40433	0.39947	1.20 %	0.40604	-0.42 %
0.8	0.66843	0.65932	1.36 %	0.66883	-0.06 %
0.9	0.90190	0.89821	0.41 %	0.90190	0.00 %

Tabla 3.9 Confiabilidad de la red obtenida usando EC y EAC – Caso capacidad

2.6. Análisis de resultados

Basándonos en los resultados obtenidos en ambos experimentos, se realiza una comparación entre AD y HC y se analizan ciertos aspectos según los siguientes criterios:

La clasificación de los datos de entrenamiento y prueba.
El número de reglas y tipos de reglas generadas.

La clasificación de los datos de entrenamiento y prueba

Para los datos de entrenamiento y prueba, se muestra en la Tabla 3.10 el porcentaje en que se equivoca el modelo generado por ambos algoritmos clasificando los datos.

ü En el caso del algoritmo de AD, los datos de entrenamiento en ambos experimentos no alcanzan el 1% de error y para los datos de prueba, el máximo es el 2%.

ü En el caso de HC, en los datos de entrenamiento, el modelo no se equivoca, siempre hace la clasificación de la manera correcta y para los datos de prueba, el máximo sólo llega al 0.25%.

*Problema*	AD		HC
	Entrenamiento	Prueba	Entrenamiento	Prueba
Continuidad	0.85%	2%	0%	0.05%
Capacidad	0.90%	1.90%	0%	0.25%

Tabla 3.10 Porcentaje de datos mal clasificados

El número de reglas y tipos de reglas generadas

La siguiente tabla muestra el número de reglas generadas por los dos algoritmos comparados en ambos experimentos. Se observa que el AD genera mayor número de reglas que HC.

Problemas

Reglas no excluyentes

Reglas Excluyentes

Continuidad

Capacidad

Tabla 3.11 Reglas generadas

CAPÍTULO 4

Conclusiones

Este trabajo de investigación se basó principalmente en la comparación de dos métodos de generación de reglas, para la obtención de la Expresión Aproximada de Confiabilidad (EAC) de una red. Para tal fin se utilizaron dos algoritmos fundamentados en el aprendizaje automatizado, denominados Árbol de Decisión (AD) y Hamming Clustering (HC).

Los resultados obtenidos en ambos casos fueron los siguientes:

En cuanto a las Reglas:

El AD extrae las reglas en forma excluyente, lo cual permite obtener directamente la aproximación de la FES, que corresponde a la suma de cada una de las reglas generadas por el algoritmo y posteriormente aplicando un procedimiento se obtiene la EAC.

El HC requiere que las reglas generadas sean convertidas a la forma excluyente para obtener la EAC.

De los resultados se puede concluir que para la obtención de la EAC, el método más directo es el AD, debido a que genera directamente reglas excluyentes. El método HC no genera reglas excluyentes, pero proporciona información interesante que puede ser utilizada para propósitos diferentes al de esta investigación en particular, como es el caso de la obtención de caminos mínimos y cortes mínimos de una red.

Datos de Entrenamiento y datos de Prueba:

En cuanto a la clasificación de los datos de entrenamiento y de prueba, ambos algoritmos presentaron muy buenos resultado, en donde AD fue superado por HC.

Con base en los resultados ya expuestos, se deduce que los dos métodos utilizados, tanto Árbol de Decisión (AD) como Hamming Clustering (HC), basados en el aprendizaje de máquinas, aportan resultados confiables para la construcción de una EAC a partir de una pequeña muestra de datos, observándose que las mejores aproximaciones se obtienen con HC, a pesar de que las reglas obtenidas con este método son no excluyentes.

Finalmente se recomienda el uso del algoritmo de "Hamming Clustering" para la obtención de los cortes mínimos de una red, variando el tamaño de muestra de los datos, ya que en el experimento presentado en esta investigación, para el caso de continuidad, con solo 3000 datos de entrenamiento y prueba, se obtuvieron 41 cortes mínimos y para el caso de capacidad a partir de 7500 datos, se obtuvieron 39 cortes mínimos

REFERENCIAS

[1] Joel A. Nachlas, FIABILIDAD. Ingeniería de Sistemas, Primera Edición: Noviembre – 1995. www.uoc.edu/in3/emath/docs/Fiab_1.pdf

[2] Claudio M. Rocco S, Marco Muselli, Empirical Models Based On Machine Learning Techniques for Determining Approximate Reliability Expressions, Reliability Engineering and System Safety, 2004, 83/3, pp 301-307.

[3] M.O. Ball (1986), Computational complexity of network reliability analysis, IEEE Transactions on Reliability., R-35 (3).

www.isr.umd.edu/People/faculty/Ball.html

[4] Jogesh K. Muppala, Ricardo M. Fricks, and Kishor S. Trivedi, Techniques for system dependability evaluation, Department of Computer Science. The Hong Kong University of Science and Technology.

http://shannon.ee.duke.edu/availabilitymodeling/papers.htm

[5] T. C. Hu, M. T. Shing, P. A. Tucker, Minimum Cuts in a Network, School of Engineering, UCSD, La Jolla, CA 92093, 20 Apr 2000.

http://citeseer.ist.psu.edu/168282.html

[6] K. K. Aggarwal, Y. C. Chopra, J. S. Bajwa, Capacity Consideration in Reliability Analysis of Communication Systems, IEEE Trans on Reliability, Vol. 31, No. 2, Jun. 1982

[7] S. Rai, S. Soh, A Computer Approach for Reliability Evaluation of Telecommunication Networks with Heterogeneous Link-Capacities, IEEE Trans on Reliability, Vol. 40, No. 4, Oct. 1991

[8] L. M. Goldschlager, R. A. Shaw and J. Staples. The maximum flow problem for P. Computer Science 21, 105-111, 1982.

http://www.mpi-sb.mpg.de/cgi-bin/author?KKBGoldschlagerxxLMKKE+Goldschlager,-L.-M.

[9] Tongdan Jin & David W. Coit, Network reliability estimates using linear and Quadratic unreliability of minimal cuts.

http://www.rci.rutgers.edu/~coit/pubs.htm

[10] Vitaly G. Schetinin and Anatoly I. Brazhnikov, Diagnostic Rule Extraction Using Neural Networks, Penza State University, 2000. www.dcs.ex.ac.uk/people/vschetin/p3.pdf

[11] Mark Craven & Jude Shavlik, Rule extraction: Where we go from here?, University of Wisconsin Machine Learning Research Group Working Paper 99-1, 1999.

http://citeseer.ist.psu.edu/283343.html

[12] Peter Hamener & Yves Crama, Boolean function Theory, Algorithms, Applications, Chapter 1.

http://www.maths.lse.ac.uk/Personal/martin/cdambflearn.pdf

[13] Lawrence O. Hall, Nitesh Chawla and Kevin W. Bowyer,

Decision tree learning on very large data sets. Department of Computer Science and Engineering, ENB 118, University of South Florida.

http://seraphim.csee.usf.edu/~hall/smc98.pdf

[14] Chris Mayer, Rule Induction Using 1-R and Quinlan"s Tree to Rules Method, CSE 591 – Data Mining, 29 January 2002.

http://www.public.asu.edu/~huanliu/DM02/paper-present.html

[15] Zhi-Hua Zhou, Yuan Jiang and Shi-Fu Chen, Extracting Symbolic Rules from Trained, Neural Network Ensembles, National Laboratory for Novel Software, Technology, Nanjing University, Nanjing.

http://citeseer.ist.psu.edu/503264.html

[16] Tom M. Mitchell, Machine Learning, Carnegie Mellon University, Mc Graw Hill, 1997, Capítulo 3 Decision Tree Learning

[17] Erlendur S Porsteinsson, A Non-linear operators, 2000.

http://www.maximal-usa.com/xmps/html/node9.html

[18] K. D. Heidtmann: Smaller Sums of Disjoint Products by Subproducts Inversion, IEEE Trans on Reliability, Vol. 38, No. 4, Aug. 1989

[19] Nathalie Japkowicz, Supervised versus Unsupervised Binary-Learning, by Feedforward Neural Networks, , Faculty of Computer Science, DalTech/Dalhousie University.

http://citeseer.ist.psu.edu/311444.html

[20] J.M. Portela da Gama, Combining Classification Algorithms, PhD. Thesis, Faculdade de CiÃªncias da Universidade do Porto, 1999.

http://citeseer.ist.psu.edu/246549.html

[21] Vladimir Estival Castro, A first introduction to the world of machine learning. The University of Newcastle, Australia, 2001.

http://www.cit.gu.edu.au/~s2130677/teaching/KDD.d/lect04-new.pdf

[22] Nils J. Nilsson, "Introduction to Machine Learning", Chapter 1, Robotics Laboratory, Department of Computer Science, Stanford University 1996.

http://robotics.stanford.edu/people/nilsson/mlbook.html

[23] Mark W. Craven ,Extracting comprehensible models from trained neural networks, Thesis, chapter 1, University of Wisconsin Madison 1996.

http://www.cs.wisc.edu/~shavlik/abstracts/craven.thesis.abstract.html

[24] Gregorio Hernández Peñalver, Complejidad y Grafos, Facultad de Informática UPM. 2000. http://www.dma.eui.upm.es/MatDis/Seminario2/ComplejGrafos.PDF

[25] M. Muselli, D. Liberati, Hamming Clustering: A New approach to Rule extraction, Genova, Italia

www.ieiit.cnr.it/~muselli/papers/soco99.pdf

[26] Paul Davidsson, Learning Characteristic Decision Trees, Department of Computer Science, Lund University, Box 118, S-221 00 Lund, Sweden http://citeseer.ist.psu.edu/9343.html

[27] Sreerama K. Murthy, Automatic Construction of Decision trees from Data: A Multi-Disciplinary Survey, Siemens Corporate Research, Princeton, NJ 08540, USA

http://www-courses.cs.uiuc.edu/~cs491han/papers/98murthy.pdf

[28] Luís Fernando Raínho, Alves Torgo, Inductive learning of tree-based regression models, Tesis de doctorado, Departamento de Ciencia de Computadores. Faculdade de CiÃªncias da Universidade do Porto, Septiembre

http://citeseer.ist.psu.edu/505941.html

[29] J.R. Quinlan, Programs for machine learning, Morgan Kaufmann Publishers, 1993.

http://www.cse.unsw.edu.au/~quinlan/

[30] K. Mock, Lecture Notes on Machine Learning,

www.math.uaa.alaska.edu/ ~afkjm/

[31] Eduardo Morales, Inducción de Árboles de Decisión TDIDT, http://dns1.mor.itesm.mx/~emorales/Cursos/KDD/node27.html

[32] Jianxiu Hao , James B. Orlin, A faster algorithm for finding the minimum cut in a directed graph, Journal of Algorithms, v.17 n.3, p.424-446, Nov. 1994

www.informatik.uni-trier.de/~ley/db/journals/jal/jal17.html

[33] J. C. Cubero "Árboles de Decisión", 1998,

http://elvex.ugr.es/etexts/spanish/proyecto/cap6.pdf

[34] Lic. Ana María Teresa Lucca , Elementos de lógica y matemática discreta www.ing.unp.edu.ar/asignaturas/elymd

[35] Machine Learning, http://www.cse.unsw.edu.au/~cs9416/ml/trees,

[36] M. Muselli, D. Liberati, Binary Rule Generation via Hamming Clustering, IEEE Transaction on Knowledge and Data Engineering, 2002, pp. 1258-1268

[37] M. Muselli, D. Liberati, Training digital circuits with Hamming Clustering, IEEE Transaction on circuit and Systems: Fundamental Theory and Applications, vol 47, pp. 513-527, 2000

[38] Oswin Aichholzer, 1996. Clustering the hypercube,

http://www.igi.tugraz.at/oaich/publications.html

[39] Occam"s Razor, http://skepdic.com/occam.html

[40] Yoo Y. D., Deo N. "A comparison of algorithm for terminal -Pair reliability", IEEE Transaction on reliability, Vol. 37, No. 2, June 1988.

[41] "APACRO" Software para análisis de confiabilidad en redes. DIOC Facultad de Ingeniería, UCV, Junio 2002.

[42] Exhaustive Search Methods

http://www.rci.rutgers.edu/~cfs/472_html/AI_SEARCH/ExhaustiveSearch.html

[43] The Ford-Fulkerson algorithm,

http://www.isye.gatech.edu/~chayakritc/maximalflow.doc

Anexo A

Búsqueda profunda

Este tipo de búsqueda exhaustiva [42], se denomina búsqueda profunda ya que, previamente a considerar otro camino, el grafo es examinado a profundidad.

Cuando la búsqueda ha alcanzado el nivel mas bajo del grafo y no se ha llegado al nodo destino, entonces, se extiende la búsqueda a otras enlaces del grafo que inicialmente fueron ignoradas. Para realizar esto, se regresa al nivel anterior y se explora cualquier alternativa restante a este nivel, repitiendo este método sucesivamente. Este procedimiento de retroceso repetitivo garantiza que todas las posibilidades sean sistemáticamente y exhaustivamente examinadas.

La búsqueda profunda en un grafo se hace de arriba hacia abajo y de izquierda a derecha.

Primero se examina el nodo origen, luego el nodo izquierdo del nodo origen, posteriormente, el hijo izquierdo del nodo y así sucesivamente, cuando no hay opciones se regresa al nodo anterior del lado derecho y se repite el proceso de nuevo.

Ejemplo

El nodo donde se inicia la búsqueda es etiquetado como (s), una vez posicionado sobre éste se comienza la búsqueda del nodo destino, definido como nodo (t).

1. Se arranca la búsqueda desde el nodo origen (s), tal y como se muestra en la siguiente figura, ubicado sobre éste el siguiente nodo a explorar, es el que se encuentra más a la izquierda y que aún no ha sido explorado.

2. El nodo encontrado es el nodo (1), se evalúa para comprobar si es el nodo destino, si no lo es, se explorara el siguiente nodo que se encuentra más a la izquierda.

3. El nodo encontrado es el nodo (5), se evalúa para comprobar si es el nodo destino, si no lo es, se explorara el siguiente nodo que se encuentra más a la izquierda.

4. El nodo encontrado es el nodo (6), se evalúa para comprobar si es el nodo destino, si no lo es, se explorara el siguiente nodo que se encuentra más a la izquierda, pero ningún nodo es encontrado, éste es marcado y se devuelve al nodo anterior.

5. Ubicados sobre el nodo (5), el siguiente nodo a explorar, es el nodo que se encuentre más a la izquierda, el cual corresponde al nodo (1), pero éste ya ha sido explorado, por lo tanto se va al siguiente nodo que se encuentra más a la izquierda, el cual corresponde al nodo (2)

6. Ubicados sobre el nodo (2), el siguiente nodo a explorar, es el nodo que se encuentre más a la izquierda y que no ha sido explorado, el cual corresponde al nodo (3).

7. Ubicados sobre el nodo (3), el siguiente nodo a explorar, es el nodo que se encuentre más a la izquierda y que no ha sido explorado, el cual corresponde al nodo (4).

8. Ubicados sobre el nodo (4), el siguiente nodo a explorar, es el nodo que se encuentre más a la izquierda y que no ha sido explorado, el cual corresponde al nodo (8).

9. Ubicados sobre el nodo (8), el siguiente nodo a explorar, es el nodo que se encuentre más a la izquierda y que no ha sido explorado, el cual corresponde al nodo (7).

10. Ubicados sobre el nodo (7), el siguiente nodo a explorar, es el nodo que se encuentre más a la izquierda y que no ha sido explorado, nodo (t), el cual corresponde al nodo destino

Anexo B

Flujo Máximo

El problema del flujo máximo [43] consiste en encontrar la capacidad máxima requerida que puede ser transportada desde un nodo origen (s) a un nodo destino (t), tomando en cuenta las restricciones de capacidad de cada enlace.

El Algoritmo de Ford-Fulkerson

Este método depende de tres términos: red residual, camino aumentado y cortes. Estas ideas son esenciales para el teorema de flujo máximo.

Red residual: Dada una red de flujo y su correspondiente flujo, una red residual es aquella por cuyos enlaces pueden admitir más flujo neto del que pueda ser transportado por ellos, en un momento determinado.

Camino aumentado o trayectoria de aumento y cortes: Un camino aumentado p es un camino desde (s) hasta (t) en la red residual. La capacidad residual de p es la máxima cantidad de flujo neto que se puede transportar a lo largo de los enlaces de p. Esta cantidad máxima de flujo neto corresponde al mínimo de las capacidades residuales de los enlaces, sobre este camino.

Secuencia de Pasos:

Seleccione cualquier camino valido desde s a t.
Aplique el método de etiquetado para encontrar un camino aumentado desde (s) a (t). Incremente el flujo entre este camino. Repita el paso 2. Si tal camino aumentado no existe, el flujo actual es el óptimo.

Método de etiquetado

Paso 1

Fije e(s) = +∞ y p(s) = s.

Paso 2

Seleccione un vértice etiquetado X el cual no haya sido considerado.

Si no existe ningún vértice, entonces deténgase, no hay caminos aumentados de (s) a (t).

Paso 3

Para cualquier enlace (X, Y) que vaya a un vértice no etiquetado y, etiquete y con e(Y) = min { e(X), u(X, Y)} y p(Y) = X donde u(X,Y) es la capacidad límite en un enlace de es la capacidad límite del enlace en la red residual.

Ejemplo:

Inicialmente, arranca el flujo en cero. La red residual es la misma que la original.

Paso 1:

Camino aumentado: s – a – d – t

Flujo entre el camino aumentado = min {e(s), e(a), e(d), e(t)} = min{ +∞, 6, 3, 3} = 3

Paso 2:

La red residual y las nuevas etiquetas son:

El camino aumentado es s – b – d – t y el flujo que puede ser enviado entre ese camino es min{+∞, 8, 4, 4} = 4.

Entonces la red residual es:

El camino aumentado es s – b – c – t y el flujo que puede ser enviado entre ese camino es min{+∞, 4, 2, 2} = 2.

Paso 3:

La red residual es:

No se puede etiquetar el nodo t. Esto significa que no hay camino aumentado en la red y de esta manera no podemos incrementar el flujo.

El flujo máximo es = 9

Los enlaces (a,d), (b,d) and (b,c) conforman el corte mínimo con una capacidad de 9 ( = Flujo máximo).

Trabajo de Grado presentado ante la ilustre Universidad Central de Venezuela para optar al Título de Magister Scientiarum en Investigación de Operaciones

Autora: Ing. Sandra Bertaggia

Venezuela, Caracas, Mayo del 2004

Partes: 1, 2, 3

Página anterior

Volver al principio del trabajo

Página siguiente