9 Algunas funciones de pertenencia muy utilizadas (Gp:) 1.0 (Gp:) 0.5 (Gp:) 0.0 (Gp:) 0 (Gp:) 50 (Gp:) 100
10 Algunas funciones de pertenencia muy utilizadas (Gp:) 1.0 (Gp:) 0.5 (Gp:) 0.0 (Gp:) 0 (Gp:) 50 (Gp:) 100
11 Algunas funciones de pertenencia muy utilizadas (Gp:) 1.0 (Gp:) 0.5 (Gp:) 0.0 (Gp:) 0 (Gp:) 50 (Gp:) 100
12 Modificadores (Hedges) Es posible introducir conjuntos difusos por transformación lingüística de uno dado. Algunos de los más frecuentes son: (Gp:) muy A
(Gp:) más_o_menos A
(Gp:) no A
En general, pueden introducirse nuevas clases de cualificadores o modificadores en la forma:
13 Extensión cilíndrica En el caso de que se quiera realizar la composición de dos conjuntos cuyas bases de parámetros sean diferentes, será necesario definir una base de parámetros comunes.
A este proceso se le denomina Extensión Cilíndrica.
Sea una distribución posibilista del conjunto A sobre el parámetro definido por U1, dada por: U1 = { 1, 2, 5 }
Y sea otra distribución posibilista del conjunto B sobre el parámetro definido por U2, tal que: U2 = { 8, 10, 15 }
14 Extensión cilíndrica Se define la extensión cilíndrica de A sobre el producto cartesiano de los parámetros U1 y U2, dado por U3 = U1xU2 como: (Gp:) U2 8 10 15 1 (1,8) (1,10) (1,15) U1 2 (2,8) (2,10) (2,15) 5 (5,8) (5,10) (5,15)
15 Proyección Es el proceso inverso al de Extensión cilíndrica. De él se obtiene una distribución posibilista sobre un conjunto de parámetros inferior de acuerdo con:
donde sup es el valor supremo sobre el parámetro xn. Ejemplo: Sea la distribución posibilista ?A(x,y) dada por:
A = 1.0/(1, 3) + 0.9/(1, 6) + 0.8/(1, 9) 0.7/(5, 3) + 0.6/(5, 6) + 0.5/(5, 9) 0.4/(8, 3) + 0.3/(8, 6) + 0.2/(8, 9)
tiene una proyección sobre Y, ?A´(x), dada por:
A´= 1.0/1 + 0.7/5 + 0.4/8
16 Reglas de Composición Dados los conjuntos A y B, cuyas distribuciones de posibilidad son conocidas se define la distribución de posibilidad de una composición de ambas como:
?A*B(x) = F*(?A(x), ?B(x)) Unión: ?A?B(x) = F?(?A(x), ?B(x)) Intersección: ?A?B(x) = F?(?A(x), ?B(x)) Complemento: ?¬A(x) = F ¬(?A(x)) F?(?A(x), ?B(x)) S-norma F?(?A(x), ?B(x)) T-norma
Normalmente las funciones ?A?B(x), ?A?B(x) y ?¬A(x) serán dependientes de la semántica del conjunto. Sin embargo, se pueden simplificar tales funciones suponiendo que dependen solamente de las distribuciones de los conjuntos A y B por separado.
17 Simplificación 1: Comportamiento monótono Por ejemplo: coches_veloces ? coches Dado que se verifica: A ? A ? B B ? A ? B A ? B ? A A ? B ? B
entonces por la simplificación anterior deben verificarse también: ?A(x) ? ?A?B(x) ?B(x) ? ?A?B(x) ?A?B(x) ? ?A(x) ?A?B(x) ? ?B(x) ?A?B(x) ? max(?A(x), ?B(x)) ?A ? B(x) ? min(?A(x), ?B(x)) Esto implica que deben cumplirse las siguienes restricciones sobre las operaciones de unión e intersección
18 Simplificación 2: Definición del complementario Para definir la distribución del conjunto complementario se asume la siguiente simplificación: Lo que equivale a:
19 Operadores de Zadeh: Zadeh estableció como definición de las leyes de pertenencia a los conjuntos intersección y unión las cotas máximas y mínimas respectivamente de dichos conjuntos: ?A?B(x) ? max(?A(x), ?B(x)) ?A?B(x) ? min(?A(x), ?B(x)) ?A?B(x) = max(?A(x), ?B(x)) ?A?B(x) = min(?A(x), ?B(x)) ?¬A(x) = 1 – ?A(x) Estas definiciones no están exentas de paradojas, por ejemplo: ? A?¬A(x) = max(?A(x), 1 – ?A(x)) ? 1 Un elemento puede no pertenecer del todo a un conjunto y su complementario ? A?¬A(x) = min(?A(x), 1 – ?A(x)) ? 0 Un elemento puede pertenecer a un conjunto y su complementario
20 (Gp:) Uniones difusas (Gp:) Intersecciones difusas (Gp:) Rango
21 Lógica Difusa Se construye a partir de la teoría de conjuntos difusos El grado de verdad o certeza de una proposición p es un valor en el contínuo [0,1]
proposición p: X es A ?p(x) = ?A(x) Para completar el cálculo de proposiciones se definen los conectores AND, OR y NOT
p ? q : (X es A) ? (Y es B) p ? q : (X es A) ? (Y es B) ? p: (X es ? A)
22 Lógica Difusa Para completar el cálculo de proposiciones se definen los conectores AND, OR y NOT
p ? q : (X es A) ? (Y es B) p ? q : (X es A) ? (Y es B) ? p: (X es ? A)
Puede ocurrir que las distribuciones posibilistas ?p y ?q no estén definidas sobre la misma base de parámetros. En ese caso es necesario extender cilíndricamente dichas distribuciones.
Por otro lado debe recordarse que : ?p?q(x) ? max(?p(x), ?q(x)) ?p?q(x) ? min(?p(x), ?q(x))
23 Lógica Difusa En general, definiremos las funciones and(), or() y not() como: ?p?q(x) = or(?p(x), ?q(x)) ?p?q(x) = and(?p(x), ?q(x)) ?¬p(x) = not(?p(x)) En el caso más general: ?p?q(x,y) = or(?p(x), ?q(y)) ?p?q(x,y) = and(?p(x), ?q(y)) Las funciones and(), or() y not() son dependientes de la semántica de las proposiciones o Universo del Discurso. Deben verificar en cualquier caso las siguientes relaciones para ser compatibles con los valores booleanos en el límite de no borrosidad:
24 Lógica Difusa Las funciones and(), or() y not() son dependientes de la semántica de las proposiciones o Universo del Discurso. Deben verificar en cualquier caso las siguientes relaciones para ser compatibles con los valores booleanos en el límite de no borrosidad: or(1, u) = 1 or(0, u) = u and(1, u) = u and(0, u) = 0 not(1) = 0 not(0) = 1 Un conjunto muy amplio de funciones cumplen estas restricciones.
Dos modelos muy empleados son los siguientes Modelo de Zadeh:
or1(u, v) = max(u, v) and1(u, v) = min(u, v) not(u) = 1 – u Modelo Pseudoprobabilístico:
or2(u, v) = u + v – u·v and2(u, v) = u·v not(u) = 1 – u
25 Lógica Booleana A) p ? ? p ? 1 B) p ? ? p ? 0 C) p ? (q ? r) ? (p ? q) ? r D) p ? (q ? r) ? (p ? q) ? r E) p ? (q ? r) ? (p ? q) ? (p ? r) F) p ? (q ? r) ? (p ? q) ? (p ? r) G) ? (p ? q) ? ? p ? ? q H) ? (p ? q) ? ? p ? ? q Modelo de Zadeh or1(u, v) = max(u, v) and1(u, v) = min(u, v) not(u) = 1 – u A) max(u, 1- u) ? 1 B) min(u, 1 – u) ? 0 C) ? D) ? E) ? F) ? G) ? H) ?
26 Lógica Booleana A) p ? ? p ? 1 B) p ? ? p ? 0 C) p ? (q ? r) ? (p ? q) ? r D) p ? (q ? r) ? (p ? q) ? r E) p ? (q ? r) ? (p ? q) ? (p ? r) F) p ? (q ? r) ? (p ? q) ? (p ? r) G) ? (p ? q) ? ? p ? ? q H) ? (p ? q) ? ? p ? ? q Modelo Pseudoprobabilístico or2(u, v) = u + v -u·v and2(u, v) = u·v not(u) = 1 – u A) u + (1- u) – u·(1-u) ? 1 B) u·(1 – u) ? 0 C) ? D) ? E) ? F) ? G) ? H) ?
27 Demostración de la primera ley de Morgan p ? q=max(p,q) p ? q p 1 – p 1 – p p < q q 1 – q 1 – q ?(p? q)=1-max(p,q) ?p ? ?q = min(1-p,1-q) ? (p ? q) ? ? p ? ? q p ? q p+ q – p·q 1 – p – q + p·q (1 – p)(1 – q) = 1 – p – q + p·q ?(p? q) ?p ? ?q
28 Inferencia Difusa La operación de implicación se puede expresar en la forma:
p ? q : si (X es A) entonces (Y es B)
donde A y B son variables lingüísticas definidas como conjuntos difusos sobre los universos de discurso de X e Y respectivamente. Ejemplos: Si la presión es baja entonces el volumen es grande Si el tomate es rojo entonces está maduro Si la velocidad es alta entonces frenar ligeramente
29 Inferencia Difusa El principal problema para establecer un valor de certeza a este operador estriba en definir una interpretación del mismo.
Sea imp() una función que proporciona la certeza en una fórmula con implicación. Veamos posibles interpretaciones:
30 A) Basada en la equivalencia siguiente, válida en el límite booleano p ? q ? ¬ p ? q (Gp:) p q p ? q ¬ p ¬p? q ¬ q p ?¬q ¬(p ?¬q)
T T T F T F F T T F F F F T T F F T T T T F F T F F T T T T F T
De acuerdo con esta interpretación y según los operadores ya definidos:
imp1(u, v) = max(1 – u, v) imp2(u, v) = (1 – u) + v – (1 – u)·v
31 B) Basada en la idea: La certeza del consecuente es superior o igual a la conjunción del antecedente e implicación p ? (p ? q) ? q (modus ponens) B1) min(u, imp(u, v)) ? v
B2) u * imp(u, v)) ? v C) Implicación de Lukasiewicz
imp5(u, v) = min(1 – u + v, 1)
32 Modus Ponens
Empleando alguna de las definiciones anteriores de implicación es posible definir el proceso de inferencia difusa empleando modus ponens.
p ? (p ? q) ? q
Dadas las certezas de un antecedente y la de la implicación, la determinación de la certeza del consecuente se realiza en base a una función generadora del modus ponens que denominaremos mod() La función mod() debe verificar una serie de propiedades, algunas de las cuales son las siguientes: a) mod(u, imp(u, v)) ? v b) mod(1, 1) = 1 c) mod(0, u) = v d) u ? v ? mod(u, w) ? mod(v, w) a) La función mod() tiene como cota superior la certeza del consecuente b) Este es el límite booleano del modus ponens
c) De un antecedente completamente falso puede concluirse cualquier cosa
d) La función mod() debe ser monótona creciente con la certeza del antecedente
33 Funciones generadoras del modus ponens que resultan de las definiciones de la función implicación presentadas anteriormente:
34 Todas estas expresiones son válidas para la realización de inferencia en casos análogos al siguiente:
regla: si (x es A) entonces (y es B) premisa: (x es A)
(y es B) (Gp:) Y también en casos como el siguiente, donde A y A poseen la misma base de parámetros:
regla: si (x es A) entonces (y es B) premisa: (x es A )
(y es B)
(Gp:) regla: si (el coche es viejo) entonces (el coche es ruidoso) premisa: (el coche es bastante viejo)
(el coche es bastante ruidoso)
35 Razonamiento difuso basado en la composición Max-Min Sean A y A conjuntos difusos en X y sea B otro conjunto difuso en Y. Supongamos que la implicación difusa (A ? B) definida sobre X x Y se expresa como: (Gp:) Nótese que esta definición de la implicación no es sino una expresión equivalente a imp3(u, v).
Consideremos la regla, si (x es A) entonces (y es B) y la premisa (x es A )
El conjunto difuso inducido B, se define según hemos visto como
36 1. Una regla con un único antecedente Para este caso la ecuación anterior se transforma en: donde w representa un índice de compatibilidad entre la premisa y el antecedente de la regla. ? x A A ? x w B B
37 si (x es A) y (y es B) entonces (z es C) (x es A ) y (y es B )
(z es C ) 2. Una regla con dos antecedentes Una regla de este tipo puede representarse por una implicación A x B ? C de manera que:
38 donde w1 ? w2 se puede asociar con el grado de satisfacción o intensidad de disparo de la regla
39 ? x A A ? x w1 C C 2. Una regla con dos antecedentes ? x B B w2 min
40 3. Múltiples reglas con múltiples antecedentes La interpretación de múltiples reglas se toma usualmente como la unión de las inferencias difusas obtenidas de cada una de las reglas. (Gp:) hecho: (x es A ) y (y es B ) regla 1: si (x es A1) y (y es B1) entonces (z es C1) regla 2: si (x es A2) y (y es B2) entonces (z es C2)
consecuencia: (Z es C )
Resulta intuitivo observar que del caso anterior C = C1 ? C2
41 ? x A1 A ? x w11 C1 C1 ? x B1 B w12 min ? x A2 A ? x w21 C2 C2 ? x B2 B w22 ? x C max
42 Cuando una regla difusa asume la forma
si (x es A) o (y es B) entonces (z es C)
la intensidad de disparo de la regla (w) viene dada por el máximo de los grados de correspondencia de los antecedentes. Esto es:
donde:
43 Métodos de concentración (Defuzzification) La utilización de reglas de inferencia difusas produce, tras la evaluación, un conjunto difuso para cada variable del modelo:
Ejemplo:
si (x es X) entonces (D es A) si (y es Y) entonces (D es B) si (z es Z) entonces (D es C)
El conjunto resultante D es un conjunto difuso que representa a una cierta variable D a la que normalmente es necesario asignar un valor escalar.
(Gp:) ? (Gp:) x (Gp:) A
? y B ? y C ? y D Valor escalar
44 Métodos de concentración (Defuzzification) ? x menor de maximos media de maximos mayor de maximos centroide Posibles medidas Todos son métodos heurísticos para encontrar el valor que mejor representa o sintetiza la información contenida en el conjunto difuso. Uno de los más empleados:
Centroide:
45 Un caso de estudio:
Control Difuso de una turbina de vapor Introducción: Se pretende controlar la inyección de combustible en una turbina de vapor al objeto de mantener constante la velocidad. La cantidad de combustible que se consume por unidad de tiempo (tasa de consumo) se incrementa o disminuye mediante la apertura o cierre, repectivamente, de la válvula de inyección en función de la temperatura y la presión en la caldera.
46 Se pretende controlar la inyección de combustible en una turbina de vapor al objeto de mantener constante la velocidad. La cantidad de combustible que se consume por unidad de tiempo (tasa de consumo) se incrementa o disminuye mediante la apertura o cierre, repectivamente, de la válvula de inyección en función de la temperatura y la presión en la caldera. Sensor de temperatura Sensor de presión Controlador de la válvula de inyección Planta de la turbina P(t) T(t) Sensores (Gp:) Sensor RPM (Gp:) RPM(t)
I(t) Sensor RPM RPM(t)
47 1. Descomponer cada variable del modelo en un conjunto de regiones difusas (vocabulario de cada variable) 110 220 330 ºC 1 MUY_BAJA BAJA OPTIMA ALTA MUY_ALTA TEMPERATURA
48 10 120 230 Kg/m2 1 MUY_BAJA BAJA OPTIMA ALTA MUY_ALTA PRESIÓN
49 -60 0 60 cm/sg 1 CERRAR_MUCHO (CM) CERRAR (C) DEJAR_IGUAL (OK) ABRIR (A) ABRIR_MUCHO (AM) ACCIONES SOBRE LA VÁLVULA CERRAR_UN_POCO (CP) ABRIR_UN_POCO (AP)
50 2. Sintetizar las reglas de control (base de conocimiento) Por ejemplo:
[R1] Si la temperatura es baja y la presión es muy_baja entonces la acción sobre la válvula es abrir_mucho
[R2] Si la temperatura es baja y la presión es baja entonces la acción sobre la válvula es abrir
[R3] Si la temperatura es baja y la presión es óptima entonces la acción sobre la válvula es dejar_igual
[R4] Si la temperatura es baja y la presión es alta entonces la acción sobre la válvula es cerrar
51 3. El Algoritmo A. Leer los sensores de presión y temperatura B. Hacer ?solución(x) = 0 C. Para todas la reglas cuyos antecedentes no sean nulos
C.1 Obtener el mínimo de todos los predicados conectados por operadores conjuntivos (AND) en el antecedente de la regla. Pcerteza = min(E1, E2, …, En)
C.2 Obtener la certeza de la regla ?control(x) = min( ?regla(x), Pcerteza )
C.3 Asignar el conjunto difuso obtenido en ?control(x) al conjunto solución mediante una operación de máximo (OR) ?solución(x) = max( ?solución(x), ?control(x) )
D. Concentrar ?solución(x) (p.e. obteniendo el centroide) para obtener el valor escalar que requiere la acción de control.
52 Veamos como funciona Supongamos que tras leer los sensores, la presión cae dentro del dominio de los conjuntos difusos OPTIMA y BAJA; y la temperatura se incluye dentro del conjunto difuso BAJA.
Las reglas cuyos antecedentes no son nulos son:
[R2] Si la temperatura es baja y la presión es baja entonces la acción sobre la válvula es abrir
[R3] Si la temperatura es baja y la presión es óptima entonces la acción sobre la válvula es dejar_igual
53 110 220 330 ºC 1 MUY_BAJA BAJA OPTIMA ALTA MUY_ALTA 10 120 230 Kg/m2 1 MUY_BAJA BAJA OPTIMA ALTA MUY_ALTA -60 0 60 cm/sg 1 CERRAR_MUCHO (CM) CERRAR (C) DEJAR_IGUAL (OK) ABRIR (A) ABRIR_MUCHO (AM) CERRAR_UN_POCO (CP) ABRIR_UN_POCO (AP)
54 110 220 330 ºC 1 BAJA 10 120 230 Kg/m2 1 BAJA -60 0 60 cm/sg 1 ABRIR (A) 0.48 0.57 110 220 330 ºC 1 BAJA 10 120 230 Kg/m2 1 OPTIMA -60 0 60 cm/sg 1 DEJAR_IGUAL (OK) Temperatura Presión Acciones de control sobre la vávula -60 0 60 cm/sg 1 DEJAR_IGUAL (OK) Centroide= 23 cm/sg 0.48 0.25
55 Bibliografía.
[Cox-94] E. Cox The Fuzzy Systems Handbook Academic Press, 1994
[Bend-96] E. Bender Mathematical Methods in Artificial Intelligence IEEE Computer Society Press, 1996.
Página anterior | Volver al principio del trabajo | Página siguiente |