Comportamiento bajo incertidumbre Casi nunca se puede afirmar que las proposiciones son ciertas o falsas. En la práctica, los programas tienen que saber actuar en situaciones de incertidumbre: usando una teoría del mundo simple pero errónea, que no tiene en cuenta la incertidumbre y que funciona la mayoría de las veces; manejando el conocimiento incierto y la utilidad de manera racional: Lo correcto a realizar (la decisión racional) depende tanto de la importancia relativa de los distintos objetivos como de la verosimilitud y el grado con el cual se conseguirán.
Manipulación del conocimiento incierto Ejemplo de regla para diagnóstico usando lógica de predicados de primer orden: ?p Síntoma(p, Dolor-de-muelas) ? Enfermedad(p, Caries) Esta regla es errónea. Para hacerla cierta, hay que añadir una lista de causas: ?p Síntoma(p, Dolor-de-muelas) ? Enfermedad(p, Caries) ? Enfermedad(p, Dolor-de-muelas) ? Enfermedad(p, Absceso)…
Manipulación del conocimiento incierto Usar la lógica de predicados de primer orden en un dominio como el diagnóstico falla por tres razones principales: Pereza: poner en una lista el conjunto completo de antecedentes y consecuentes que se necesitan para asegurar una regla sin excepciones tiene demasiado trabajo. Ignorancia teórica: la ciencia no tiene una teoría completa para el dominio. Ignorancia práctica: incluso si se conocen todas las reglas, pudiera haber incertidumbre sobre un paciente particular, ya sea porque no se hayan realizado todos los chequeos necesarios o porque no puedan realizarse.
Manipulación del conocimiento incierto En dominios sentenciosos, el conocimiento de un agente proporciona sólo un grado de creencia en las oraciones. La herramienta para tratar con grados de creencia es la teoría de la probabilidad, que asigna a cada oración un grado numérico entre 0 y 1. La probabilidad proporciona una manera de resumir la incertidumbre que se deriva de nuestra pereza e ignorancia.
Manipulación del conocimiento incierto La creencia puede provenir de datos estadísticos o de reglas generales o de una combinación de fuentes de indicios. Asignar probabilidad 0 a una oración determinada corresponde a una creencia inequívoca de que la oración es falsa. Asignar una probabilidad de 1 corresponde a una creencia rotunda de que la oración es cierta. Las probabilidades entre 0 y 1 corresponden a grados intermedios de creencia en la veracidad de la oración.
Manipulación del conocimiento incierto La oración en sí misma es de hecho o verdadera o falsa. El grado de creencia es diferente del grado de veracidad. Una probabilidad de 0.8 no significa “80% verdadero” sino una expectativa muy fuerte (del 80%) de que algo sea verdadero. La teoría de la probabilidad cumple la misma obligación ontológica que la lógica: los hechos del mundo o son verdaderos o no. Los grados de veracidad son la materia de la lógica borrosa.
Manipulación del conocimiento incierto En lógica, una oración tal como “El paciente tiene una caries” es verdadera o falsa. En teoría de la probabilidad, la oración “La probabilidad de que el paciente tiene una caries es 0.8” hace referencia a creencias de un agente, no directamente al mundo. Estas creencias dependen de las percepciones que el agente ha recibido hasta el momento. Estas percepciones constituyen la evidencia sobre la que se basan las probabilidades. Por ejemplo: Un agente saca una carta de un mazo barajado. Antes de mirar la carta, el agente asignaría una probabilidad de 1/52 de que se trata del as de picas. Después de mirar la carta, la probabilidad para la misma proposición debería ser 0 o 1.
Manipulación del conocimiento incierto Asignar una probabilidad a una proposición es análogo a decir si una oración lógica determinada está producida por una base de conocimiento, más que si es o no cierta. Todas las oraciones deben así indicar la evidencia con respecto a la cual se está calculando la probabilidad. Cuando un agente recibe nuevas percepciones/evidencias, sus valoraciones de probabilidad se actualizan. Antes de que la evidencia se obtenga, se habla de probabilidad a priori o incondicional. Después de obtener la evidencia, se habla de probabilidad a posteriori o condicional.
Notación básica con probabilidades Proposiciones Los grados de creencia se aplican siempre a las proposiciones, afirmaciones de que tal o cual es el caso. El elemento básico del lenguaje es la variable aleatoria, que puede pensarse como algo que se refiere a una “parte” del mundo cuyo estado es desconocido inicialmente. Por ejemplo, Caries podría referirse a si mi muela del juicio inferior izquierda tiene una caries. Cada variable aleatoria tiene un dominio de posibles valores que puede tomar. 9
Proposiciones Como con las variables PSR, las variables aleatorias (VAs) están típicamente divididas en tres clases, dependiendo del tipo de dominio: Las VAs booleanas, tal como Caries, tienen el dominio . Las VAs discretas, que incluyen las VAs booleanas como un caso especial, toman valores en un dominio contable. Las VAs continuas toman sus valores de los números reales. 10
Sucesos atómicos Un suceso atómico es una especificación completa del estado del mundo. Es la asignación de valores particulares de todas las variables que componen el mundo. Ejemplo: Si mi mundo consta sólo de las variables booleanas Caries y Dolor-de-muelas, entonces hay exactamente cuatro sucesos atómicos. La proposición “Caries = falso ? Dolor-de-muelas = cierto” es uno de tales sucesos. 11
Probabilidad a priori La probabilidad a priori o incondicional asociada a una proposición a es el grado de creencia que se le otorga en ausencia de cualquier otra información. Se escribe como P(a). Ejemplo: P(Caries = cierto) = 0.1 o P(caries) = 0.1 12
Probabilidad a priori Para hablar de las probabilidades de todos los valores posibles de una VA: Usaremos una expresión como P(Tiempo), que denota un vector de valores que corresponden a las probabilidades de cada estado individual del tiempo. (El dominio de Tiempo es .) P(Tiempo) = <0.7, 0.2, 0.08, 0.02> (normalizado, con suma 1) Esta expresión define una distribución de probabilidad a priori para la VA Tiempo. 13
14 Probabilidad a priori Expresiones como P(Tiempo, Caries) se usan para indicar las probabilidades de todas las combinaciones de los valores de un conjunto de VAs. En este caso se hablaría de distribución de probabilidad conjunta de Tiempo y Caries.
La distribución de probabilidad conjunta para un conjunto de VAs proporciona la probabilidad de casa suceso atómico que involucre esas VAs.
P(Tiempo, Caries) = una matriz 4 × 2 de valores de probabilidad: Probabilidad a priori (Gp:) Tiempo = (Gp:) soleado (Gp:) lluvioso (Gp:) nuboso (Gp:) nevado (Gp:) Caries = cierto (Gp:) 0.144 (Gp:) 0.02 (Gp:) 0.016 (Gp:) 0.02 (Gp:) Caries = falso (Gp:) 0.576 (Gp:) 0.08 (Gp:) 0.064 (Gp:) 0.08
Probabilidad a priori Una distribución de probabilidad conjunta que considere el conjunto completo de VAs que se utilicen para describir el mundo se llama distribución de probabilidad conjunta completa. Por ejemplo, si el mundo consta exactamente de las variables Caries, Dolor-de-muelas y Tiempo, entonces: P(Caries, Dolor-de-muelas, Tiempo) 16
Página siguiente |