1 ¿Qué es aprendizaje? (visión genérica, Mitchell 1997) es mejorar el comportamiento a partir de la experiencia. Aprendizaje = Inteligencia. (visión más estática) es la identificación de patrones, de regularidades, existentes en la evidencia. (visión externa) es la predicción de observaciones futuras con plausibilidad. (visión teórico-informacional, Solomonoff 1966) es eliminación de redundancia = compresión de información. El Problema de la Extracción Automática de Conocimiento La minería de datos no es más que un caso especial de aprendizaje computacional inductivo. Aprendizaje Inductivo: razonamiento hipotético de casos particulares a casos generales.
2 ¿Cómo se validan/descartan las hipótesis para conformar el conocimiento adquirido?
Principio (‘escándalo’) de la Inducción: las hipótesis pueden ser refutadas, pero nunca confirmadas.
Y para las que todavía no han sido refutadas, ¿cuál elegimos? Necesidad de criterios de selección: simplicidad, refuerzo, … Existencia de métodos de validación: estadísticos, cross-validation, informacionales, …
¿Cuánto afecta a la plausibilidad el número de ejemplos? ¿Cómo afecta la presencia de ruido? El Problema de la Extracción Automática de Conocimiento
3 Taxonomía de Técnicas de DM Clasificación de las técnicas de aprendizaje: Interpolación: una función continua sobre varias dimensiones Predicción secuencial: las observaciones están ordenadas secuencialmente. Se predice el siguiente valor de la secuencia. Caso particular de interpol. con 2 dim., una discreta y regular. Aprendizaje supervisado: cada observación incluye un valor de la clase a la que corresponde. Se aprende un clasificador. Caso particular de interpolación: la clase (imag. función) es discreta. Aprendizaje no supervisado: el conjunto de observaciones no tienen clases asociadas. El objetivo es detectar regularidades en los datos de cualquier tipo: agrupaciones, contornos, asociaciones, valores anómalos. Abducción o Aprendizaje Analítico: El contexto B es muy importante. El objetivo es explicar la evidencia respecto a B. Predictivos Descriptivos Explicativos Inductivos Abductivos Cualquier problema de aprendizaje inductivo se puede presentar (más o menos directamente) de cualquiera de estas cuatro formas.
4 Ejemplos: Interpolación:
Predicción secuencial: 1, 2, 3, 5, 7, 11, 13, 17, 19, … ? Aprendizaje supervisado: 1 3 -> 4. 3 5 -> 8. 4 2 -> ? 7 2 -> 9. Segmentación (Aprendizaje no supervisado):
¿Cuántos grupos hay? ¿Qué grupos formo?
Predictivos Descriptivos Taxonomía de Técnicas de DM f(2.2)=? ? Análisis Exploratorio: Correlaciones, Asociaciones y Dependencia
5 PREDICTIVO: Interpolación y Predicción Secuencial. Generalmente las mismas técnicas: Datos continuos (reales): Regresión Lineal: Regresión lineal global (clásica). Regresión lineal ponderada localmente. Regresión No Lineal: logarítmica, pick & mix, … Datos discretos: No hay técnicas específicas: se suelen utilizar técnicas de algoritmos genéticos o algoritmos de enumeración refinados.
Taxonomía de Técnicas de DM
6 PREDICTIVO: Aprendizaje supervisado. Dependiendo de si se estima una función o una correspondencia: clasificación: se estima una función (las clases son disjuntas). categorización: se estima una correspondencia (las clases pueden solapar).
Dependiendo del número y tipo de clases: clase discreta: se conoce como “clasificación”. Ejemplo: determinar el grupo sanguíneo a partir de los grupos sanguíneos de los padres. si sólo tiene dos valores (V y F) se conoce como “concept learning”. Ejemplo: Determinar si un compuesto químico es cancerígeno.
clase continua o discreta ordenada: se conoce como “estimación” (o también “regresión”). Ejemplo: estimar el número de hijos de una familia a partir de otros ejemplos de familias. Taxonomía de Técnicas de DM
7 PREDICTIVO: Aprendizaje supervisado (Clasificación).
Técnicas: k-NN (Nearest Neighbor). k-means (competitive learning). Perceptron Learning. Multilayer ANN methods (e.g. backpropagation). Radial Basis Functions. Decision Tree Learning (e.g. ID3, C4.5, CART). Bayes Classifiers. Center Splitting Methods. Rules (CN2) Pseudo-relational: Supercharging, Pick-and-Mix. Relational: ILP, IFLP, SCIL. Taxonomía de Técnicas de DM Similarity-Based Fence and Fill
8 DESCRIPTIVO: Análisis Exploratorio
Técnicas: Estudios correlacionales Asociaciones. Dependencias. Detección datos anómalos. Análisis de dispersión. Técnicas de Aprendizaje Automático
9 DESCRIPTIVO: Segmentación (Aprendizaje no supervisado)
Técnicas de clustering: Taxonomía de Técnicas de DM k-means (competitive learning). redes neuronales de Kohonen EM (Estimated Means) (Dempster et al. 1977). Cobweb (Fisher 1987). AUTOCLASS …
10 Un concepto importante en el aprendizaje supervisado (clasificación) y no supervisado (segmentación) es el concepto de similitud:
La razón de este uso es que, intuitivametne, datos similares tendrán clases/grupos similares. ¿Cómo se mide la similitud?
DISTANCIA inversa a SIMILITUD.
Los métodos de similitud (o de distancia) se basan en almacenar los ejemplos vistos, y calcular la similitud/distancia del nuevo caso con el resto de ejemplos.
Similitud/Distancia
Página siguiente |