Proceso de la Minería 17 BD Datos Selección Preprocesado Selección de características Extracción de conocimiento Evaluación Modelo clasificador Conocimiento
Proceso de la Minería Algoritmos de aprendizaje: Mediante una técnica de Minería de Datos, se obtiene un modelo de conocimiento. El modelo representa patrones de comportamiento observados en los valores de las variables o relaciones de asociación. También pueden usarse técnicas para generar distintos modelos. 18
Tipología de Técnicas de la Minería Los métodos no supervisados, descubren: patrones y tendencias en los datos actuales. El descubrimiento de esa información sirve para llevar a cabo acciones y obtener un beneficio de ellas. 19
Taxonomía de la Minería 20 Data Mining Verification Driven DM Discovery Driven DM SQL SQL Generator Description Prediction Query Tools OLAP Visualization Clustering Association Secuential Association Distillation Clasification Statistical Regression Decision Tree Rule Induction Neural Network
Métodos de la Minería Agrupamiento. También se llama segmentación. Identifica tipologías de grupos, donde se guarda similitud. Se requiere información sobre el colectivo a segmentar. La información corresponde a valores concretos. Se basan en herramientas de carácter estadísticos, generación de reglas, redes neuronales,etc. 21
Técnicas de la Minería Métodos estadísticos. Técnica tradicional en el tratamiento de grandes volúmenes de datos. Existen varios modelos: ANOVA (Análisis de Varianza). Contrasta con variables continuas. Ji cuadrado. Contrasta con la independencia de variables. Componentes principales. Permite reducir el número de variables. 22
Técnicas de la Minería Métodos estadísticos. Análisis de clústers. Permite clasificar poblaciones. Análisis de discrimante. Permite encontrar reglas de clasificación de elementos en grupos. Regresión lineal. Se identifica una variable dependiente de las independientes, con una relación lineal. Regresión logística. Trabaja con variables discretas, se requiere que las variables sean lineales. 23
Técnicas de la Minería Árboles de decisión. Herramientas analíticas empleadas para el descubrimiento de reglas y relaciones. Se construye partiendo el conjuntos de dos (CART) o más (CHAID). Cada subconjunto a su vez es particionado. Se continua hasta no encontrar diferencias significativas de influencia. 24
Técnicas de la Minería Reglas de asociación. Derivan de un tipo de análisis que extrae información por coincidencias. Permite descubrir correlaciones o co-ocurrencias en los sucesos de la base de datos. Se formaliza la obtención de reglas del tipo SI… ENTONCES. 25
Técnicas de la Minería Redes neuronales. Son capaces de detectar y aprender patrones y características de los datos. Una vez adiestradas las redes pueden hacer previsiones, clasificaciones y segmentación. Esto se realiza estructurando nivels o capas. Se tienen dos tipos de aprendizaje: supervisado y no supervisado. 26
Técnicas de la Minería Algorítmos genéticos. Hacen uso de técnicas de reproducción (mutación y cruce) para ser utilizadas para búsqueda y optimización. Se parte de una población inicial, y se altera optimizándola. Esta herramienta se usa en las primeras fases de la minería y después se aplica redes neuronales o regresión logística. 27
Técnicas de la Minería Lógica difusa. Surge de la necesidad de modelar la realidad de forma mas exacta, evitando el determinismo y exactitud. Permite el tratamiento probabilístico de categorización colectiva. Trata la existencia de barreras difusas o suaves entre grupos. 28
Técnicas de la Minería Series temporales. Consisten en el estudio de una variable a través del tiempo para que partiendo de ese conocimiento y con el supuesto de no cambios poder realizar predicciones. Se basan en ciclos, tendencias y estaciones. Se puede aplicar enfoques híbridos entre métodos anteriores, o con otro tipo de variables. 29
Técnicas de la Minería Redes bayesianas. Son una alternativa para la minería. Se tiene las ventajas: Permiten aprender sobre relaciones de dependencia y causalidad. Permiten combinar conocimiento de datos. Evitan el sobre-ajuste de datos. Permiten el manejo de bases de datos incompletas. 30
Técnicas de la Minería Inducción de reglas. Como información de entrada, se tiene un conjunto de casos donde se ha asociado una clasificación o evaluación. Con tal información se obtiene un árbol de decisión, que soportan la evaluación o clasificación. En caso de que la entrada tenga ruido, esta técnica se puede habilitar con métodos estadísticos. 31
Técnicas de la Minería Sistemas basados en conocimiento y sistemas expertos. Permiten la formalización de árboles y reglas de decisión, extraídas del conocimiento de expertos. Poseen motores de inferencia, que gestionan las preguntas. De esta forma el proceso de decisión es eficiente y rápido. 32
Evaluación de la Minería Selección de técnicas adecuadas. El mínimo aceptable para elegir una tecnología de MD y un producto depende de qué tanto el producto beneficia al negocio: Ingresos. Costos disminuidos. Rendimiento de inversiones. Para desarrollar con éxito un negocio, el MD debe buscar algo más que patrones deseados. 33
Evaluación de la Minería Se tienen tres medidas claves, para una evaluación de las herramientas. Precisión: Se deben modelos precisos, pero reconociendo pequeñas diferencias en las técnicas. Explicación: Las herramientas deben explicar al usuario final de manera clara como funciona el modelo. Integración: Las herramientas deben integrarse en el proceso real del negocio, flujos de datos e información de la empresa. 34
Página anterior | Volver al principio del trabajo | Página siguiente |