Integrantes: Antut, Gregorio Pérez, Maholys Lomelli, Almary Camacho, María Haranki, Jorge Medina, Neyla (Grupo 4) Data Mining (Minería de Datos) UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA“ ANTONIO JOSÉ DE SUCRE ”VICE-RECTORADO PUERTO ORDAZDEPARTAMENTO DE INGENIERÍA INDUSTRIALSISTEMAS DE INFORMACIÓN UNEXPO CIUDAD GUAYANA, MARZO DE 2010 Profesor: MSc. Ing. Iván J. Turmero Astros
Minería de datos [Witten & Frank 2000]: proceso de extracción de conocimiento válido, útil, comprensible, y desconocido, a partir de datos almacenados. válido: el conocimiento obtenido debe ser preciso ("correcto") para nuevos conjuntos de datos (no sólo para el conjunto utilizado en su obtención). útil: el conocimiento obtenido debe servir a la organización para tomar decisiones que le reporten algún beneficio. comprensible: el conocimiento obtenido debe ser fácil de interpretar y usar. novedoso: el conocimiento obtenido debe aportar a la organización, información desconocida hasta ese momento. ¿Qué es la Minería de Datos?
Minería de datos La minería de datos es una tecnología de soporte para usuario final, cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas.
Los objetivos de un sistema de minería de datos nos permitirían analizar factores de influencia en determinados procesos, predecir o estimar variables o comportamientos futuros, sementar o agrupar ítems similares, además de obtener secuencias de eventos que provocan comportamientos específicos.
Minería de datos Los sistemas de minería de datos se desarrollan bajo lenguajes de ultima generación basados en la inteligencia artificial y utilizando métodos matemáticos, tales como: Redes neuronales Introducción de reglas Arboles de decisión Conjunto de reglas por clase Soporta también sofisticadas operaciones de análisis tales como los sistemas Scoring y aplicaciones de detección de fraude.
El proceso no trivial de identificar patrones válidos, nuevos, potencialmente útiles y entendibles en los datos Minería de datos
(Gp:) Conocimiento (Gp:) Patrones (Gp:) Datos Transformados (Gp:) Datos Seleccionados (Gp:) Datos (Gp:) Datos Preprocesados (Gp:) Selección (Gp:) Preprocesamiento (Gp:) Transformación (Gp:) Minería de datos (Gp:) Interpretación / evaluación
Otro nombre para la Minería de Datos: Descubrimiento de conocimiento en bases de datos (KDD)
Fundamentos de la Minería datos Data Mining toma el proceso de evolución más allá del acceso y navegación retrospectiva de los datos, hacia la entrega de información prospectiva y proactiva. Data Mining está listo para su aplicación porque está soportado por tres tecnologías que ya están suficientemente maduras: Recolección masiva de datos. Potentes computadoras con multiprocesadores. Algoritmos de Data Mining.
Objetivos y características de la minería de datos Explorar los datos se encuentran en las profundidades de las bases de datos. Consolidar los datos en un almacén de datos. Tiene una arquitectura cliente–servidor usando procesamiento paralelo. Facilita el uso de varias herramientas y técnicas para la extracción de los datos. La minería de datos produce cinco tipos de información: — Asociaciones — Secuencias — Clasificaciones — Agrupamientos — Pronósticos
Alcances Minería Datos Descubrimiento automatizado de modelos previamente desconocidos. Predicción automatizada de tendencias y comportamientos. Aportes a la toma de decisiones con bases y fundamentos reales basados en los dato.
Aplicativos Los ambientes para el desarrollo de las bodegas de datos son: Oracle Data Warehouse SQL Server Entreprise ed. Sybase – PoweDesigner, Sybase IQ
Aplicaciones financieras y de banca: obtención de patrones de uso fraudulento de tarjetas. obtención de perfiles de clientes en el uso de tarjetas. obtención de correlaciones entre indicadores financieros. análisis de riesgos en la concesión de préstamos, … Análisis de mercado, distribución y comercio: análisis de la cesta de la compra. evaluación de campañas publicitarias. obtención de perfiles de clientes. análisis de la fidelidad de los clientes, … Otros sectores: compañías de servicios: telecomunicaciones, agua, gas, …. correo electrónico, agendas personales. turismo tráfico uso de web …
Ejemplo1: análisis de riesgo en préstamos bancarios. Un banco desea disponer de un modelo que le permita predecir qué tipo de clientes podrían no devolver un préstamo solicitado. La entidad dispone de información sobre préstamos anteriores, así como datos personales de los titulares de esos préstamos.
Ejemplo1: análisis de riesgo en préstamos bancarios. A partir de estos datos, las técnicas de DM podrían generar un modelo de los datos, consistente en un conjunto de reglas, que permitiesen predecir en el futuro, el posible comportamiento de un cliente que solicitase un préstamo.
Ejemplo1: análisis de riesgo en préstamos bancarios. Para nuestro estudio, existen dos clases de cliente: los que devuelven los préstamos y los que no los devuelven. Las reglas generadas en el proceso de DM, deben predecir la clase de un cliente (variable objetivo) a partir de sus características (variables predictivas).
Ejemplo1: análisis de riesgo en préstamos bancarios. Regla 1: Si cuentas-morosas > 0 entonces devuelve-préstamo = no Regla 2: Si cuentas-morosas = 0 Y ( salario>2.500 O D-credito>10) entonces devuelve-préstamo = sí …
(Gp:) X1, X2, …, X5 3, 5, …, 8 2, 4, …, 0 0, 1, …, 7
Ejemplo 2
Página siguiente |