Descargar

Minería de Datos (Presentación Powerpoint) (página 2)

Enviado por Pablo Turmero


Partes: 1, 2, 3
edu.red

Componentes El componente principal en la Tecnología de la Minería de Datos ha sido desarrollado en: Estadística Inteligencia Artificial Máquinas de Aprendizaje Actualmente, existe gran relevancia en: Ambientes de negocios Las descripciones básicas de las arquitecturas de almacenes de datos. 11

edu.red

Técnicas Las técnicas para la Minería de Datos son:

Redes Neuronales Artificiales. Árboles de Decisión. Algoritmos Genéticos. Modelos Lineales. Vecino más Cercano. 12

edu.red

Minería de Datos La Minería de Datos ha surgido del potencial del análisis de grandes volúmenes de información. Su fin es obtener resúmenes y conocimiento para la toma de decisiones. Además se pretende construir experiencia a partir de millones de transacciones. 13

edu.red

Minería de Datos El conjunto de datos de donde la minería intenta extraer conocimiento se le llama conjunto de entrenamiento. La meta de la Minería es obtener conocimiento válido no solo para la base de datos considerada sino para una muy similar. El conocimiento puede ser probado con otro conjunto de entrenamiento. 14

edu.red

Minería de Datos Algunas de las aplicaciones de la Minería de Datos son: Compañias Farmaceuticas. Compañias de crédito. Compañias de transporte. Compañias de consumo. Reacciones químicas. Comercio, monitoreo. 15

edu.red

Retos de la Minería Facilidad con que se puede caer en una falsa interpretación.

Es fácil equivocarse.

Tiempo y espacio.

Privacidad 16

edu.red

Proceso de la Minería 17 BD Datos Selección Preprocesado Selección de características Extracción de conocimiento Evaluación Modelo clasificador Conocimiento

edu.red

Proceso de la Minería Algoritmos de aprendizaje: Mediante una técnica de Minería de Datos, se obtiene un modelo de conocimiento. El modelo representa patrones de comportamiento observados en los valores de las variables o relaciones de asociación. También pueden usarse técnicas para generar distintos modelos. 18

edu.red

Tipología de Técnicas de la Minería Los métodos no supervisados, descubren: patrones y tendencias en los datos actuales. El descubrimiento de esa información sirve para llevar a cabo acciones y obtener un beneficio de ellas. 19

edu.red

Taxonomía de la Minería 20 Data Mining Verification Driven DM Discovery Driven DM SQL SQL Generator Description Prediction Query Tools OLAP Visualization Clustering Association Secuential Association Distillation Clasification Statistical Regression Decision Tree Rule Induction Neural Network

edu.red

Métodos de la Minería Agrupamiento. También se llama segmentación. Identifica tipologías de grupos, donde se guarda similitud. Se requiere información sobre el colectivo a segmentar. La información corresponde a valores concretos. Se basan en herramientas de carácter estadísticos, generación de reglas, redes neuronales,etc. 21

edu.red

Técnicas de la Minería Métodos estadísticos. Técnica tradicional en el tratamiento de grandes volúmenes de datos. Existen varios modelos: ANOVA (Análisis de Varianza). Contrasta con variables continuas. Ji cuadrado. Contrasta con la independencia de variables. Componentes principales. Permite reducir el número de variables. 22

edu.red

Técnicas de la Minería Métodos estadísticos. Análisis de clústers. Permite clasificar poblaciones. Análisis de discrimante. Permite encontrar reglas de clasificación de elementos en grupos. Regresión lineal. Se identifica una variable dependiente de las independientes, con una relación lineal. Regresión logística. Trabaja con variables discretas, se requiere que las variables sean lineales. 23

edu.red

Técnicas de la Minería Árboles de decisión. Herramientas analíticas empleadas para el descubrimiento de reglas y relaciones. Se construye partiendo el conjuntos de dos (CART) o más (CHAID). Cada subconjunto a su vez es particionado. Se continua hasta no encontrar diferencias significativas de influencia. 24

edu.red

Técnicas de la Minería Reglas de asociación. Derivan de un tipo de análisis que extrae información por coincidencias. Permite descubrir correlaciones o co-ocurrencias en los sucesos de la base de datos. Se formaliza la obtención de reglas del tipo SI… ENTONCES. 25

edu.red

Técnicas de la Minería Redes neuronales. Son capaces de detectar y aprender patrones y características de los datos. Una vez adiestradas las redes pueden hacer previsiones, clasificaciones y segmentación. Esto se realiza estructurando nivels o capas. Se tienen dos tipos de aprendizaje: supervisado y no supervisado. 26

edu.red

Técnicas de la Minería Algorítmos genéticos. Hacen uso de técnicas de reproducción (mutación y cruce) para ser utilizadas para búsqueda y optimización. Se parte de una población inicial, y se altera optimizándola. Esta herramienta se usa en las primeras fases de la minería y después se aplica redes neuronales o regresión logística. 27

edu.red

Técnicas de la Minería Lógica difusa. Surge de la necesidad de modelar la realidad de forma mas exacta, evitando el determinismo y exactitud. Permite el tratamiento probabilístico de categorización colectiva. Trata la existencia de barreras difusas o suaves entre grupos. 28

edu.red

Técnicas de la Minería Series temporales. Consisten en el estudio de una variable a través del tiempo para que partiendo de ese conocimiento y con el supuesto de no cambios poder realizar predicciones. Se basan en ciclos, tendencias y estaciones. Se puede aplicar enfoques híbridos entre métodos anteriores, o con otro tipo de variables. 29

edu.red

Técnicas de la Minería Redes bayesianas. Son una alternativa para la minería. Se tiene las ventajas: Permiten aprender sobre relaciones de dependencia y causalidad. Permiten combinar conocimiento de datos. Evitan el sobre-ajuste de datos. Permiten el manejo de bases de datos incompletas. 30

Partes: 1, 2, 3
 Página anterior Volver al principio del trabajoPágina siguiente