ÍNDICE Introducción
Clasificación de redes neuronales: Estructura Entrenamiento
Aplicación de las redes neuronales a la identificación de sistemas
Las redes neuronales en el control
REDES NEURONALES Neurona: base del funcionamiento del cerebro.
Sistema de procesamiento cerebral de la información: Complejo, No lineal y Paralelo.
Elementos de que consta: sinapsis, axón, dentritas y soma o cuerpo
NEURONA ARTIFICIAL Neurona artificial: unidad de procesamiento de la información, es un dispositivo simple de cálculo que ante un vector de entradas proporciona una única salida.
Elementos: Conjunto de entradas, xj
Pesos sinápticos, wi
Función de activación: w1·x1+ w2·x2 + … + wn·xn = a
Función de transferencia: y = F (w1·x1+ w2·x2 + … + wn·xn )
Bias o polarización: entrada constate de magnitud 1, y peso b que se introduce en el sumador
NEURONA ARTIFICIAL Principales funciones de transferencia: Lineal: y=ka Escalón: y = 0 si a< 0; y=1 si a>=0 Sigmoide Gaussiana.
RNA de una capa Una neurona aislada dispone de poca potencia de cálculo. Los nodos se conectan mediante la sinapsis Las neuronas se agrupan formando una estructura llamada capa. Los pesos pasan a ser matrices W (n x m) La salida de la red es un vector: Y=(y1, y2, … , yn)T Y=F(W·X+b)
RNA Multicapa Redes multicapa: capas en cascada. Tipos de capas: Entrada Salida Oculta No hay realimentación => red feedforward Salida depende de entradas y pesos.
Si hay realimentación => red recurrente Efecto memoria Salida depende también de la historia pasada.
Una RNA es un aproximador general de funciones no lineales.
Entrenamiento I Entrenamiento: proceso de aprendizaje de la red. Objetivo: tener un comportamiento deseado. Método: Uso de un algoritmo para el ajuste de los parámetros libres de la red: los pesos y las bias. Convergencia: salidas de la red = salidas deseadas. Tipos de entrenamiento: Supervisado. Pares de entrenamiento: entrada – salida deseada. Error por cada par que se utiliza para ajustar parámetros No-supervisado. Solamente conjunto de entradas. Salidas: la agrupación o clasificación por clases Reforzado.
Perceptrones McCulloch y Pitts, en 1943, publicaron el primer estudio sobre RNA. El elemento central: perceptrón.
Solo permite discriminar entre dos clases linealmente separables: XOR. 0.5= a = w1·x1 + w2·x2 No hay combinación de x1 y x2 que resuelva este problema. Solución: más capas o funciones de transferencia no lineales.
Aprendizaje del Perceptrón. Algoritmo supervisado: Aplicar patrón de entrada y calcular salida de la red Si salida correcta, volver a 1 Si salida incorrecta 0 ? sumar a cada peso su entrada 1 ? restar a cada peso su entrada Volver a 1
Proceso iterativo, si el problema es linealmente separable este algoritmo converge en un tiempo finito.
Nos da los pesos y las bias de la red que resuelve el problema.
Regla delta Generalización del algoritmo del perceptrón para sistemas con entradas y salidas continuas. Se define: d=T-A= (salidas deseadas – salidas de la red). Minimiza una función de coste basada en ese vector de error:
Di =d lr xi
Wi (n+1) = Wi (n) + D i
Razón de aprendizaje lr Si las neuronas son lineales=> un único mínimo
Redes Neuronales Lineales. Función de transferencia lineal. Algoritmo de entrenamiento de Widrow-Hoff o Delta, tiene en cuenta la magnitud del error. Entrenamiento: Suma de los cuadrados de los errores sea mínima. Superficie de error con mínimo único. Algoritmo tipo gradiente.
Aproximan funciones lineales.
Backpropagation Clave en el resurgimiento de las redes neuronales. Primera descripción del algoritmo fue dada por Werbos en 1974 Generalización del algoritmo de Widrow-Hoff para redes multicapa con funciones de transferencia no-lineales y diferenciables. 1989 Hornik, Stinchcombe y White Una red neuronal con una capa de sigmoides es capaz de aproximar cualquier función con un número finito de discontinuidades Propiedad de la generalización. La función de transferencia es no-lineal, la superficie de error tiene varios mínimos locales.
Página siguiente |