Descargar

Indicadores integrales de gestión


Partes: 1, 2

  1. Introducción
  2. Metodología propuesta
  3. Elección del credit scoring a complementar
  4. Diseño de la red neuronal virtual "RNVCREDI"
  5. La generación automática de ejemplos y entrenamiento de la red neuronal
  6. Validación de la RNV
  7. Resultados y conclusiones
  8. Referencias bibliográficas

Dentro del objetivo del Congreso, que es "plantear una instancia de discusión académica propiciando el replanteo de técnicas ya existentes, como también el desarrollo de nuevas herramientas que permitan sortear los desafíos que enfrentan los agentes económicos", presentamos la metodología RENEVA, que permite complementar técnicas convencionales de asistencia en la toma de decisiones, de forma que puedan operar aunque no se disponga de la totalidad de los datos que dichas técnicas requieren. La utilidad de un planteamiento de este tipo radica en que, en un ambiente global y competitivo, caracterizado por el incremento de las relaciones clienteempresa "on-line", en ocasiones es necesario dotar a la interface de ordenador con la que el cliente accede a la empresa, de la capacidad de discriminar el posible resultado del requerimiento del cliente aunque, provisionalmente, no se dispongan de todos los datos. Por otra parte, esta metodología también permite el empleo de técnicas convencionales de reconocida fiabilidad, cuando la falta de tiempo o la magnitud del coste requerido, entre otros factores, impiden disponer de todos los datos necesarios para su empleo.

La metodología que proponemos, soslaya la dificultad que supone la falta de datos, recurriendo a una Red Neuronal Virtual entrenada para suplantar a la técnica en cuestión cuando algún dato que ésta requiera no esté disponible. En el trabajo se expone, a modo de demostración, la aplicación práctica de la metodología RENEVA, a un caso concreto, muy sensible a la disponibilidad de datos: la utilización de un credit scoring como apoyo a las decisiones enmarcadas en la Política de Crédito de una empresa.

1. INTRODUCCIÓN

Vivimos en una época en la que cada vez es más frecuente el contacto de la gente con las empresas a través de Internet. Además la gente espera decisiones rápidas cuando interactúa on-line y esto es especialmente cierto en el caso del comercio electrónico. El problema es que las empresas no pueden permitirse que las decisiones tomadas con rapidez y con información inadecuada, incrementen su riesgo. Como reconoce la asociación de la Banca Americana "mientras el e-comercio aumenta exponencialmente, también lo hace el fraude on-line; los expertos predicen que decir sí a todos, vengan de donde vengan, abre el campo a los engaños cibernéticos. Para hacer frente al reto, la banca necesita herramientas que puedan proporcionar clasificaciones de crédito, adaptativas y precisas" (American Bankers Association, 1999, p.54).

Naturalmente, el problema asociado al riesgo de impago, no es nuevo ni exclusivo del comercio electrónico, sino que se relacionan con una partida contemplada en la contabilidad desde sus propios inicios: los derechos de cobro.

Los derechos de cobro surgen en el proceso de circulación de los bienes entre unidades económicas, cuando entre ellos se estipulan diferimientos en la contraprestación monetaria. Resultan de la concesión de créditos y están expuestos a moras o insolvencias. En efecto, cuando una empresa vende productos o servicios a crédito, inevitablemente se expone, en algún momento, a que alguna de sus cuentas representativas de derechos de cobro pueda resultar incobrable; es decir, toda empresa que no vende exclusivamente al contado, asume el riesgo del impago de la parte aplazada. Por ello, los derechos de cobro frente a terceros que, con independencia de su instrumentalización, generalmente se encuentran entre las cuentas de activo circulante de las empresas, se encuadran, como señala Fernández Pirla, 1974, pág. 84, dentro del realizable incierto, condicionado o contingente.

La cuantía de los derechos de cobro, dependerá de las condiciones y políticas que adopte la empresa, así "otorgar un crédito implica la necesidad de hallar un equilibrio entre el imperativo de "invertir" en el cliente (visión comercial) y, por otro lado, el incremento de las necesidades financieras y su coste (visión económica)" (Santandreu, 1994, pág. 159).

Lo habitual es que las partidas representativas de derechos de cobro representen un volumen importante en el conjunto de los activos empresariales (López Díaz y Menéndez, 1991, pág. 197), en consecuencia, dado su riesgo inherente, es relevante fijar las funciones y responsabilidades asociadas a la concesión de créditos, lo que suele concretarse en la definición de una política de crédito.

Una buena política crediticia[1]por parte de la empresa, es la mejor forma de prevenir las incidencias en el cobro[2]además de servir a otros propósitos como, por ejemplo, los siguientes:

  • Fijar unas reglas claras de funcionamiento comercial con el cliente desde el inicio de la relación comercial.

  • Ahorrar conflictos entre departamentos, pues supondrá una norma de funcionamiento aprobada por la Dirección.

  • Evitar o reducir los impagados producto de errores en la gestión.

  • Disuadir al cliente de utilizar a la empresa vendedora como fuente de financiación gratuita.

Las políticas crediticias suelen contemplar algún estudio, previo a la concesión de crédito, tendente a evaluar la solvencia que merece el cliente. Una técnica muy utilizada, para clasificar los créditos en función del riesgo que a priori presentan, es la denominada credit scoring.

El credit scoring consiste en la obtención de "un índice que permite clasificar una observación en uno de los diversos agrupamientos realizados a priori" (Weston y Brigham, 1987, pág. 203). El procedimiento del credit scoring, tal como indica Santandreu (1994, pág. 25 y ss), se basa en la aplicación de unos índices correctores a ciertos datos de los clientes, para culminar con la obtención de un parámetro denominado "credit score". Dicho parámetro, sirve para incluir al cliente en una de las clases establecidas en una tabla predeterminada[3]

Para desarrollar un sistema de credit scoring, hay fundamentalmente tres aproximaciones, las cuales pueden ser combinadas en cualquier modo que se desee (Fensterstock, 2003, p10 y ss.):

  • 1) Sistemas basados en reglas o razonamientos. Evalúan si un cliente es digno de crédito mediante un conjunto de reglas basadas en una combinación de experiencias, tanto internas como externas, que generalmente abarcan al menos las siguientes áreas: historial de pagos; referencias bancarias y comerciales; ratios de agencias de créditos y ratios financieros. Una vez que se decide qué factores serán tenidos en cuenta, ellos son ponderados de acuerdo con la experiencia del departamento de créditos.

  • 2) Sistemas basados en el análisis estadístico (generalmente mediante un modelo de regresión multivariable). Persiguen estimar la probabilidad de que un cliente nuevo, o existente, llegue a ser moroso. Estos sistemas son similares a los basados en reglas, con la salvedad de que la ponderación de los factores se basa en un análisis estadístico, que puede ser de diferentes tipos, por ejemplo: modelos de probabilidad lineal, en los que se asume una relación lineal entre los factores y la probabilidad de impago; modelos "logit" que sumen que la probabilidad de impago se distribuye de manera logística; modelos "probit" que asumen que la probabilidad de impago sigue una distribución normal; modelos basados en análisis discriminante, que persiguen la clasificación en grupos de diferente nivel de riesgo; etc.

Para la obtención de un credit scoring de este tipo, se parte de un fichero de clientes susceptible de ser ordenado según las clases de riesgo establecidas. El archivo debe incluir información relacionada directa o indirectamente con la capacidad de pago del solicitante (Bachiller, Lafuente y Salas, 1987, pág. 128). Del análisis de dichos datos se obtiene una función discriminante que pondera las variables en función de su contribución al índice de solvencia futura de cada cliente[4]A partir de dicha función se puede predecir la probabilidad de solvencia o insolvencia de cada derecho de cobro, lo cual facilita la decisión para la empresa de la concesión o denegación del crédito[5]Una vez obtenida la función discriminante, se procede a:

  • Elaborar un cuestionario para la obtención de datos del solicitante del crédito, que recoja las variables establecidas.

  • Determinar los índices correctores (criterios de ponderación) a aplicar a cada uno de los datos de cada cliente.

  • Confeccionar una tabla de clasificación de los deudores que asigne a cada clase un rango de puntuaciones. La empresa elabora la tabla de clasificación, en la que manifiesta de forma expresa la mayor o menos rigidez de su política crediticia, esto es, su mayor o menor aversión al riesgo.

Posteriormente se presenta al solicitante de crédito el cuestionario que ha de rellenar, se aplican a los datos así obtenidos los índices correctores y se suman todas las cantidades obtenidas hasta alcanzar una cifra, el credit score, comprobando en la tabla de clasificación la categoría que tal puntuación merece. Como consecuencia de este proceso la empresa puede determinar, en cada momento, el riesgo a asumir en las diferentes situaciones. Es de destacar el corolario más inmediato del proceso: cuanto más rígida sea la política de la empresa, menos riesgos asumirá y por tanto venderá menos a crédito y por contra, cuanto menos conservadora sea, más ventas a crédito realizará y en consecuencia, se producirá un aumento en los riesgos.

  • 3) Sistemas basados en Redes Neuronales. Se basan en la aplicación de algoritmos de inteligencia artificial, con capacidad para reconocer a qué clase pertenecen los clientes (por ejemplo: buenos pagadores, clientes con riesgo, clientes morosos, etc.), a partir de ciertas características, consideradas relevantes, que se le suministran durante el aprendizaje. Aunque hay evidencias empíricas de que la clasificación de clientes obtenida mediante una Red Neuronal es por lo menos tan ajustada como las obtenidas con los procedimientos descritos en los puntos anteriores[6]su aplicación práctica se ve frenada por la dificultad, inherente a su funcionamiento, de explicar el por qué de la clasificación obtenida. Esta es uno de los aspectos importantes de la metodología que presentamos: permite emplear la potencia de las Redes Neuronales sin tener que prescindir del poder explicativo de las técnicas estadísticas convencionales.

2. METODOLOGÍA PROPUESTA

La metodología que presentamos, a la que hemos denominado "RENEVA" (acrónimo de "Red Neuronal Virtual de Apoyo a la decisión"), se basa en la utilización de una Red Neuronal Virtual (RNV) diseñada y entrenada no para representar la realidad directamente, sino para reproducir el funcionamiento de una técnica a la que pretende complementar, con sólo una parte de los datos que ésta requeriría. En el caso que estamos presentando, se creó una red neuronal capaz de suplantar a un credit scoring del segundo grupo de los mencionados (es decir, basado en el análisis estadístico), en un ambiente de carencia de algunos datos. Ello es posible merced a la capacidad generalizadora de las Redes Neuronales y a la "no linealidad" que caracteriza su funcionamiento.

Hemos de aclarar que denominamos Red Neuronal Virtual a un programa de ordenador que ejecuta un proceso secuencial que, mediante bucles anidados, simula el procesamiento paralelo propio de las Redes Neuronales Artificiales (RNA)[7], las cuales, a su vez, "están inspiradas en el modelo de la neurona biológica, usando unidades elementales de procesamiento que mimetizan algunas de las características de las neuronas biológicas" (Sierra, Bonsón, Nuñez y Orta, 1995, pág. 28).

El procedimiento que proponemos, se compone de cinco etapas sucesivas:

  • a. Diseño topológico de una Red Neuronal Virtual (RNV) adecuada para la técnica concreta a complementar.

  • b. Generación informática de ejemplos para un aprendizaje supervisado.

  • c. Entrenamiento de la RNV.

  • d. Prueba del funcionamiento de la RNV

  • e. Diseño del programa informático de asistencia en la decisión que emplea la técnica original o, subsidiariamente, la Red Neuronal Virtual creada.

Aunque nada impide a priori el empleo de cualquier tipo de Red Neuronal Artificial, dadas las características de la metodología que estamos describiendo, nosotros proponemos el empleo de Redes Neuronales multicapa, feed-forward[8]esto es, de propagación hacia delante, con aprendizaje supervisado tipo retropropagación[9]es decir, mediante la minimización del error de salida, a través de la asignación de nuevos pesos de conexión. Gráficamente se corresponde con la figura de la ilustración siguiente:

edu.red

Ilustración 1: Arquitectura de una red neuronal feed-forward.

Lo más característico de este tipo de Redes Neuronales es el entrenamiento, en el cual se presenta a la Red un conjunto predefinido de pares de vectores de entrada y vectores de salida dados como ejemplos, en dos fases:

  • PROPAGACIÓN: en ella se aplica el vector de entrada como estímulo para la capa de entrada de la Red y, mediante la función de activación, se va propagando la señal a través de la capa oculta hasta generar una salida.

  • ADAPTACIÓN: Se compara la salida obtenida con la deseada y se calcula una señal de error para cada unidad de salida. Las señales de error así obtenidas se propagan hacia atrás, aplicando a cada nodo de la capa intermedia una fracción del error proporcional a la contribución relativa que haya aportado a la salida, procediendo al ajuste de los pesos sinápticos mediante la regla Delta generalizada[10]

El objetivo de este trabajo es efectuar una demostración práctica de la metodología RENEVA, mediante su aplicación a un sencillo credit scoring, utilizado como técnica de apoyo en las decisiones enmarcadas en la Política de Crédito de una empresa.

A modo de demostración, a continuación describiremos paso a paso el procedimiento seguido para la creación de una RNV, capaz de asistir al credit scoring descrito en el epígrafe anterior en un ambiente de incertidumbre, que se manifiesta en la no disponibilidad (o, al menos, la incapacidad de verificar) algunos datos.

En este caso, las cinco etapas de que consta la metodología RENEVA, se concretaron en el siguiente esquema:

  • A. Elección del credit scoring a complementar;

  • B. A la luz de los datos de entrada que requiere y la configuración que adopta la salida (resultado) que proporciona, se diseñó una Red Neuronal Virtual (RNV) de tres capas, feed-forward, esto es, de propagación hacia delante, con aprendizaje supervisado tipo back-propagation, es decir, mediante la minimización del error de salida, a través de la asignación de nuevos pesos de conexión.

  • C. Se generó informáticamente un conjunto de ejemplos a partir de datos obtenidos aleatoriamente y tratados mediante el credit scoring elegido. Se entrenó la RNV con los ejemplos obtenidos a los que, aleatoriamente, se les incorporaba ruido, esto es, se les suprimía algún dato.

  • D. Se "validó" la Red entrenada, comparando las salidas que proporciona con las del credit scoring a complementar, presentándole un nuevo conjunto de ejemplos de prueba, generados de forma semejante al del apartado 2. También se comprobó el funcionamiento de la Red Neuronal Virtual con ejemplos a los que se había suprimido algún dato, evaluando sus aciertos y equivocaciones.

  • E. Finalmente, se construyó el programa informático capaz de presentar resultados: A) con el credit scoring convencional si tenemos todos los datos; B) con la RNV si falta algún dato, expresando una categoría y el índice de confianza que merece la clasificación obtenida.

Los algoritmos de generación de ejemplos, de entrenamiento y de validación de la RNV fueron creados con una versión del lenguaje Qbasic, puesto que se deseaba sencillez de programación y rapidez de cálculo. En cambio, el programa informático de la última etapa, se desarrolló en Visual Basic, buscando la facilidad de uso y una fácil integración en el entorno Windows.

Dado que el programa de la última etapa es irrelevante para los objetivos de este trabajo, omitiremos su descripción limitándonos, a continuación, a explicar en detalle únicamente las cuatro primeras etapas y los resultados alcanzados.

3. ELECCIÓN DEL CREDIT SCORING A COMPLEMENTAR.

Para esta demostración, se ha seleccionado un credit scoring sencillo, tomado de Santandreu (1994, pág. 25 y ss.), que es el que, por tanto, emplearemos como referente para construir la Red Neuronal Virtual de apoyo.

Naturalmente, a las variables contempladas se podrían añadir otras muchas (por ejemplo, tener teléfono, el modelo y año del coche, etc.), amen de otras que podrían ser más representativas en el caso de solicitantes de carácter empresarial (por ejemplo, ratios de solvencia, liquidez y rentabilidad), pero ello no supondría ninguna diferencia para nuestro objetivo que no es determinar el mejor credit scoring, sino comprobar la posibilidad de obtener una RNV que lo complemente en situaciones de ausencia de algún dato.

En todo caso, en posibles aplicaciones empresariales que se hagan con la metodología que estamos presentando, se deberá tener en cuenta el credit scoring que la empresa en cuestión pudiera tener en funcionamiento, o lo que es lo mismo, las variables contempladas en la función discriminante real que se considere.

El credit scoring que vamos a emplear, tiene como variables las contenidas en el cuestionario (que se destina a recoger la información del solicitante) siguiente, en el cual se muestran las valoraciones numéricas que se asociarán con cada una de las respuestas permitidas:

edu.red

Ilustración 2: Cuestionario del credit scoring elegido

Respecto a los criterios de ponderación establecidos por la función discriminante, Santandreu propone los siguientes (1994, pág. 26): Edad = 0,5; Estado civil = 1; Profesión = 3; Antigüedad en el último empleo = 0,5; Ingresos anuales = 1,5;Vivienda = 3 y Zona residencia = 10. Una vez ponderados los datos obtenidos en el cuestionario, a través de la aplicación de los criterios de ponderación, se procede a su agregación para obtener una valoración final, el credit score, cuyo proceso de obtención es sintetizado en el cuadro siguiente:

Tabla 1: Obtención del "credit score"

Variables:

DATOS DEL CLIENTE

PONDERACIÓN

(A)

RESPUESTAS (B)

VALOR PONDERADO

(C= A X B)

1. Edad

0,5

X1

Y1

2. Estado civil

1

X2

Y2

3. Profesión

3

X3

Y3

4. Antigüedad empleo

0,5

X4

Y4

5. Ingresos anuales

1,5

X5

Y5

6. Vivienda

3

X6

Y6

7. Zona residencia

10

X7

Y7

Suma = Credit

Score

( Yi

Finalmente, la Tabla de Clasificación con las clases definidas en función de la puntuación obtenida es la siguiente:

Tabla 2: Tabla de Clasificaciones

ESCALA DEL "CREDIT SCORE"

CLASIFICACIÓN

DECISIÓN A ADOPTAR

De 0 a 70

De 71 a 100

Superior a 101

Insolvente

Con riesgo.

Solvente

Negar el crédito

Solicitar más datos

Otorgar el crédito.

En resumen, una vez obtenido el credit score, se procede a comparar dicha puntuación, con los datos contenidos en la tabla de clasificación confeccionada por la empresa, con objeto de encuadrar el resultado obtenido en alguno de los agrupamientos establecidos a priori, sirviendo de base a la decisión de conceder o denegar el crédito.

4. DISEÑO DE LA RED NEURONAL VIRTUAL "RnvCredi"

Hemos diseñado una Red Neuronal Virtual con tres capas:

  • Una capa de entrada con ocho nodos. Cada uno de los siete primeros se destina a albergar una variable de entrada del credit scoring, mientras que el octavo funciona como umbral, siendo su valor siempre la unidad.

  • Una capa de salida con tres nodos, suficiente para responder a una clasificación semejante a la de Tabla 2. Un número mayor de nodos permitiría una incrementar el número de categorías en las que clasificar a los clientes, en el caso de que el credit scoring a asistir las propusiera. Naturalmente, más nodos en la capa de salida supondrían un aumento en la complejidad de la RNV y en el tiempo de entrenamiento

  • Una capa oculta que, luego de diversas pruebas, hemos dotado de 8 nodos, uno de ellos con una activación permanente para que funcione como umbral.

Los nodos de cada capa están enlazados con todos los de la capa siguiente (excepto con aquellos que sirvan de umbral) mediante los correspondientes pesos sinápticos. La formula que detalla la entrada neta que recibe el nodo "j" de la capa oculta es:

edu.red

Donde "a" es el número total de nodos de la capa de entrada, "Entradai " corresponde a la activación del nodo "i" de la capa de entrada y "Peso1i,j" corresponde al peso sináptico que enlaza el nodo "i" de entrada con el nodo "j" oculto.

Ilustración 3: Ecuación 1

A su vez, el valor del nodo "k" de la capa de salida viene determinado por la siguiente ecuación:

edu.red

Donde "b" es el número total de nodos de la capa oculta, "Ocultoj " es la activación del nodo "j" de la capa oculta y "Peso2j,k " representa el valor del peso sináptico entre el nodo "j" de la capa oculta y el nodo "k" de la de salida.

Ilustración 4: Ecuación 2

Las ecuaciones 1 y 2 representan una función de tipo sigmoide. La función sigmoide es muy empleada como función de activación porque su derivada es muy simple (lo que facilita el proceso de corrección del error en el algoritmo de backpropagation), limita la salida y es casi biestable, características que la hacen muy adecuada para su empleo en este tipo de redes.

5. LA GENERACIÓN AUTOMÁTICA DE EJEMPLOS Y ENTRENAMIENTO DE LA RED NEURONAL

La solución contemplada en la metodología RENEVA para el suministro de ejemplos a la red neuronal para su entrenamiento, es su generación informática, mediante un generador de datos aleatorios, sometidos a filtrado para que recojan únicamente valores posibles en el mundo real, que son tratados mediante la técnica que se quiere complementar al objeto de obtener la "salida" (clasificación propuesta) que dicha técnica proporcionaría.

Cada ejemplo generado consta de siete datos de entrada (1. Edad, 2. Estado civil, 3. Profesión, 4. Antigüedad en el empleo, 5. Ingresos anuales, 6. Vivienda y 7. Zona residencia) y el vector de salida deseado (Y) cuyos componentes están a cero, salvo el correspondiente al nodo que se debe activar, cuyo valor es 1.

Como hemos indicado, para cada uno de dichos campos, hemos establecido algunas limitaciones, con el fin de hacerlo lo más parecido al mundo real. En las aplicaciones que pretendan su empleo por una empresa concreta, las restricciones serán mucho más exigentes, al objeto de representar fielmente las características reales de los casos utilizados para obtener la función discriminante; en nuestro caso, dado que el objetivo de nuestro trabajo es demostrar la utilidad de la RNV para emular un credit score y no la eficacia de éste, basta con unas cuantas que muestren el camino a seguir:

  • Edad: comprendida entre los 18 y los 70 años (en la aplicación real se ajustarían los límites).

  • Estado civil: Casado u otro estado (soltero, viudo, separado, etc.), estableciendo una distribución equitativa entre ambos grupos.

  • Profesión: Se han establecido tres categorías: con sus siguientes porcentajes de participación en el fichero final: Altos cargos (15%), mandos intermedios (40%) y personal sin cualificar (45%). Asimismo hemos establecido limitaciones en cuanto a la edad, de forma que el status profesional y la edad guarden una relación razonable.

  • Ingresos: Están relacionados con la profesión de tal forma que al grupo más bajo, le hemos asignado retribuciones comprendidas entre 0 y 3 millones, al grupo intermedio entre 3 y 6 y a los altos cargos le hemos asignado retribuciones superiores a los 6 millones.

  • Antigüedad en el puesto de trabajo: Hemos puesto como tope 50 años, asimismo se ha relacionado con la edad y con los ingresos, de tal manera que la antigüedad más la edad supuesta de incorporación al puesto de trabajo nunca pueda ser superior a la edad actual. También hemos requerido que para unos ingresos inferiores a 1 millón, la antigüedad sea inferior al año.

  • Vivienda: Se han contemplado dos casos, que sea propia (la mitad de los casos) o que sea alquilada (la otra mitad).

  • Zona de residencia: Hemos establecido tres zonas con la siguiente distribución: Zona Alta (15 %), media (40 %) y baja (45 %).

Hemos generado 100.000 ejemplos, a los que aplicamos los criterios de ponderación y una vez obtenido el credit score, clasificamos en "solventes", "de riesgo" e "insolventes". Posteriormente comprobamos que la distribución de los resultados es la que muestra la tabla siguiente (en una aplicación práctica, debería reflejar la observada en la realidad):

Categoría

Insolvente

Con riesgo

Solvente

Porcentaje de Clientes

2'2 %

25'0 %

72'8 %

Ahora bien, al objeto de garantizar el poder de clasificación de la RNV, y para lograr un entrenamiento relativamente rápido, seleccionamos aleatoriamente, de dicho fichero, una muestra homogénea de ejemplos de las tres categorías para conformar dos ficheros de 3.000 ejemplos (1.000 de cada tipo) cada uno. Con ello logramos garantizar que todas las categorías están representadas de forma semejante, evitando sesgos posiblemente perniciosos[11]El primer fichero fue empleado en el entrenamiento mientras que el segundo se utilizó para validar la Red una vez entrenada.

Para proceder al entrenamiento, hemos confeccionado un algoritmo, que contempla los pasos siguientes:

  • Iniciar los pesos aleatoriamente. Para el primer paso, se procede a asignar a todos los pesos valores aleatorios muy pequeños para evitar saturaciones iniciales en la Red. Así, nosotros iniciamos el entrenamiento con valores entre 0,4 y +0,4. Debe evitarse asignar el mismo valor inicial a todos los pesos, por ejemplo darles a todos el valor cero, pues representa un serio obstáculo para que la RNV pueda aprender.

  • Presentar a la red neuronal un vector de entradas con su salida correspondiente, extraído del fichero de ejemplos.

  • Calcular la salida de la red.

  • Calcular la desviación entre la salida de la red y la deseada.

  • Modificar los pesos sinápticos con el fin de minimizar el error.

  • Repetir los pasos 2 al 5 para todos el conjunto de entrenamiento; es lo que se denomina "época de entrenamiento".

  • Repetir las épocas de entrenamiento hasta que el error se reduce convenientemente.

Para nuestros fines, es suficiente con que el nodo cuyo Yk vale 1, alcance un valor máximo entre todos los de salida, lo cual será signo inequívoco de que es el seleccionado por la Red. Por tanto, la Red puede mostrar un funcionamiento razonable sin que sea necesario que el error total de la capa de salida sea cero, lo que facilita la convergencia a una solución adecuada, que se manifestará cuando el número de veces que durante una época la Red apunta al nodo correcto es suficientemente alto.

En definitiva, durante el periodo de entrenamiento atenderemos a dos tipos de errores, el error obtenido mediante la Ecuación 3, cuya propagación hacia atrás permitirá ajustar la Red, y el correspondiente al número de veces en que el nodo elegido no es el correcto, que es el que nos permitirá detener el entrenamiento al alcanzar un valor razonable, sin exponernos al sobre-entrenamiento[12]

edu.red

Donde Salidak es la activación del nodo "k" de la capa de salidas, e Yk es el "késimo" componente del vector Y.

Ilustración 5: Ecuación 3

El entrenamiento de nuestra Red fue detenido al alcanzar un porcentaje de aciertos estabilizado en el 93%; un porcentaje notable si se tiene en cuenta el ruido inducido de forma premeditada en el algoritmo de entrenamiento, para aumentar la capacidad de generalización de la Red.

6. VALIDACIÓN DE LA RNV

Se "valida" la red neuronal entrenada, comparando las salidas que proporciona con las de la técnica convencional a complementar, presentándole los dos conjuntos de ejemplos generados: el de entrenamiento y el de prueba. El algoritmo empleado fue el que se recoge a continuación (CsRNV.bas), manipulado convenientemente para que manejase los diferentes datos, esto es, cambiando los ficheros de ejemplos para ir aplicando casos de solventes, insolventes, de riesgo, etc..

Algoritmo CsRNV.bas, para la prueba de la Red Neuronal

edu.red

El resultado alcanzado con el fichero de entrenamiento fue del 96,2 % y con el fichero de prueba el 95,5%. Confirmamos, pues, la validez de la RNV y descartamos que se pueda haber producido "sobre-entrenamiento".

En concreto, al presentar a la Red Neuronal 3.000 ejemplo (mil de cada tipo), con todos los datos, acertó a clasificar correctamente el 91% de los ejemplos solventes, el 100% de los insolventes y el 95,5% de los de riesgo, tal como puede verse en la tabla siguiente:

edu.red

Gráficamente,

edu.red

7. Resultados y conclusiones

Dado que nuestra pretensión al aplicar la metodología RENEVA era lograr una red neuronal capaz por sí misma de emular un credit scoring cuando no se disponen de todos los datos necesarios, a la hora de evaluar su funcionamiento teníamos que incorporar esta característica en los ejemplos de prueba proporcionados. En concreto, hemos comprobado su funcionamiento en tres situaciones diferentes: "con todos los datos" (con los resultados vistos en el apartado anterior), "en ausencia de un dato" y "en ausencia de dos datos".

En la prueba se analizan dos medidas de la eficacia del funcionamiento de la Red:

  • A. Los porcentajes de acierto, esto es, el número de veces que se presenta a la Red un cliente de una categoría dada (solvente, insolvente ó riesgo) y acierta a clasificarlo correctamente.

  • B. Los índices de confianza, es decir, dada una clasificación sugerida por la Red, cuál es la probabilidad de que sea la correcta.

A) PORCENTAJES DE ACIERTO:

Respecto al primer punto, hemos obtenido los resultados de la Tabla 3 y de la Tabla 4, en los cuales, como puede verse, el índice de aciertos ha sido satisfactorio en todos los casos:

  • superiores al 80% cuando retirábamos un dato, y

  • superiores al 74% cuando retirábamos dos, salvo si éstos eran "edad y antigüedad" (65,5%) y "edad y vivienda" (67,2%).

Tabla 3: Porcentajes de acierto (sin una variable)

edu.red

Tabla 4: Porcentajes de acierto (sin dos variables)

edu.red

B) ÍNDICES DE CONFIANZA.

En cuanto a los "índices de confianza" de los resultados que ofrece la Red, esto es, el porcentaje de veces de todas las que la Red da una determinada categoría, que coincide con el resultado que daría el credit scoring, se han calculado para el caso de que la Red funcione con todos los datos, en ausencia de un dato y en ausencia de dos datos.

En el caso de "ausencia de un dato", los resultados obtenidos son los de la Tabla 5. El comportamiento observado es muy equilibrado, con cierta tendencia hacia la desconfianza, que se resume en que aunque la muestra era del 33% de casos de cada categoría, la Red consideró el 29% solventes, el 34% de riesgo y el 36% insolventes. Los datos se resumen en la siguiente tabla:

edu.red

Tabla 5: Resultados en ausencia de un dato

edu.red

Finalmente, en cuanto al funcionamiento de la red en ausencia simultánea de dos variables, Tal y como se puede ver en la Tabla 6, también se aprecia un comportamiento bastante equilibrado y con tendencia más leve a la desconfianza, que, en este caso, se resume en que la Red consideró el 29% solventes, el 30% de riesgo y el 41% insolventes, repartidos tal y como muestra la siguiente tabla:

edu.red

Tabla 6: Resultados en ausencia de dos datos

edu.red

Ahora bien, no todos los errores descubiertos tienen la misma importancia. Dado que en los casos de riesgo es razonable que se solicite que se completen y aún amplíen los datos, a la hora de establecer los índices de confianza nos vamos a centrar en los dos más graves a nuestro juicio:

  • 1) Error Tipo I: Clasificar a un cliente como solvente sin serlo, y

  • 2) Error Tipo II: Acusar de insolvente a un cliente solvente.

Los correspondientes índices son los recogidos en la tabla siguiente:

edu.red

Los datos revelan un comportamiento excelente de la Red Neuronal:

  • Índices de confianza entre 75% y 100% cuando la Red dice "solvente", estando por encima del 90% en 23 de las 29 situaciones estudiadas.

  • Índices de confianza entre el 97 y el 100% de no clasificar como "insolvente" a un cliente "solvente"

Creemos que los índices obtenidos permiten garantizar una gran utilidad de la metodología propuesta y nos hacen abrigar grandes esperanzas en cuanto a su empleo, tanto en otros credit scoring más complejos, como en otros problemas análogos al que acabamos de utilizar para su presentación.

8. REFERENCIAS BIBLIOGRÁFICAS

Agarwal, A.; Davis, J.T. y Ward, T. (2001): "Supporting Ordinal Four-State Classification Decisions Using Neural Networks". Information Technology and Management, vol. 2 pp. 5-26. Kluwer Academic Publishers. The Netherlands.

Alonso, G. y Becerril, J.L.: (1993) Introducción a la Inteligencia Artificial. Técnicas y programas. Multimedia Ediciones, S.A. Barcelona.

Amador Hidalgo, L. (1996): Inteligencia artificial y sistemas expertos,. Universidad de Córdoba.España.

American Bankers Association (1999): "Credit risk analysis software makes e-commerce safer" ABA Banking Journal, Vol. 91, Issue 11 (nov.) pp.54. New York

Arellano Salafranca, I. (1993): "Como recuperar créditos en mora". Estrategia financiera. Nº 84. Abril 1993. Pág. 13-18.

Ayela Pastor, R. Mª (1993): "Gestión de cuentas a cobrar (III): Análisis de crédito a clientes". Revista actualidad financiera. Nº. 44, semana 29 Noviembre-5-Diciembre 1993. Págs. F-495-F-503.

Bachiller Cacho, A; Lafuente Felez, A.; Salas Fumas. V (1987): Gestión económico-financiera del circulante. Ed. Pirámide.

Capon, N. (1980): "Discriminación en la concesión de créditos". Harvard-Deusto Business Review. 2ª Trimestre, 1980. Págs. 31-34.

Castromán Diz, J.L. y Porto Serantes, N. (1995): "Borrosidad, redes neuronales y convergencia matemática. Cálculo neuromimético del tipo de interés de una actualización financiera". Comunicación presentada al II Congreso Internacional de la Sociedad de Gestión y Economía Fuzzy (Sigef). Santiago de Compostela.

Fensterstock, A. (2003): "Credit scoring basics", Business Credit. Volume 105, Issue 3 (mar.), pp. 10-14. New York

Fernández Pirla, J. M. (1974): Teoría económica de la contabilidad. Ediciones ICE. Madrid.

Fernández Vicente, Eugenio J. (1993): "Modelos conexionistas: conceptos generales. origen y evolución". Incluido en Olmeda y Barba-Romero.. Págs. 3-21.

Freeman J.A. y Skapura D.M.: (1993) Redes Neuronales. Algoritmos, aplicaciones y técnicas de programación. Addison-Wesley Iberoamericana, S. A., Wilmington, Delaware, E.U.A.

Fundación BBV (Ed.) (1998): La gestión del riesgo de mercado y del crédito: nuevas técnicas de valoración. Ed. Fundación BBV, Documenta. Madrid.

González Pascual, J. (1994 y 1995): Suspensión de pagos y quiebras. Centro de Estudios Financieros.

Gracia-Díez, M. Y Serrano, G.R. (1992): Algunos aspectos sobre el análisis empírico de "credit scoring". Ed. Facultad de Ciencias Económicas y Empresariales, Universidad Complutense de Madrid, (Documento de Trabajo nº 9205)

Haugeland, J. (Ed.) (1997): Mind Design II. Massachusetts Institute of Technology. USA.

Kosko, B.: (1992) Neural Networks and Fuzzy Systems. A dinamical systems approach to machine intelligence. Prentice-Hall International, Inc. Englewood Cliffs, New Jersey.

López Díaz, A. Y Menéndez Menéndez, M.(1991): Contabilidad Financiera. Editorial A. C.

López González, Enrique (1994): "Procesamiento humano de información versus redes neuronales: el caso de predicción de la quiebra". Comunicación presentada al I Congreso de la Sociedad Internacional de Gestión y Económica Fuzzy (Sigef). Reus.

Martín García, M.: (1993) Redes de propagación hacia adelante: retropropagación del gradiente. En Olmeda, I. y Barba-Romero, S.: (Eds.) (1993) Redes Neuronales Artificiales, Fundamentos y Aplicaciones. Universidad de Alcalá de Henares. Alcalá de Henares, España. Págs. 67-82.

McClelland, J. y Rumelhart, D. (1986): Explorations in Parallel Distributed Processing, volúmenes 1 y 2. MIT Press, Cambridge, MA.

Menéndez Menéndez, M. (1991): "Contabilidad de los créditos comerciales". Revista Actualidad Financiera, nº 32, semana 2-8 Septiembre. 1991. Págs. 211- 227.

Minsky, M. y Papert, S. (1969): Perceptrons. MIT Press. Cambridge, MA.

Montaño, A. (1987): Administración de la cobranza. Editorial Trillas. México.

Núzez García, C. (1999): "Aplicaciones empresariales de las Redes neuronales artificiales". Partida Doble, nº 101 (junio de 1999), págs. 72 –89

Olmeda, I. y Barba-Romero, S. (Eds.) (1993): Redes Neuronales Artificiales, Fundamentos y Aplicaciones. Universidad de Alcalá de Henares, España.

Orduña Moreno, F. J. (1994): La insolvencia. Tirant lo Blanch. Valencia.

Previti Flesca, G. (1989): "Politiche e tecniche di gestione dei crediti commerciali". Rivista Italiana de Ragioneria e di Economia Aziendale. Nº 3 y 4. Marz-Apr. 1989. Págs. 107- 141.

Rich, E. y Knight, K.: (1994) Inteligencia Artificial. McGraw-Hill/Interamericana de España S. A., Madrid.

Santandreu, E. (1994): Gestión de Créditos. cobros e impagados. Ediciones Gestión 2000. S.A. Barcelona.

Sierra, G. J.; Bonson, E.; Núñez, C. y Orta, M.(1995): Sistemas expertos en contabilidad y administración de empresas. Editorial Ra-ma.

Soldevilla, C. Y Guillén, H. (1997): "Consumer Credit Scoring using Artificial Neural Networks". International Meeting on Artificial Intelligence in Accounting Finance and Tax. Huelva.

Szymanski Sunal, Karr, Ch.L. y Sunal, D. W. (2003): "Fuzzy logic, neural networks, genetic algorithms: Views of three artificial intelligence concepts used in modeling scientific systems" School Science and Mathematics. Volume 103, issue 2 (feb.) pp. 81-91. Bowling Green.

Valls Pinós, J.R. (1999): La gestión de cobros. Fundación Confemetal. Madrid.

Wasserman, Ph.D.: (1989) Neural Computing: Theory and Practice. Van Nostrand Reinhold, Nueva York.

Partes: 1, 2
Página siguiente