- Resumen
- Necesidad de la estandarización de direcciones postales
- Resultados del estudio realizado a las direcciones postales
- Definición de los HMM internos
- Conclusiones
- Bibliografía
Resumen
En este trabajo se explican los resultados de la caracterización de las direcciones postales almacenadas en una base de datos de una organización empresarial. Se propone una estructura para las direcciones postales que contiene los elementos necesarios para posibilitar una segmentación más ajustada a los intereses de la organización estudiada.
Se propone un Modelo Oculto de Markov externo para las direcciones postales de esa organización, así como los Modelos Ocultos de Markov internos para cada uno de los elementos que componen la estructura de una dirección postal. La totalidad del estudio realizado representa un avance en la configuración de un procedimiento para segmentar correctamente las direcciones, como paso previo para conformar con estas un Almacén de Datos confiable, eficiente y eficaz.
Palabras clave: Limpieza de datos, Modelos Ocultos de Markov, HMM.
La estandarización de direcciones postales es una necesidad para cualquier organización, sobre todo para aquellas que tienen un alto número de clientes, usuarios, estudiantes, etc. En el caso particular de la organización que es motivo de este estudio, las direcciones postales de sus clientes se emplean para:
- La distribución de las facturas (cuentas a cobrar) a domicilio y a otras organizaciones.
- El estudio de la densidad de clientes por área geográfica, para elaborar planes para nuevas inversiones y la instalación de nuevos servicios.
- La instalación de nuevos servicios y la atención a las reclamaciones e interrupciones del servicio.
- La realización de estudios de mercado, planes de inversiones y presupuestos.
- La realización de gestión de venta.
- Las visitas a clientes morosos o deudores de sus facturas.
De todo lo anterior se desprende que para esta organización es de vital importancia tener una lista de direcciones postales limpia y normalizada, además segmentada en sus elementos, para poder utilizarlas con mayor eficiencia.
El estudio realizado por la autora de este trabajo a una muestra importante de las direcciones postales almacenadas en la base de datos de la organización en cuestión, llevó a dos resultados significativos:
- La propuesta de una estructura única para todas las direcciones almacenadas.
- El resumen de las características de cada uno de los elementos que componen la estructura propuesta.
La propuesta de estructura para las direcciones postales está conformada por los siguientes elementos:
Dirección::= [<Calle>] [<Km>] [<Casa>] [<Entre Calle 1><y/e><Entre Calle 2>] [<Esquina>] [<Edificio>] [<Piso>] [<Escalera>] [<Apartamento>] [<Reparto>] [<Municipio>] [<Zona Postal>] [<Código Postal>] [<Provincia>]
<Calle>::= [<Prefijo de calle>] <Secuencia de identificadores> [<Punto Cardinal>]
<Prefijo de calle>::= Calle | Avenida | Carretera | Camino | Callejón
Página siguiente |