Descargar

Modelo Oculto de Markov aplicado a Direcciones Postales


Partes: 1, 2

    1. Resumen
    2. Necesidad de la estandarización de direcciones postales
    3. Resultados del estudio realizado a las direcciones postales
    4. Definición de los HMM internos
    5. Conclusiones
    6. Bibliografía

    Resumen

    En este trabajo se explican los resultados de la caracterización de las direcciones postales almacenadas en una base de datos de una organización empresarial. Se propone una estructura para las direcciones postales que contiene los elementos necesarios para posibilitar una segmentación más ajustada a los intereses de la organización estudiada.

    Se propone un Modelo Oculto de Markov externo para las direcciones postales de esa organización, así como los Modelos Ocultos de Markov internos para cada uno de los elementos que componen la estructura de una dirección postal. La totalidad del estudio realizado representa un avance en la configuración de un procedimiento para segmentar correctamente las direcciones, como paso previo para conformar con estas un Almacén de Datos confiable, eficiente y eficaz.

    Palabras clave: Limpieza de datos, Modelos Ocultos de Markov, HMM.

    1. Necesidad de la estandarización de direcciones postales.

    La estandarización de direcciones postales es una necesidad para cualquier organización, sobre todo para aquellas que tienen un alto número de clientes, usuarios, estudiantes, etc. En el caso particular de la organización que es motivo de este estudio, las direcciones postales de sus clientes se emplean para:

    De todo lo anterior se desprende que para esta organización es de vital importancia tener una lista de direcciones postales limpia y normalizada, además segmentada en sus elementos, para poder utilizarlas con mayor eficiencia.

    1. Resultados del estudio realizado a las direcciones postales.

    El estudio realizado por la autora de este trabajo a una muestra importante de las direcciones postales almacenadas en la base de datos de la organización en cuestión, llevó a dos resultados significativos:

    1. La propuesta de una estructura única para todas las direcciones almacenadas.
    2. El resumen de las características de cada uno de los elementos que componen la estructura propuesta.

    La propuesta de estructura para las direcciones postales está conformada por los siguientes elementos:

    Dirección::= [<Calle>] [<Km>] [<Casa>] [<Entre Calle 1><y/e><Entre Calle 2>] [<Esquina>] [<Edificio>] [<Piso>] [<Escalera>] [<Apartamento>] [<Reparto>] [<Municipio>] [<Zona Postal>] [<Código Postal>] [<Provincia>]

    <Calle>::= [<Prefijo de calle>] <Secuencia de identificadores> [<Punto Cardinal>]

    <Prefijo de calle>::= Calle | Avenida | Carretera | Camino | Callejón

    Partes: 1, 2
    Página siguiente