13 Agenda Aspectos Fundamentales sobre Gestión Documental. Digitalización. Aspectos Fundamentales Proceso de digitalización Tipos de Escáner. Tipología de documentos. Fotografía Digital. Conclusiones
14 Aspectos Fundamentales de la Digitalización Formato de las Imágenes
Resolución de las Imágenes
Calidad de las Imágenes
Compresión de las Imágenes
OCR: La conversión de documentos escritos a documentos electrónicos
15 1. Formato de las Imágenes
Algunos de los factores que se debe tener en cuenta a la hora de elegir un formato de archivo para visualización son los siguientes: Resolución. Calidad de imagen. Cantidad de memoria que ocupa. Nivel de compresión. Hay múltiples formatos de archivo disponibles en el mercado. Podemos saber el formato de una imagen gracias a su extensión. Estos son algunos de los más utilizados: TIFF: mejor resolución y compatible con IBM y Mac. GIF y JPEG: los más comunes para las imágenes de acceso Web. PDF: se usa frecuentemente para imprimir y ver documentos de múltiples páginas.
16 1. Formato de las Imágenes
17 2. Resolución de las Imágenes
Es el número de píxeles mostrados en la imagen por las unidades de longitud. Normalmente se mide en Píxeles por Pulgada (ppi), aunque también es muy habitual medirla en Puntos por Pulgada (dpi) La resolución es directamente proporcional al numero de Píxeles que se usen para representar cada unidad de área. La resolución, en ocasiones, marca la calidad de la imagen, aunque para determinar la resolución de una imagen hay que tener en cuenta el medio de distribución final. Imagen de alta resolución:
Mayor número de píxeles para representar cada unidad. Reproduce más detalle Hay transiciones de color más sutiles.
Imagen de baja resolución:
Menor número de píxeles para representar cada unidad. Reproduce menos detalles. Hay menos transiciones de color.
18 EJEMPLO Escaneado de una página de 8 x 10 pulgadas a 200 ppp. Esta página sólo se va a leer en un monitor de ordenador. 90% de los píxeles han sido desechados. La imagen se ajusta pero el texto ya no se lee.
3. Calidad de las Imágenes
La calidad de las imágenes no siempre viene representada por el uso de una resolución mayor. Para obtener una buena calidad lo primero es tener en cuenta el tipo de documento escaneado. Los píxeles sólo representan la información que tiene el documento. No hay que pensar que por muchos ppp que se le pongan a un documento va a tener mejor calidad. Actualmente, los software gráficos permiten retocar las imágenes con el finalidad de mejorar los documentos originales: se puede eliminar manchas oscuras, limpiar fondos, dar nitidez al texto.
19 4. Memoria que ocupa una imagen
La memoria que ocupan los documentos está en relación con la resolución que se utilice en el escaneado de los documentos. A continuación se muestra una tabla que resume la cantidad de memoria que ocupan algunos documentos a diferentes resoluciones y colores:
20 4. Memoria que ocupa una imagen Imagen de 24 KB en formato JPEG. Tamaño medio
21 FOTO DE 24 MB
22 5. Compresión de las Imágenes Tiene la finalidad de reducir el tamaño de los archivos para facilitar su almacenamiento, procesamiento y transmisión. Existen técnicas de compresión estándar y patentadas. Se recomienda usar técnicas estándar porque son totalmente compatibles con cualquier software de recuperación. Se caracteriza por tener o no tener pérdida de información del documento original Compresión sin pérdida: no desecha información, y por tanto cuando se descomprime la imagen es idéntica al original. (Utilizado para el escaneado bitonal) Compresión con pérdida: compensa o desecha información menos importante basada en un entendimiento de la percepción visual. (Utilizado para el escaneado tonal).
23 6. OCR OCR (Optical Character recognition) : Software de reconocimiento óptico de caracteres. Convierte una documento escaneada en texto.
Ventajas: Posibilita las búsquedas a texto libre por todo el texto del documento. Indización automática: puede directamente capturar información del texto. Se puede manipular, corregir o insertar comentarios, como a cualquier documento de texto normal. Inconvenientes: Tiene muchas limitaciones. No reconoce documentación escrita, o por lo menos en bajo porcentaje. Necesita un tiempo de entrenamiento bastante importante. El nivel de éxito no es muy alto incluso con softwares muy potentes.
24 Agenda Aspectos Fundamentales sobre Gestión Documental. Digitalización. Aspectos Fundamentales Proceso de digitalización Tipos de Escáner. Tipología de documentos. Fotografía Digital. Conclusiones
25 1. Preparación de los Documentos 2. Proceso de Escaneado 3. Indización de los Documentos 4. Grabación de las imágenes Proceso de Digitalización
26 1. Preparación de los documentos
En esta fase se deben realizar fundamental estas dos tareas:
Limpiar los documentos de elementos externos y acomodarlos para poder ser escaneados: Quitar grapas, clips, marcos de las diapositivas, etc. Desdoblar los documentos. Separar los documentos por lotes para ser procesados más fácilmente. Los criterios para separar los documentos pueden ser: Tamaños y formatos Características de los documentos como por ejemplo, el color o si están impresos o manuscritos. Resoluciones
27
Escaneado de los documentos: Los documentos se introducen en las unidades de captura (caso de escáner de alto volumen) Se supervisa que la entrada de documentos se haga de una forma correcta. Se revisa la calidad con la que salen las imágenes que se van procesando. Finalizado el proceso, se vuelve a colocar los documentos en su estado original.
Tratamiento de la imágenes por medio de software especializados. Estos softwares permiten: Visualizar las una imágenes ya digitalizadas. Manipular las imágenes ya sea para mejorar su calidad, modificar su contenido o cambiar su apariencia. Las parametrizaciones habituales son: Formato de la imagen: Resolución o tamaño que se quiere conseguir. Color de la imagen: B/N, color o escala de grises. Página a doble cara o sencilla, etc.
2. Proceso de Digitalización
Una vez digitalizadas las imágenes, lo más habitual es someterlas a un proceso de indización. Existen varios fundamentalmente tres formas de indizar: Indización manual: una vez que la imagen ha sido procesada, se sacan los términos clave por los que luego va a ser recuperado el documento. Captura de índices de forma automática: se entrena al escáner para que capture algunos términos que siempre se encuentran en el mismo lugar de la páginas (muy útil en formularios). Para esto hay que someter los documentos a un OCR. Marcadores: Sólo en el caso de que la imagen se encuentre en formato PDF. Este sistema te permite poner un marcadores en las palabras por las que se quiere recuperar el documento. 3. Indización de los Documentos
29
El dispositivo de grabación se elegirá en función de: Uso posterior de las imágenes Frecuencia con la que se vayan a consultar las imágenes Volumen de documentos escaneados y peso de los mismos. Tipo de acceso que se desea tener: on line / off line. Los dispositivos más utilizados son: CD-ROM DVD Cintas magnéticas Servidores 4. Grabación de las imágenes
30 Agenda Aspectos Fundamentales sobre Gestión Documental. Digitalización. Aspectos Fundamentales Proceso de digitalización Tipos de Escáner. Tipología de documentos. Fotografía Digital. Conclusiones
31 Tipos de Escáner
32 Agenda Aspectos Fundamentales sobre Gestión Documental. Digitalización. Aspectos Fundamentales Proceso de digitalización Tipos de Escáner. Tipología de documentos. Fotografía Digital. Conclusiones
33 Tipología de Documentos
34 Agenda Aspectos Fundamentales sobre Gestión Documental. Digitalización. Aspectos Fundamentales Proceso de digitalización Tipos de Escáner. Tipología de documentos. Fotografía Digital. Conclusiones
35 Fotografía Digital Entendemos por Fotografía Digital aquellas tomadas con cámaras digitales. Tiene gran aceptación por parte de los profesionales.
El formato digital se basa en el almacenamiento de la imagen mediante dígitos. Se mantendrá inalterable a lo largo del tiempo. La reproducción puede ser repetida tantas veces como se desee. Los duplicados son de la misma calidad que los originales. Se pueden realizar retoques informáticos.
Es una tecnología relativamente inmadura. La calidad es suficiente para la mayoría de los trabajos profesionales pero es inferior a la que se puede conseguir con materiales químicos. VENTAJAS INCONVENIENTES
36 Agenda Aspectos Fundamentales sobre Gestión Documental. Digitalización. Aspectos Fundamentales Proceso de digitalización Tipos de Escáner. Tipología de documentos. Fotografía Digital. Conclusiones
37 Conclusiones La digitalización es una herramienta muy útil dentro de un Sistema de Gestión Documental.
Para llevar a cabo la digitalización es necesario realizar un estudio previo que nos permita saber:
– Qué es lo que queremos digitalizar (tipos de documentos, tamaños, etc.) – Cómo lo vamos a digitalizar (resolución, formato, calidad, etc.) – Para qué vamos a digitalizar (acceso más rápido, archivado menos costoso, etc.)
38 Conclusiones Los principales beneficios de la digitalización son:
– Acceso mucho más rápido a la documentación. – Ahorro de espacio físico en las oficinas. – Copia de la documentación original, inalterable a lo largo del tiempo.
La digitalización es un proceso costoso y complicado ya que requiere de una buena tecnología: software y hardware.
Página anterior | Volver al principio del trabajo | Página siguiente |