Manual de referencia para CDS-ISIS (página 3)
Enviado por Ing.+ Licdo. Yunior Andrés Castillo Silverio
- FST de Reformateo
Este parámetro es opcional. Si se deja en blanco, los campos en el archivo de salida mantendrán sus etiquetas y su contenido. En forma alterna, puede realizarse cierto grado de reformateo suministrando el nombre de una FST.
Cuando se usa para reformateo, la FST se interpreta de la manera siguiente:
Cada línea de la FST representa un campo de salida;
A cada campo de salida se le asigna una etiqueta ISO igual al identificador de campo definido en la línea correspondiente de la FST.
El formato de extracción de datos incluido en la FST define el contenido del campo. En este formato, se deben usar las etiquetas CDS/ISIS de los campos según se definieron para la base de datos. Cada línea producida por el formato (o cada elemento, si la FST especifica las técnicas de indizado 2, 3 o 4) generará una nueva ocurrencia del campo de salida.
Supóngase por ejemplo que la base de datos contiene los campos siguientes:
1 Autor (repetible) 2 Título 3 Palabras clave (repetible) 4 Notas Una FST para reformateo para este archivo podría ser la siguiente:
1 0 mfn [el campo de salida 1 contendrá el MFN] 100 0 (v1/) [el campo de salida 100 será igual que el campo de entrada 1 (nótese el uso de un grupo repetible en el formato, para generar en la salida cada ocurrencia del campo 1, como una línea separada)] 200 0 v2 [el campo de salida 200 será igual al campo de entrada 2] 300 0 |<|v3|>| [el campo de salida 300 contiene las palabras clave encerradas entre <..>; cada palabra clave será tomada de una ocurrencia del campo de entrada 3] Nótese que como ninguno de los formatos se refiere al campo 4, este no será exportado. Puede entonces usarse una FST para reformateo con objeto de exportar sólo determinados campos.
- Renumerar registros desde MFN
Es posible reasignar un MFN a los registros de salida, iniciando desde un número seleccionado por el usuario que se especifica en este campo. Si se deja este dato en blanco, los registros de salida retienen su MFN original.
Esta opción sólo afecta al archivo de salida ISO. Los registros de la base de datos no sufren modificación. Nótese sin embargo, que esta opción sólo tiene efecto si se exporta el MFN como uno de los campos de salida a través del uso de la opción Campo de salida con MFN explicada a continuación.
- Campo de salida con MFN
Puede exportarse el nº de MFN como un campo en el archivo de salida, asignando aquí una etiqueta de salida. Ha de hacerse así ya que el nº de MFN no corresponde a ningún campo de la base de datos que se está exportando (no tiene etiqueta y no está definido en la FDT). Puede también exportarse el nº de MFN por medio de una FST de Reformateo como se indicó arriba.
- Tabla de conversión Gizmo
Este recuadro puede contener el nombre de una tabla de conversión Gizmo para ser usada en la exportación.
Nota: Esta herramienta no está implementada en esta versión.
Ventana de diálogo de Mantenimiento del Archivo Inverso La Ventana de diálogo de Mantenimiento del Archivo Inverso se despliega en respuesta al comando Actualizar I/F del menú Base de Datos.
Figura 6-Erreur! Argument de commutateur inconnu. : Ventana de diálogo de Mantenimiento del Archivo Inverso
- Actualizar
Esta opción actualiza el Archivo Inverso de todos los registros del Archivo Maestro cuya actualización esté pendiente, es decir de los registros añadidos, borrados o modificados desde la última actualización del Archivo inverso.
- Generación completa del Archivo Inverso
Esta opción genera totalmente el archivo inverso para una base de datos. Normalmente esta opción no se utiliza, a menos de que sea realmente necesario. Por ejemplo siempre que se quiera cambiar el contenido del diccionario mediante el cambio de la FST para archivo inverso, entonces debe regenerarse el archivo inverso. Si no se hace esto, se introducirán inconsistencias en la base de datos, ya que los registros agregados o modificados después del cambio de la FST quedarán invertidos de manera diferente a los que se generaron antes del cambio.
Nótese sin embargo, que hay casos que no requieren una inversión total, aunque se haya modificado la FST. Supóngase por ejemplo que se decidió agregar un nuevo campo a la base de datos. Esto requiere una modificación a la FDT, y puede requerir un cambio en la FST si se desea que ese campo sea recuperable. Sin embargo, ninguno de los registros de la base de datos contiene todavía datos para este campo, y por lo tanto, una inversión total no es necesaria en este caso, siempre y cuando se haga el cambio de la FST antes de modificar o añadir los registros que contengan el nuevo campo.
El proceso de generación del archivo invertido consta de tres pasos:
1. Creación del archivo de ligas (Archivo link); 2. Clasificación del archivo de ligas; 3. Carga del archivo de ligas clasificado al archivo invertido. El archivo de ligas (link file) contiene toda la información necesaria para generar el archivo invertido, y se genera de acuerdo a la FST para archivo invertido definida para la base de datos. Contiene un registro para cada pareja término de búsqueda / apuntador (posting) a ser incluida en el archivo invertido. Por razones de eficiencia, en realidad se crean dos archivos de ligas: uno que contiene los términos de hasta 10 caracteres de longitud, y el otro contiene los términos de más de 10 caracteres.
El segundo paso en la generación del archivo invertido, clasifica el archivo de ligas en orden alfabético. El propósito de esta clasificación es agrupar todos los apuntadores (posting) relacionados con cada término de búsqueda, en preparación del último paso, que carga el archivo de links ya clasificado al archivo invertido.
Estos tres pasos pueden también ser realizados uno a uno, utilizando las opciones Crear archivos link, Ordenar Archivos link y Leer archivos link, en ese orden.
Esta posibilidad se ofrece para bases de datos muy grandes, donde la generación total del archivo invertido puede requerir un tiempo relativamente largo, y bastante espacio en disco. En este caso, no debe realizarse ningún cambio al archivo maestro (agregar, modificar o eliminar ningún registro) hasta que se haya terminado el último paso.
Debe tenerse presente que CDS/ISIS no borra automáticamente los archivos de ligas (LN1, LN2, LK1 y LK2). El usuario puede borrarlos manualmente en cualquier momento después de terminar la generación del archivo invertido, o en caso de haber realizado la generación en las tres etapas por separado, pueden borrarse los archivos de links sin clasificar (LN1 y LN2) después de ejecutar la opción Ordenar Archivos link y antes de ejecutar la opción Leer archivos link.
Antes de iniciar la generación, puede indicarse a CDS/ISIS el rango de MFN a ser invertido utilizando los recuadros al efecto (por defecto aparece desde MFN 1, hasta MFN 9999999, es decir, todos); Si se especifica un rango, p.ej. 1/10, sólo se invertirán los registros indicados, y estos serán los únicos recuperables por medio del archivo invertido. Esta posibilidad deberá ser usada sólo para probar la FST para inversión. CDS/ISIS mantiene al usuario informado acerca del paso que se esté ejecutando, mostrando la siguiente pantalla.
- Reinicialización del Archivo Inverso
Esta opción borra el contenido del archivo inverso y reasigna a todos sus archivos asociados a un tamaño mínimo. Puede necesitarse el uso de esta opción antes de la generación completa del archivo inverso.
- Crear archivos link
Esta opción genera el archivo de ligas según se ha explicado anteriormente.
- Ordenar Archivos link
Esta opción ordena los archivos producidos por la opción anterior. Los archivos de ligas ordenados pueden ser leídos entonces usando la opción Leer archivos link.
El proceso de ordenación para cada archivo de ligas (términos cortos y largos) es el mismo. Durante la primera etapa, llamada fase 0, los registros del archivo de ligas son ordenados en grupos tan grandes como puedan caber en la memoria. Si el archivo de ligas completo cabe en memoria, la ordenación finaliza después de la fase 0. En otro caso los grupos ordenados son distribuidos en cuatro archivos de trabajo temporales y fusionados después. Dependiendo del número de registros, pueden realizarse una o más etapas de fusión, llamadas fase 1, 2, etc., produciéndose en cada etapa grupos de registros ordenados de tamaño creciente, hasta que se obtiene un único grupo.
- Leer archivos link
Esta opción crea el Archivo Inverso a partir de los archivos de ligas clasificados. Esta opción ha de usarse después de la etapa de clasificación anterior para la generación completa del Archivo Inverso.
- Desde MFN … a MFN
Puede indicarse aquí un rango de registros para ser invertido. Normalmente esta opción solo se usará para comprobación de la Tabla de Selección de Campos (FST). Si se introduce un rango de registros, solo ellos serán invertidos al diccionario, y solo ellos serán buscables.
Ventana de Diálogo Adiciones Globales
Figura 6-Erreur! Argument de commutateur inconnu. : Ventana de Diálogo Adiciones Globales
- Rango MFN (de/a)
Si se ha elegido el comando Añadir Campo (Rango) indique aquí los números de MFN inferior y superior de los registros a los que se quiera aplicar la operación. p.ej. : 1/20. Si se ha elegido el comando Añadir Campo (Búsqueda), CDS/ISIS indicará aquí el número del conjunto de búsqueda seleccionado.
- Etiqueta de Campo
Indicar la etiqueta del campo en el que se quiere añadir información.
- Contenido del campo
Teclear aquí el texto que se quiere añadir al campo.
- Botón OK
Pulsando el ratón sobre este botón se inicia la operación.
- Botón Cancelar
Pulsando el ratón sobre este botón se cancela la operación.
Ventana de diálogo Borrados Globales
Figura 6-Erreur! Argument de commutateur inconnu. : Ventana de diálogo Borrados Globales
- Rango MFN (de/a)
Si se ha elegido el comando Borrados Globales (Rango) indique aquí los números de MFN inferior y superior de los registros a los que se quiera aplicar la operación. p.ej. : 1/20. Si se ha elegido el comando Borrados Globales (Búsqueda), CDS/ISIS indicará aquí el número del conjunto de búsqueda seleccionado.
- Etiqueta del Campo
Indique aquí la etiqueta del campo a ser borrado.
- Botón OK
Pulsando el ratón sobre este botón se inicia la operación.
- Botón Cancelar
Pulsando el ratón sobre este botón se cancela la operación.
Ventana de diálogo Reemplazar Campo
Figura 6-Erreur! Argument de commutateur inconnu. : Ventana de diálogo Reemplazar Campo
- Intervalo
Especifique aquí bien el rango de los números de MFN que deberán ser modificados, seleccionando Límites de MFN y escribiendo el MFN menor y mayor separados por "/", p.ej. 1/100; o bien una búsqueda anteriormente realizado seleccionando Conjunto de búsqueda, y eligiendo entonces la búsqueda sobre la que se quiere realizar la operación de la lista de búsquedas que aparecerá al oprimir el botón En este caso se puede obligar a que la operación de reemplazar texto se aplique exclusivamente sobre los registros marcados en la referida búsqueda marcando con el ratón sobre el recuadro Registros Marcados.
- Texto a encontrar
Escriba aquí el texto que quiere reemplazar.
- Nuevo texto
Escriba aquí el nuevo texto que quiere que aparezca en los registros seleccionados. Si se deja vacío el Texto a encontrar será borrado.
- Opciones
Marque cualquiera de las siguientes opciones si es el caso:
Coincidir mayúsculas: Se buscará el texto tal cual figure en el recuadro Texto a encontrar. Si no se marca, la sustitución se realizará independientemente de que el texto encontrado esté en mayúsculas o minúsculas; Solo palabras completas: Solamente se reemplazará el texto cuando éste se encuentre precedido y seguido de espacios en blanco o se encuentre al principio o la final del campo (o subcampo).
- Alcance
Si se desea que el cambio se realice exclusivamente en determinados campos indique en recuadro Etiquetas la(s) correspondiente(s) etiqueta(s) de campo, hasta un máximo de 10, en el recuadro de etiquetas separados por coma (p.ej. 100,110,120). Si se desea realizar el cambio solo en determinados subcampos indique en el recuadro Subcampos el código de subcampos adecuados (p.ej. ab).
Ventana de diálogo Impresión La ventana de diálogo de impresión consta de cinco fichas: General Donde se determina lo que se quiere imprimir, donde se quiere imprimir y el formato que se usará en la impresión; Presentación Donde se definen títulos, encabezamientos y pies de páginas de su documento; Márgenes Donde se indica el área de impresión de sus páginas; Orientación Donde se indica la orientación de sus páginas así como los números de páginas y de columnas; Clasificación Donde de definen los criterios de clasificación de los registros que se imprimirán.
Instrucciones para la preparación de la impresión A continuación se indican algunas líneas básicas para la preparación de un proceso de impresión, al mismo tiempo que se ponen de relieve algunas de las más destacadas posibilidades de CDS/ISIS en sus herramientas de impresión y clasificación (se da una descripción más detallada de cada una de ellas en las siguientes secciones).
En la ficha "General":
? Se define los registros que serán impresos: Se pueden imprimir todos los registros de la base de datos completa o bien un rango específico de registros, indicando los límites de número de registro (MFN) que se quieren imprimir. Alternativamente se pueden imprimir los registros recuperados en una búsqueda anterior, o incluso solo los marcados de entre ellos.
? Se define que campos de los registros serán impresos y en que forma: Ello se especifica a través del formatos indicado en el campo Formato de Impresión de esta ficha. Se puede usar un formato predefinido o indicar uno nuevo directamente.
? Se define el destino del proceso de impresión: Se puede indicar que la salida se realice directamente a la impresora por defecto, o indicar que se realice en un archivo de disco, eligiendo la opción adecuada en el campo Salida a de ésta ficha. Si se desea que la salida se realice directamente a la impresora debemos asegurarnos de los siguientes extremos: La impresora está lista y conectada; la parametrización de la misma es la adecuada para su trabajo, y haya suficiente papel disponible.
En la ficha de Presentación:
? Se definen títulos para los informes: Se pueden definir hasta tres líneas de títulos que será impresas al principio de la salida, alguna de las cuales pueden figurar como encabezamiento en todas las páginas que ocupe el proceso de impresión.
En las fichas de Márgenes y Diseño:
? Se define el formato de página: Se proporciona control total sobre márgenes, sangría, tamaño de papel, encolumnado, numeración de páginas, etc., indicando los valores apropiados en cada apartado.
En la ficha de Clasificación:
? Se define la secuencia de salida (ordenación): Por medio de la hoja de trabajo de clasificación se define la secuencia exacta en que quieren imprimirse los registros seleccionados. Estos pueden ordenarse virtualmente por cualquier combinación de campos y subcampos.
? Se definen los encabezamientos: El o los campos utilizados en la ordenación de los registros pueden ser utilizados como encabezamientos. Por ejemplo, si se ha ordenado una salida por el campo autor, los registros son ordenados en orden alfabético del contenido de dicho campo. Si además hemos seleccionado dicho campo como encabezamiento, se imprimirá el contenido de dicho campo una vez delante del conjunto de los registros de dicho autor. La ficha de Clasificación permite también si la salida tendrá encabezamientos o no, y si los tiene, el número de niveles de encabezamientos deseado. Se puede, por ejemplo, ordenar una lista de artículos de congresos por lugar (primer nivel), fecha (segundo nivel) y nombre del congreso (tercer nivel).
De acuerdo a los parámetros suministrados CDS/ISIS procederá de la siguiente forma (las etapas 1-3 serán obviadas si no se indica ningún criterio de clasificación):
1. Utilizando la información indicada en la ficha de Clasificación primero se creará un archivo hit que contendrá los criterios de clasificación y encabezamientos;
2. A continuación se ordenara dicho archivo;
3. Utilizando el archivo hit ordenado como control, para cada registro de éste archivo comprueba si han cambiado uno o más de los encabezamientos; de ser así formatea e imprime los encabezamientos requeridos de acuerdo al formato proporcionado o al formato de encabezamiento por defecto;
4. Entonces imprime el correspondiente registro del archivo maestro de acuerdo al formato que se haya definido. Una excepción a esto es cuando se indica * en lugar de un formato de impresión, según se comenta más adelante.
Ventana de diálogo de Impresión (General)
Figura 6-Erreur! Argument de commutateur inconnu. : Ventana de diálogo de Impresión (General)
- Qué Imprimir
Todos los registros de la última búsqueda Seleccione esta opción si quiere imprimir el conjunto de registros que estuviera visualizando justo antes de entrar a la ventana de diálogo de impresión. Si estaba viendo el resultado de una búsqueda (llamado también conjunto de búsqueda), se puede elegir el imprimir solamente los registros marcados, si los hubiera, marcando la opción Solo los registros marcados.
Intervalo de MFN Marcando ésta opción se puede indicar el/los intervalo/s de registros a imprimir. Dicho intervalo puede ser indicado en la forma:
n Se imprime solo el registro de MFN = n -n Imprime los n primeros registros n- Imprime todos los registros a partir del n-simo (n incluido) n-m imprime los registros de nº de MFN = n al de MFN = m (ambos incluidos) Se pueden concatenar intervalos utilizando comas, p.ej.:
-10,15,20-30,50- con lo que se imprimirán los primeros 10 registros, el 15, del 20 al 30 y los registros a partir del de MFN 50 (incluido).
- Salida a
Después de haber indicado que es lo que se va a imprimir, se debe indicar el dispositivo de salida. CDS/ISIS le ofrece las siguientes opciones:
Impresora La salida será impresa por la impresora por defecto de Windows.
Archivo postscript La salida se graba en un archivo output.ps en el directorio de trabajo de CDS/ISIS (parámetros 5 del archivo syspar.par).
Archivo ASCII (ANSI) La salida será grabada en un archivo de texto en formato ASCII utilizando el juego de caracteres definido para Windows.
Archivo ASCII (OEM) La salida será grabada en un archivo de texto en formato ASCII utilizando el juego de caracteres definido para MS-DOS.
Cuando se elige la opción de impresión a un archivo, CDS/ISIS le pedirá que indique el nombre de dicho archivo por medio de una ventana de diálogo Guardar Archivo justo antes de empezar el proceso de impresión (al pulsar el botón Imprimir).
- Formato de Impresión
En esta sección puede escogerse el formato de impresión adecuado de entre los formatos predefinidos. El recuadro Formato pre-definido indica si el formato que aparece debajo corresponde realmente al formato de impresión indicado en el recuadro de selección. Se ha previsto así porque ésta versión de CDS/ISIS le permite modificar en la ventana de edición de formatos un formato preexistente antes de proceder a la impresión. Tras realizar un cambio en un formato puede decidir salvar los cambios realizados en el mismo o en un nuevo formato pulsando el correspondiente botón de guardar Si la salida a impresora que se va a realizar es un índice, pueden elegirse dos opciones:
? Para imprimir uno o varios elementos dato de cada registro bajo su correspondiente encabezamiento se debe especificar en el recuadro de edición de formatos los elementos a imprimir; o
? Para imprimir solo una breve referencia a los registros bajo cada encabezamiento (p.ej. su MFN) escriba un asterisco (*) en vez de un formato de impresión. En éste caso en lugar de imprimir el registro del archivo maestro, CDS/ISIS imprime el último nivel de encabezamiento (separando con una coma cada ocurrencia y con una sangría definida en el parámetro de sangría). Esta facilidad está preparada para producir índices compactos en los cuales solo se da una breve referencia de cada registro, como puede ser su número de registro (MFN). Téngase en cuenta que cuando se utiliza ésta opción se deben definir como mínimo dos claves de clasificación.
- Botón Recuperar
Oprima éste botón para recuperar una hoja de trabajo de impresión previamente salvada.
- Botón Archivar
Guarda todos los parámetros definidos en la presente hoja de trabajo de impresión.
- Botón Vista Previa
Oprimiendo este botón se despliega en su pantalla la primera página de su documento con un ejemplo de la impresión definida.
Ventana de diálogo de Impresión (Presentación)
Figura 6-Erreur! Argument de commutateur inconnu. : Ventana de diálogo de Impresión (Presentación) Esta ficha le permite definir para su documento títulos, encabezamientos y pies de página. En la parte superior el recuadro de selección Editar indica qué elemento se está editando en recuadro de edición (debajo de la ficha, sobre los botones Imprimir, Ayuda y Cancelar). Se pueden editar y definir así cualquiera de los siguientes componentes seleccionándolos del recuadro Editar: Primer, Segundo y Tercer título, Pié y Encabezamiento de página. Para cada título de su documento puede escoger:
Utilizar el título como cubierta Título en todas las páginas Disponible sólo para el tercer título.
Alineación del título Se puede definir: Alineación izquierda, Centrado y Alineación derecha.
Tipo de letra del título Se puede elegir la fuente adecuada para cada título utilizando el recuadro de selección correspondiente.
Tamaño de fuente Se puede variar el tamaño de la fuente de cada uno de los títulos utilizando el recuadro de selección correspondiente.
Estilo de caracteres Se puede definir para cada título su estilo entre Itálica (i), Negrita (B) y Subrayado (u), o sus combinaciones.
Ventana de diálogo de Impresión (Márgenes)
Figura 6-Erreur! Argument de commutateur inconnu. : Ventana de diálogo de Impresión (Márgenes) En esta ficha se pueden definir los márgenes a usar en la salida así como otros parámetros relacionados.
- Márgenes
Los márgenes que se pueden definir son los siguientes:
Superior: Espacio entre el principio de la página y la primera línea impresa; Inferior: Espacio entre el final de la página y la última línea impresa; Izquierdo margen izquierdo Derecho margen derecho Sangría espacio extra a añadir a la izquierda del elemento a imprimir
- Unidades de Medida
Define las unidades de medida a usar en los distintos márgenes. Se pueden escoger entre: Milímetros, Centímetros, Pulgadas y Twips.
- Tamaño del Papel
Define el tamaño de papel a usar.
- Sangría de datos
Normalmente, éste parámetro deberá especificarse cuando se utilicen encabezamientos. Indica el sangrado de cada nivel de encabezamiento con respecto al de nivel anterior y el de los registros con respecto al último.
- Tolerancia EOC (Fin de Columna)
Este parámetro indica el mínimo número de líneas que deberán estar disponibles en la columna o página actual antes de imprimir un registro.
Ventana de diálogo de Impresión (Diseño)
Figura 6-Erreur! Argument de commutateur inconnu. : Ventana de diálogo de Impresión (Orientación)
- Número de Columnas
Número de columnas por página (1 – 6).
- Espacio entre Columnas
Espacio entre columnas (usando las unidades de medida seleccionadas)
- Sin Decorar
En las columnas no se imprimirán decoraciones adicionales tales como líneas verticales (o bordes)
- Líneas entre Columnas
CDS/ISIS dibujará una línea entre las columnas.
- Bordes
CDS/ISIS dibujará un borde alrededor de cada columna.
- Imprimir nº págs.
Marque este recuadro si quiere que CDS/ISIS imprima el número de página.
- Nº primera pág.
Usted puede decidir si desea que aparezca la numeración también en la primera página. La primera página no es la de cubierta (si está usando algún título como cubierta)
- Posición
Elija si prefiere que los números aparezcan en la parte superior o inferior de la página.
- Alineación
Elija "A la izquierda", "Centrado", "A la derecha", "Dentro" o "Fuera".
- Iniciar en
Primer número de pagina a usar.
- Aplicar Zoom
Este valor de Zoom (50-120%) afectará a la apariencia del formato de impresión de forma que pueda encajar más o menos registros en cada página sin cambiar los formatos de impresión.
- No usar títulos
Marcando este recuadro se ignorará cualquier información en la ficha de presentación.
- No clasificar
Marcando este recuadro se ignorará la ficha de clasificación.
Ventana de diálogo de Impresión (Clasificación)
Figura 6-Erreur! Argument de commutateur inconnu. : Ventana de diálogo de Impresión (Clasificación) Esta ficha define todos los parámetros relacionados con la clasificación y manejo de encabezamientos.
- Número de encabezados
Indíquese aquí el número de niveles de encabezamiento que de desea utilizar. Dicho número debe ser al menos igual al número de claves de clasificación especificadas (veasé abajo). Si no se indica nada, CDS/ISIS usará como número de niveles de encabezamiento el de claves de clasificación indicado.
El propósito principal de usar encabezamientos es el de ayudar al lector a encontrar la información requerida de un rápido vistazo: el sangrado de los encabezamientos salta a la vista, sugiriendo así intuitivamente la ordenación del listado. Como regla general, el número de encabezados debe ser uno menos del número de claves de clasificación especificado, y la última clave de clasificación deberá corresponder al primer elemento del dato a imprimir para cada registro. Por ejemplo, en un listado ordenado por autor (primer nivel de clasificación) y título (segundo nivel de clasificación) se deberá utilizar un solo nivel de encabezados. Sin embargo, no habría mucho problema en utilizar dos niveles de encabezamiento, dado que es muy improbable que un autor pueda escribir dos trabajos con el mismo título. En otro ejemplo, se puede ordenar un listado de comunicaciones de congresos por lugar de celebración (primer nivel de clasificación), fecha del congreso (segundo nivel), Título del Congreso (tercer nivel) y título del artículo (cuarto nivel), y usar tres niveles de encabezamiento (lugar, fecha y título del congreso); Las comunicaciones serán listadas entonces en orden alfabético de títulos, que podrán imprimirse como primer elemento de datos en su formato de impresión.
- Archivo de palabras vacías
Si en alguna de las Tablas de Selección de Campos (FST) usadas para generar las claves de clasificación (veasé más adelante), se utiliza la técnica de indizado 4 (indizado por palabras), puede desearse el uso de un fichero de palabras vacías, que contendrá una lista de palabras no significativas. En éste caso, indique aquí el nombre de dicho archivo a utilizar. CDS/ISIS ignorará las palabras contenidas en dicha lista para construir las claves de clasificación.
- Formato de encabezamientos
Se puede indicar aquí un formato para imprimir los encabezados. Dado que se crean los encabezados por medio de una FST, éstos no corresponderán necesariamente a los campos del registro actual (p.ej. un encabezamiento puede ser una única palabra en un campo). Por otra parte, el lenguaje de formateo (que puede ser utilizado para formatear indistintamente tanto encabezamientos como registros) no tiene comandos específicos para formatear encabezados; solo puede formatear campos o subcampos. Por ésta razón CDS/ISIS asigna a cada encabezado una etiqueta especial que puede ser usada entonces en el formato para referirse al encabezado.
Si se indica un formato de encabezamiento propio, debe tener en cuenta que en el momento de la impresión, CDS/ISIS realizará las siguientes acciones antes de la misma:
1. A cada encabezamiento se le asigna una etiqueta igual al identificador de campo especificado en la FST, usada para construir la correspondiente clave de clasificación (tenga en cuenta sin embargo, que cuando CDS/ISIS usa el formato de encabezamiento por defecto, reasigna a cada encabezamiento un número secuencial a partir de 1);
2. El actual encabezamiento es comparado entonces con el anterior y aquellos que no cambien se borran, ya que esto implica normalmente que no deben ser impresos. Por consiguiente debe usarse un formateo condicional para proporcionar el espacio requerido. Sin embargo, los encabezamientos no serán borrados, incluso aunque no cambien, si se ha especificado 2 o 3 en el indicador de Tipo de Encabezamiento en la correspondiente clave de clasificación.
Imagine por ejemplo que los identificadores de campo asignados a la primera y la segunda claves de clasificación son 1 y 2 respectivamente, el siguiente formato de encabezamiento puede usarse para obtener siempre una línea en blanco antes del primer nivel de encabezamiento y una línea en blanco antes del segundo nivel sólo cuando no haya habido cambios en el primero:
MHL,""#V1(0,4)/""#N1,V2(4,8) (fíjese en la utilización del falso campo N1 para producir la línea en blanco sólo cuando el primer encabezamiento se pierda).
Fíjese también que se indica su propio formato de encabezamiento, CDS/ISIS sólo usará el parámetro de sangría (indicado en la hoja de trabajo de impresión) para alinear los registros impresos debajo del último nivel de encabezamiento. Es por tanto su responsabilidad proporcionar cualquier sangría requerida para los propios formatos de encabezamiento. Si no se proporciona un formato de encabezamiento (es decir, si se deja el recuadro en blanco), CDS/ISIS proporcionará un formato por defecto del sistema como el siguiente:
MHL,""#V1(0,i)/""#V2(i,2i)/ . . . # Donde i es el valor que se asignó al parámetro sangría de datos en la hoja de trabajo de impresión, y V1, V2, etc… son el primer, segundo, etc… encabezamientos. El formato antes indicado dejará una línea en blanco delante de cada encabezamiento, y otra delante del primer registro impreso debajo del último nivel de encabezamiento.
- Parámetros de las claves de clasificación
Se pueden especificar hasta 4 claves de clasificación, que serán tratadas de forma jerárquica. La primera, o primaria, determina la secuencia de ordenación primaria, la segunda clave ordena aquellos registros que poseen la misma clave primaria, etc. Por ejemplo en un listado ordenado por autor (clave primaria) pueden ordenarse los registros pertenecientes a un mismo autor por el campo título especificando dicho campo como segunda clave de clasificación.
Debe tenerse en cuenta que existe una importante diferencia entre la clave primaria y las de orden superior. Cuando un determinado registro del archivo maestro no contenga información en el campo correspondiente a la primera clave de clasificación, dicho registro no aparecerá en el listado. Esto es lo que normalmente se espera: por ejemplo, un índice de autores solo incluirá entradas para aquellos registros que efectivamente tengan algún autor. Sin embargo, en aquellos casos en los que se desee asegurar que todos los registros seleccionados aparezcan realmente en su listado, deben proporcionarse alternativas adecuadas para aquellos registros en los que la clave primaria pueda no existir (la sentencia IF del lenguaje de formateo puede ser útil para este propósito). En cambio, los registros sin información en los campos correspondientes al segundo nivel de clasificación o superiores serán listados sin encabezamiento (es decir, aparecerán al principio de la lista correspondiente) e impresos normalmente.
Para cada clave de clasificación se deben proporcionar los tres parámetros descritos a continuación.
- Tabla de selección de Campo
Una tabla de selección de campo (FST) para clasificación define los contenidos de la clave de clasificación y al mismo tiempo, en su caso, de los correspondientes encabezamientos (recuerde, sin embargo, que debe definir más claves de clasificación que encabezamientos). La diferencia entre una clave de clasificación y el encabezamiento es que la primera se usa para listar los registros en el orden requerido, mientras que el segundo se usa para imprimir. Sin embargo, una clave de clasificación contiene la misma información que su correspondiente encabezamiento, esta información puede ser representada de diferente forma. Por ejemplo, una clave de clasificación estará siempre en mayúsculas; si el campo del cual ha sido extraída contiene información de clasificación, contiene la forma ordenable del campo. Por otra parte, un encabezamiento es extraído según se especifica, es decir, no es convertido a mayúsculas, en tanto en cuanto no se fuerce dicha conversión en el formato de la FST. Además, un encabezamiento siempre contiene la forma imprimible de en campo siempre que dicho campo contenga información para clasificación.
Las Tablas de Selección de Campos (FST) se discuten en detalle en el Manual de Referencia de Mini-micro CDS/ISIS (versión 3.0). Se puede proporcionar el nombre de una FST predefinida o escribir una directamente. Si se quiere utilizar una FST predefinida indique su nombre precedido del símbolo arroba (@). El símbolo @ le indica a CDS/ISIS que se trata de una FST distinta de la actual. Para escribir una FST, se deberán indicar sus tres componentes separados entre si por un espacio en blanco en el siguiente orden: Identificador de campo, técnica de indización y formato. En el caso de que se necesite indicar una FST que ocupe más de una línea, separe cada una de ellas con un signo + separado del resto por medio de espacios. A continuación se indican dos ejemplos de FST: La primera indica a CDS/ISIS que utilice una FST predefinida llamada AUTHOR; la segunda indica al sistema que cree una clave de clasificación a partir del contenido del campo 10 y una clave de clasificación por cada descriptor del campo 20:
@AUTHOR 1 0 V10 + 1 2 V20 En el segundo ejemplo, dado que la FST especifica dos líneas, todos los encabezamientos generados serán ordenados en una simple secuencia alfabética. En una FST multilínea se pueden usar diferentes identificadores de campo y técnicas de indización para cada línea, es decir:
1 0 V10 + 2 2 V20 Si en este último caso se especifica un formato de encabezamiento, dicho formato debe tener en cuenta las etiquetas definidas en la FST. Para la FST anterior, debe utilizarse V1 para referirse al campo 10 y V2 para referirse al campo 20. Esto puede utilizarse, por ejemplo, para imprimir el encabezamiento usando distintos tipos de fuentes, dependiendo del origen de la información. Como se ha mencionado anteriormente, si uno o más campos contienen información para clasificación, CDS/ISIS tendrá en cuenta esto mientras construye la clave de clasificación.
- Indicador del Tipo encabezamiento
Este parámetro determina si CDS/ISIS debe construir una clave de clasificación sencilla o una clave para cada elemento producido por la Tabla de Selección de Campos (FST). Además indica cuando un encabezamiento debe ser único, es decir, impreso solo cada vez que cambie, o bien impreso en todos los casos.
Puede especificarse lo siguiente:
0 (cero) o 2 para generar una sola clave; en este caso, la clave se construye a partir del primer elemento producido por la tabla de selección de campos. Por ejemplo, si se hace la clasificación por autor, puede usarse esta opción para especificar que sólo se desea usar al primer autor como clave de clasificación, y por lo tanto, que un registro dado debe solamente ser impreso bajo el primer autor; 1 o 3 para generar claves múltiples; en este caso, CDS/ISIS construirá una clave para cada elemento producido por la tabla de selección de campos. Esta opción normalmente se usa para la producción de índices. En este caso, el registro a partir del cual se extrajeron las claves, será impreso bajo cada uno de los encabezamientos. Por ejemplo, puede usarse la generación de claves múltiples para producir un índice de autores o de palabras significativas. Si se solicita la generación de claves múltiples para más de un nivel de clasificación, CDS/ISIS generará todas las combinaciones necesarias.
Para producir encabezamientos únicos, debe seleccionarse el valor 0 o 1. Los valores 2 o 3 harán que los encabezamientos se impriman en cada ocasión, sea que hayan cambiado o no. Esta última opción es de particular utilidad para la producción de fichas catalográficas.
- Longitud de la clave
Este parámetro define el tamaño de la clave de clasificación para este proceso de impresión. Se debe seleccionar una longitud que sea suficiente, dependiendo del campo del que se extrae la clave, para producir la secuencia correcta. Por ejemplo, si se especifica una longitud de 10 caracteres para un título, CDS/ISIS sólo usará los 10 primeros caracteres para ordenar los títulos. Esto puede tener las siguientes consecuencias: primero, todos los títulos que difieren sólo desde la undécima posición en adelante, quedarán probablemente en orden aleatorio, ya que CDS/ISIS asumirá que estos son de hecho iguales; segundo, si el título es uno de los encabezamientos, sólo se imprimirá el primero, debido a que CDS/ISIS imprime el encabezado sólo cuando hay un cambio de la clave de clasificación correspondiente.
Por otro lado, no debe seleccionarse una clave de clasificación demasiado larga, ya que esto aumentará el tamaño del archivo, y por lo tanto el tiempo de clasificación. Además, hay un límite máximo del tamaño total de las claves de clasificación, que no debe exceder de 4096 caracteres, y del tamaño del registro del archivo HIT, que no puede exceder los 30000 caracteres. Por lo tanto, si se desea clasificar con más de una clave, debe asegurarse que el tamaño máximo de la clave integrada (para todas las claves), no exceda de 4096 caracteres, y que la suma de las longitudes de las claves con la longitud de los encabezamientos correspondientes no exceda de 30000 caracteres. Si esto llegara a suceder, CDS/ISIS genera un mensaje de alerta, e ignora los registros de longitud excesiva
- Recuadro de marcado de FST
Este recuadro le indica a CDS/ISIS si ha de considerar (si está marcado) o ignorar (si está en blanco) la clave de clasificación relacionada. Esta opción puede ser útil cuando se estén utilizando hojas de trabajo de impresión predefinidas.
El Lenguaje de Búsqueda de CDS/ISIS
Introducción El lenguaje de recuperación de CDS/ISIS se basa en el álgebra booleana, que provee una forma conveniente de expresar operaciones lógicas entre conjuntos. Cada término de búsqueda asociado con un registro dado puede, de hecho, considerarse que representa el conjunto de todos aquellos registros asociados con ese término. Por lo tanto, al establecer operaciones lógicas entre términos de búsqueda, se puede definir con precisión el conjunto de los registros a ser recuperados en respuesta a la necesidad planteada.
Los ejemplos dados aquí, no pretenden describir como formular consultas específicas, sino simplemente ilustrar las capacidades del lenguaje de recuperación de CDS/ISIS. Sin embargo, el lenguaje de recuperación por si mismo no es suficiente para permitir al usuario realizar una búsqueda en una base de datos específica. La clave para una búsqueda eficiente y efectiva es un conocimiento profundo de los términos de búsqueda disponibles en una base de datos determinada. Es importante por lo tanto, que el usuario se familiarice con el diccionario de términos de búsqueda disponibles para la base de datos que consulta, y con las reglas para generar los índices de los registros en esa base de datos.
La forma más eficiente de realizar una búsqueda con CDS/ISIS, es a través del archivo invertido (la razón fundamental para mantener un archivo invertido es precisamente la de permitir una recuperación rápida). Sin embargo, sólo se puede hacer esto si los requerimientos de búsqueda están dentro del ámbito del diccionario de términos de búsqueda definido para una base de datos determinada, o sea, que han sido previstos cuando se definió el contenido del archivo invertido. No importa lo bien pensado que haya sido el diseño de una base de datos, habrá casos en que no sea posible formular una búsqueda en base al archivo invertido.
Para estos casos, CDS/ISIS provee un método alterno de búsqueda, denominado búsqueda en texto libre, que permite satisfacer cualquier requerimiento de búsqueda independientemente del contenido del archivo invertido. Debido a que este segundo método es mucho menos eficiente, normalmente es utilizado en forma asociada a una búsqueda sobre el archivo invertido, para refinar la estrategia de búsqueda, pero puede ser usado en forma independiente si esto es necesario. Si se realizan largas búsquedas en texto libre con frecuencia, puede ser conveniente considerar la posibilidad de redefinir el archivo invertido.
Expresiones de Búsqueda Tipos de términos de búsqueda Al formular la expresión de búsqueda, pueden usarse tres tipos de términos: exactos, truncados a la derecha, y ANY, según se explica a continuación.
- Términos exactos
Un término exacto es cualquier elemento de búsqueda definido para una base de datos dada, tal como un descriptor de materia, palabra clave, frase, palabras del título, nombres de autor, etc. El usuario debe estar familiarizado con los términos de búsqueda disponibles en cada base de datos en la que pretenda realizar búsquedas.
Cuando se usa un término de búsqueda exacto, este debe ser especificado en la forma idéntica en que es conocido por CDS/ISIS. Al formular una consulta, se debería tener a mano una lista de los términos de búsqueda (o usar la ventana diccionario, para ver la lista de los términos de búsqueda disponibles).
Aun variaciones menores en la ortografía harán que CDS/ISIS rechace un término. Por ejemplo, si el término conocido por CDS/ISIS es COLOR (de acuerdo con el uso en los Estados Unidos), no podrá usarse el término en su forma británica COLOUR, ya que esta será rechazada[3] Un punto importante que debe tenerse presente, es que si el término de búsqueda contiene paréntesis, o cualquiera de los operadores de búsqueda (* + (G) (F) . $ ^), o si empieza con el símbolo #, debe ser encerrado entre comillas dobles (") para eliminar una posible ambigüedad. Por lo tanto, si el término de búsqueda a utilizar es:
ALEMANIA (REPÚBLICA FEDERAL) debe teclearse como:
"ALEMANIA (REPÚBLICA FEDERAL)" en caso contrario, CDS/ISIS presentará un mensaje de error de sintaxis.
- Términos truncados a la derecha
En lugar de especificar un término exacto, se puede proporcionar solamente la raíz. Esta técnica, conocida también como búsqueda de raíz o truncamiento a la derecha, permite realizar la búsqueda sobre la secuencia inicial de caracteres. CDS/ISIS realizará automáticamente una operación de O (or) lógico entre todos los términos de búsqueda que tengan la raíz indicada.
El truncamiento a la derecha se indica colocando un signo de dólar ($) inmediatamente después del último carácter de la raíz. Supóngase por ejemplo que la lista de términos de búsqueda contiene el siguiente conjunto de términos:
FILE ORGANIZATIONFILMFILM INDUSTRYFILM LIBRARIESFILM-MAKERFILM-MAKINGFILM-MAKING TRAININGFILMSTRIPFILTRATION
Entonces, FILM$ es equivalente a:
FILMFILM INDUSTRYFILM LIBRARIESFILM-MAKERFILM-MAKINGFILM-MAKING TRAININGFILMSTRIP Mientras que FILM-$ es equivalente a:
FILM-MAKERFILM-MAKINGFILM-MAKING TRAINING Al igual que en el caso de términos exactos, si la raíz contiene paréntesis, alguno de los operadores de búsqueda, o si empieza con el signo #, debe encerrarse entre comillas dobles ("). Por ejemplo, "FILM $" es equivalente a:
FILMFILM INDUSTRYFILM LIBRARIES pero FILM $ (sin encerrarlo entre comillas dobles), producirá un mensaje de error.
- Términos ANY
Un término ANY es un término colectivo que representa a un conjunto predefinido de términos de búsqueda. Cuando se incluye un término ANY en la formulación de una búsqueda, CDS/ISIS unirá con una operador O (or), todos los términos de búsqueda de los asociados con el término ANY especificado.
Un término ANY consiste en la palabra ANY seguida por un identificador único, generalmente mnemotécnico, asignado al conjunto de términos asociados. Por ejemplo, el término ANY BENELUX puede usarse para recuperar los registros indizados con el nombre de cualquier país del grupo Benelux (Bélgica, Holanda y Luxemburgo).
Antes de que pueda usarse un término ANY en una búsqueda, su contenido debe ser definido especificando el conjunto de términos asociados. Nótese que no es necesario definir dichos términos para todas las bases de datos. Por lo tanto, antes de intentar usar un término ANY debe asegurarse que efectivamente existe esta facilidad para la base de datos considerada, y que el término ANY que se desea usar, está efectivamente definido.
Operadores de Búsqueda Se pueden combinar dos o más términos de búsqueda en una expresión, usando operadores de búsqueda que indiquen la relación que se desea imponer entre ellos.
- O lógico (inclusivo) (OR)
El O lógico es el operador de unión de conjuntos. El resultado de un O lógico entre dos conjuntos, es el conjunto obtenido juntando los dos, reteniendo los elementos comunes una sola vez cuando los hubiera. Por lo tanto, si A y B son dos términos, que representan los dos conjuntos de documentos indizados con los términos A y B respectivamente, el O lógico entre estos dos conjuntos es el conjunto de documentos indizados bajo el término A, o el término B, o ambos, tal como se indica en el siguiente esquema:
El O lógico por lo tanto, se utiliza para ampliar el ámbito de la búsqueda, y en general aumentará el número de registros recuperados (HITS). El símbolo usado para representar al operador O lógico es el símbolo de suma (+). Así, por ejemplo para recuperar documentos acerca de los países del grupo Benelux, podría utilizarse el operador O lógico del modo siguiente:
BÉLGICA + HOLANDA + LUXEMBURGO Nótese que el orden en el que se presentan los tres países es irrelevante.
- Y lógico (AND)
El Y lógico es el operador de intersección de conjuntos. El símbolo para representar al operador Y lógico es el asterisco (*). El resultado de un Y lógico entre dos conjuntos es el conjunto que contiene sólo aquellos elementos que son comunes a ambos conjuntos.
Por lo tanto, si A y B son dos términos, que representan los dos conjuntos de documentos indizados con los términos A y B respectivamente, él Y lógico entre estos dos conjuntos es el conjunto de documentos indizados simultáneamente bajo ambos términos A y B, según se indica esquemáticamente a continuación:
El Y lógico por lo tanto es utilizado para restringir el ámbito de la búsqueda al requerir la co-ocurrencia de términos, y en general reducirá el número de registros recuperados.
Así por ejemplo, para recuperar documentos sobre "sistemas en línea de recuperación de información", puede utilizarse el operador Y del modo siguiente:
SISTEMAS EN LÍNEA * RECUPERACIÓN DE INFORMACIÓN Nótese que, al igual que en el O lógico, el orden de los términos es irrelevante.
El resultado de un Y lógico puede ser un conjunto vacío, o sea, un conjunto que no contiene elementos. En este caso, no se recuperan documentos. En el ejemplo anterior, se obtendrá el conjunto vacío si en la base de datos no hay ningún registro que contenga simultáneamente los términos SISTEMAS EN LÍNEA y RECUPERACIÓN DE INFORMACIÓN.
- Operadores a nivel de campo y de proximidad
Estos operadores son más restrictivos que el operador Y lógico, y son particularmente útiles en la búsqueda por medio de lenguaje natural.
Los operadores a nivel de campo y de proximidad son los siguientes:
(G) mismo campo (todas las ocurrencias de un campo repetible se consideran como una sola entidad), por ejemplo:
agua (G) suelo recuperará todos los registros que incluyan tanto agua, como suelo, siempre y cuando ambos términos se hallen en el mismo campo; (F) mismo campo u ocurrencia individual de un campo repetible, por ejemplo:
agua (F) suelo recuperará todos los registros que incluyan tanto agua como suelo, siempre y cuando ambos términos se hallen en el mismo campo o en la misma ocurrencia de un campo repetible ((G) y (F) son equivalentes cuando se aplican a campos no repetibles); . igual que (F), pero con la restricción adicional de que los dos términos no se hallen a más de n palabras de distancia, donde n es el número de puntos más uno. Por ejemplo:
agua . suelo adyacentes agua . . suelo máximo una palabra entre agua y suelo agua . . . suelo máximo dos palabras entre agua y suelo.
$ igual que (F), pero con la restricción adicional de que los dos términos se hallen exactamente a n palabras de distancia, donde n es el número de signos $ más uno. Por ejemplo:
agua $ suelo adyacentes agua $ $ suelo exactamente una palabra entre agua y suelo agua $ $ $ suelo exactamente dos palabras entre agua y suelo.
Nótese que los operadores . y $ deben estar precedidos y seguidos por un espacio.
- NO lógico (NOT)
El NO lógico es el operador de exclusión de conjuntos. El resultado de un NO lógico entre dos conjuntos, es el conjunto que contiene todos los elementos del primer conjunto que no pertenezcan también al segundo conjunto. Por lo tanto, si A y B son dos términos que representan los dos conjuntos de documentos indizados con los términos A y B respectivamente, la operación NO lógico entre A y B, es el conjunto de documentos indizados bajo el término A pero que no están indizados simultáneamente bajo el término B, como se indica en el siguiente esquema:
El símbolo usado para indicar la operación NO lógico es el signo de negación (^). El NO lógico debe usarse con gran cuidado, ya que puede fácilmente resultar en la pérdida inadvertida de material relevante.
Por ejemplo, en una búsqueda de documentos acerca de grupos de minusválidos pero excluyendo a niños minusválidos parecería conveniente formular la búsqueda del modo siguiente:
GRUPOS MINUSVÁLIDOS ^ NIÑOS MINUSVÁLIDOS Sin embargo, es muy posible que un documento sobre el tema de interés también contenga una sección relativa a niños minusválidos. Este documento sería eliminado si se usa la consulta anterior.
Nótese además que a diferencia del O lógico y del Y lógico, la operación NO lógico no produce el mismo resultado si se invierte el orden de los dos operandos. O sea, A ^ B no es lo mismo que B ^ A (excepto para el caso especial en que A y B representan el mismo conjunto, en cuyo caso el resultado es el conjunto vacío).
Sintaxis de las expresiones de Búsqueda Al combinar dos o más términos de búsqueda con los operadores descritos, se pueden formar expresiones de búsqueda complejas.
Al igual que en el álgebra normal, se pueden usar paréntesis para alterar el orden de evaluación. En la evaluación de expresiones la prioridad de los operadores es la siguiente:
(más alta) $ and . | (F) | (G) V * and ^ (más baja) + Si dos o más operadores de la misma prioridad aparecen en el mismo nivel de paréntesis en la misma expresión, serán ejecutados de izquierda a derecha. Por lo tanto, para evaluar la expresión del siguiente ejemplo:
A + B * C CDS/ISIS evaluará primero B * C y después evaluará el O lógico entre A y (B * C). Mientras que para evaluar:
(A + B) * C primero evaluará A + B y después el Y lógico entre (A + B) y C. Se pueden anidar paréntesis en caso necesario, como lo muestra el siguiente ejemplo:
((A + B) * C + (D + E) + F) ^ G Al formular una expresión de búsqueda deben observarse algunas reglas sintácticas simples:
No puede haber dos operadores lógicos adyacentes, excepto por " . " y " $ " repetidos (que sin embargo no pueden mezclarse);
Los paréntesis deben equilibrarse, o sea, el número de paréntesis que abren debe ser igual al número de paréntesis que cierran, y cada paréntesis que abre debe corresponder a uno que cierra.
Calificadores de los Operadores Es posible utilizar un calificador para especificar el campo o grupo de campos en los que se desea que aparezca un término. Esto es particularmente útil para bases de datos que pueden contener los mismos datos en diferentes campos.
El calificador tiene el formato general siguiente:
término de búsqueda/(t1,t2,t3,…) donde t1, t2, t3,… es el conjunto de identificadores de campo[4]en donde se desea buscar el término.
Los calificadores de los operandos pueden ser utilizados en conjunción con operadores de búsqueda para restringir la búsqueda a campo(s) especificado(s), y pueden aplicarse también a términos de búsqueda truncados a la derecha, o a términos ANY. Por ejemplo, considérese una base de datos bibliográfica donde los términos se generan por palabras usando todos los campos. A través de la operación Y es posible recuperar en forma simple cualquier registro que contenga los términos INTERNACIONAL, EXPERTOS y REUNIÓN:
INTERNACIONAL * EXPERTOS * REUNIÓN Sin embargo, el número de registros que satisfacen esta consulta puede ser muy grande, ya que cada palabra puede aparecer en cualquier campo, p.ej. título, nombre de organismo, materia, etc. Utilizando el operador (F):
INTERNACIONAL (F) EXPERTOS (F) REUNIÓN el número de registros recuperados se reducirá, pero pueden persistir ambigüedades, ya que los términos pueden aparecer en el resumen, en el título, el editor, etc.
Sin embargo, al añadir el calificador /(62):
INTERNACIONAL (F) EXPERTOS (F) REUNIÓN/(62) sólo los registros que contienen todos los términos en la misma ocurrencia del campo 62 serán recuperados (nótese que en este caso es suficiente con calificar sólo uno de los términos). Cuando el operando es un término truncado a la derecha o un término ANY, CDS/ISIS aplicará el calificador a todos los miembros del conjunto correspondiente. Por lo tanto, el ejemplo:
ANY BENELUX/(64) es equivalente a:
BÉLGICA/(64) + HOLANDA/(64) + LUXEMBURGO/(64) Desarrollo de una estrategia de búsqueda La unidad básica para la construcción de la formulación de una búsqueda es la expresión de búsqueda descrita previamente. En respuesta a una expresión de búsqueda, CDS/ISIS procederá a:
asignar un número único, llamado número de búsqueda, a la expresión de búsqueda que se acaba de teclear (siempre y cuando no tenga errores de sintaxis).
desplegar el número de apuntadores (postings) que existen para cada término en la expresión, para cada sub-expresión, y para la expresión global.
Si la expresión de búsqueda contiene algún término ANY, serán desplegados los apuntadores (postings) de cada uno de los términos de búsqueda asignados al término ANY, así como el valor agregado de los apuntadores (postings) del término ANY. De manera semejante, si la expresión de búsqueda contiene un término truncado a la derecha, serán desplegados los apuntadores (postings) de cada término individual, así como el valor agregado de todos los apuntadores (postings) del término truncado.
Si se usa un término que no es válido, CDS/ISIS definirá el valor de los apuntadores (postings) como cero, y marcará el término con el mensaje:
** NO SE ENCUENTRA ** Como ya se mencionó, CDS/ISIS asigna un número único a cada expresión de búsqueda. También mantiene nota de los registros que cumplen con la expresión de búsqueda. En expresiones de búsqueda posteriores, se puede hacer referencia a expresiones previas simplemente usando el número del conjunto que le asignó CDS/ISIS precedido por el signo (#).
Esta posibilidad permite desarrollar la estrategia de búsqueda paso a paso. El dividir la consulta en elementos no sólo permite verificar paso a paso el número de registros recuperados, sino que también permite desplegar los registros mismos, de modo que se puede verificar en cualquier momento la validez lógica de la búsqueda formulada, en términos de los registros recuperados.
Supóngase por ejemplo, que después de desplegar los registros recuperados por la expresión (ITALIA + FRANCIA) * ARTE, se identifican algunos registros irrelevantes recuperados debido a que se refieren a la conservación de monumentos. Podría entonces modificarse la formulación introduciendo la expresión de búsqueda:
#1 ^ CONSERVACIÓN DE MONUMENTOS Las referencias a expresiones de búsqueda definidas previamente se denominan referencias retrospectivas.
Nótese que es posible aplicar un calificador a una referencia retrospectiva. Por ejemplo:
#1/(64) seleccionaría entre los registros recuperados por la expresión de búsqueda 1, sólo aquellos en donde esa expresión se cumple en el campo 64.
No hay reglas predefinidas para formular una búsqueda. El usuario desarrollará sus propios hábitos conforme adquiere experiencia en el uso de CDS/ISIS. En general, las personas con poca experiencia deben evitar el uso de expresiones complejas al principio, sino más bien empezar con expresiones simples, que al combinarse produzcan la formulación deseada. Haciendo referencia al ejemplo anterior, la misma búsqueda se pudo formular en 4 pasos, de la manera siguiente:
conjunto núm. #1: ARTE conjunto núm. #2: ITALIA + FRANCIA conjunto núm. #3: CONSERVACIÓN DE DOCUMENTOS conjunto núm. #4: #1 * #2 + #3 Búsqueda en texto libre (secuencial) Esta técnica permite especificar condiciones de búsqueda relacionadas con campos que no han sido invertidos, y/o especificar condiciones que no seria posible indicar de otro modo a través de las expresiones de búsqueda descritas más arriba, tales como la comparación de campos, o la comparación de los valores numéricos de los campos.
Para realizar una búsqueda en texto libre, primero debe seleccionarse el comando Búsqueda experta en el Menú de Búsqueda y escribir su ecuación de búsqueda en el recuadro Expresión de búsqueda de la ventana Búsqueda experta. Para poder distinguirla de una expresión de búsqueda normal, debe precederse con un signo interrogativo, del modo siguiente:
? expresión booleana o ? #n expresión booleana donde:
? identifica a esta como una búsqueda en texto libre.
#n restringe optativamente la búsqueda en texto libre al resultado de una búsqueda previa (n es el número del conjunto de la búsqueda previa: Esta puede haber sido una búsqueda a través del archivo invertido, o una búsqueda en texto libre, o una combinación de ambos tipos); si se omite, la búsqueda en texto libre se realizará sobre toda la base de datos; expresión booleana es una expresión booleana de CDS/ISIS según se define en la página 61 del "Manual de Referencia CDS/ISIS. Versión 3.0". En respuesta a una búsqueda en texto libre, CDS/ISIS evaluará la expresión booleana para cada registro del archivo maestro, y construirá una lista HIT que identifica los registros que satisfacen la condición especificada (o sea, todos los registros para los cuales la expresión booleana produce el valor Verdadero [true]). Por ejemplo:
? v24 : "Unesco" and val(v26^c) >= 1986 recuperaría todos los registros que contienen Unesco en el campo 24, con una fecha de publicación (v26^c) mayor o igual a 1986. Lo siguiente:
? #2 (p(v24) or p(v29)) and v26^b : "unesco" recuperaría, entre los registros recuperados por la expresión #2, sólo aquellos que contienen unesco en el subcampo b del campo 26, siempre y cuando estos registros contengan ya sea el campo 24 o el 29 o ambos.
Al igual que las búsquedas con el archivo invertido, cada búsqueda en texto libre recibe un número de conjunto, que puede posteriormente utilizarse en otras expresiones de búsqueda. Nótese que aun cuando las expresiones que usan el archivo invertido y las de texto libre, no pueden combinarse en una sola expresión, es posible a través de las referencias retrospectivas combinar cualquier número de ellas en expresiones por separado, tal como se muestra en el ejemplo siguiente:
conj. 1 AGUA * SUELO conj. 2 ? #1 val(v26^c) > 1985 conj. 3 ANY LATINOAMERICA conj. 4 #2 * #3 Debido a que CDS/ISIS debe leer cada registro del archivo maestro para poder verificar si se cumplen las condiciones de la búsqueda se satisfacen, el tiempo de proceso de búsquedas en texto libre puede ser muy grande, especialmente si se aplica a una base de datos grande.
CDS/ISIS mantiene informado al usuario acerca del proceso, representándolo en pantalla, de modo que se puede ir viendo el desarrollo de la búsqueda. La figura muestra la apariencia de la pantalla durante la ejecución de una búsqueda en texto libre.
Los recuadros presentan la siguiente información:
Phase.- Tipo de operación que se realiza Processing.- Muestra el curso de la operación con los siguientes datos:
MFN muestra el MFN del registro que está en proceso HITS muestra el número de registros recuperados hasta el momento (se incrementa en 1 cada vez que un registro cumple con la expresión booleana); % muestra el porcentaje de aciertos, o sea, el porcentaje de registros recuperados, respecto del número de registros procesados. REGS es el número total de registros a ser procesados. La ejecución de una búsqueda en texto libre puede suspenderse en cualquier momento pulsando Cancel, con objeto de ver con más cuidado los resultados parciales.
El lenguaje de Formatos de CDS/ISIS
Nuevas funciones de Bases de Datos Ocurrencias de campos repetibles Se puede tener acceso a ocurrencias individuales de un campo repetible, indicando, inmediatamente detrás del selector del campo, el número o rango de ocurrencias entre corchetes. Por ejemplo:
v10[1] recupera la primera ocurrencia del campo 10 v10[2..4] recupera desde la 2ª a la 4ª ocurrencia del campo 10 v10[3..] recupera desde la 3ª a la última ocurrencia del campo 10 v10[1]^a recupera el subcampo ^a de la 1ª ocurrencia del campo 10 Nuevas Funciones numéricas: Se han incorporado las siguientes nuevas funciones:
- Función LR((formato),de,a)
Parecida a la función L, la función LR consulta el archivo inverso por el término definido en formato, y devuelve todos los apuntadores (postings) del mismo. Por ejemplo: ref(lr((v10)),v1,v2), devolverá los campos 1 y 2 de todos los registros que tengan como apuntador (posting) el término contenido en el campo 10. Se puede limitar el rango de los apuntadores a ser recuperados utilizando los parámetros opcionales de y a. Por ejemplo: lr((v10),3,7) solo recuperará los apuntadores del 3 al 7. Los parámetros opcionales de y a pueden ser expresiones numéricas válidas.
- Función NOCC(Vtt)
Devuelve el número de ocurrencias del campo tt.
- Función NPST(formato)
Al igual que la función L, la función NPST busca en el archivo inverso el término definido por formato, y devuelve el número de apuntadores (postings) del mismo.
- Función OCC
La función OCC devuelve el número actual de ocurrencias contenidas en un grupo repetible. Puede ser usada para producir listados numerados. Por ejemplo, el formato: (v70/) produce una línea por cada ocurrencia del campo 70. Usando la función OCC se puede escribir:
if p(v70) then f(occ,1,0),". " fi,v70/) lo que producirá un listado como:
1. Primer Autor 2. Segundo Autor 3. Tercer Autor
- Función SIZE(formato)
Devuelve el tamaño de la cadena de caracteres generada por formato. Debe tenerse en cuenta que ésta función es sensible al comando modo. Así, si el campo 10 contiene 20 caracteres, size(mpl,v10) devolverá 20, mientras que size(mdl,v10) devolverá el valor 22, al contar el punto y el espacio generado automáticamente por el modo dato.
- Función TYPE(tipo, formato)
Esta función comprueba si la cadena generada por formato es del tipo definido por tipo, y devuelve 1 si la cadena corresponde al tipo especificado y 0 (cero) en caso contrario. La función TYPE tiene dos formas distintas:
1. TYPE("patrón",formato); o
2. TYPE(expresión numérica,formato).
La primera forma puede usarse para comprobar si la cadena se ajusta a un cierto patrón (veasé pág. 44 del "Manual de Referencia CDS/ISIS. Versión 3.0"). Por ejemplo:
type("XXA-99-99-99",v10) devuelve 1 si el contenido del campo 10 se corresponde al patrón y 0 en caso contrario.
La segunda forma puede usarse para comprobar otras condiciones de acuerdo con el valor de la expresión numérica, que puede ser una de las siguientes:
1 – alfanumérica (la cadena contiene solo caracteres alfabéticos o numéricos); 2 – alfabética (la cadena contiene solo caracteres alfabéticos); 3 – numérica (la cadena contiene solo caracteres numéricos); 4 – enteros decimales (la cadena es un entero opcionalmente con signo, p. ej.: -24) 5 – Número decimal (la cadena es un valor numérico, incluso en notación científica).
Por ejemplo:
type(3,v40) devuelve 1 si el campo 40 contiene solo los dígitos del 0-9.
Tenga en cuenta que CDS/ISIS usará la tabla ISISAC.TAB para determinar cuando un carácter es alfabético o no (veasé la pág. 251 del "Manual de Referencia CDS/ISIS. Versión 3.0").
Nuevas Funciones de cadenas: Se han incorporado las siguientes nuevas funciones:
- Función DATE(exp)
Devuelve la fecha actual y/o la hora en el formato especificado por la expresión numérica exp. El valor de exp puede ser uno de los siguientes:
1 – devuelve la fecha de idéntica forma que la función DATESTAMP de ISIS Pascal, es decir una cadena de 18 bytes de la forma MM-DD-YY HH:MM:SS (p.ej. date(1) puede devolver: 09-30-97 15:03:44); 2 – devuelve solo la fecha (p.ej. date(2) puede devolver: 09-30-97); 3 – devuelve solo la hora (p.ej. date(3) puede devolver: 15:03:44).
- Función DB
La función DB devuelve el nombre de la base de datos activa.
- Funciones de subcadenas
Se pueden obtener subcadenas a partir de una cadena de caracteres de dos formas diferentes:
1. Utilizando el comando *desplazamiento.longitud junto con la función S (veasé págs. 50 y 71 "Manual de Referencia CDS/ISIS. Versión 3.0"), como en el siguiente ejemplo: S(v24,v69)*3.5 (en éste caso CDS/ISIS extraerá 5 caracteres a partir del 4º de la cadena devuelta por la función S); 2. Utilizando la nueva función de subcadenas SS(pos,long,formato). La función SS devolverá la subcadena de la cadena indicada en formato que empieza en la posición pos y de una longitud de long caracteres long. Por ejemplo SS(1,5,v30) extrae los 5 primeros caracteres del campo 30. La principal diferencia entre las dos formas consiste en que en la función SS tanto pos como long pueden expresiones numéricas mientras que en el comando *desplazamiento.longitud los valores deben ser constantes numéricas.
Referencias a otras Bases de datos Las funciones REF, L, LR y NPST pueden ahora contener un calificador de base de datos para referirse a una base de datos distinta de la activa. Cuando la aplicación así lo designa, la base de datos especificada en la función REF puede ser diferente de las especificadas en las funciones L o LR.
El calificador de base de datos se especifica como sigue:
->dbref donde dbref es el nombre de la base de datos alternativa (dicha base debe estar guardada en el directorio indicado en el parámetro 5 del SYSPAR.PAR o en el de su correspondiente dbn.PAR).
Por ejemplo:
ref->bib(l(v10),v200) ref->bib(l->bib(v10),v100,v200) Inclusión de formatos predefinidos Se pueden incluir formatos predefinidos en un formato mediante el uso de la función @nombre, donde nombre es el nombre del formato a ser incluido. Este formato debe estar archivado en el directorio de la base de datos activas (según se especifica en el parámetro 5 del SYSPAR.PAR ó en el parámetro 10 del dbn.PAR). Por ejemplo:
if v1="BIB" then @fmt1 else @fmt2 fi En éste ejemplo, el contenido del campo 1 determinará si se ejecuta el formato fmt1 o el fmt2.
Variables de Formato CDS/ISIS predefine diez variables numéricas de formato y diez variables de cadena de formato, que pueden ser utilizadas en los formatos cuando sea necesario. Las diez variables numéricas de formato se llaman desde E0 a E9 y las diez variables de cadena desde S0 a S9. El valor de dichas variables se inicializan a 0 (cero) en el caso de las numéricas y a cadena nula en las de cadena, cada vez que se ejecuta el formato.
Se puede asignar o cambiar el valor de una variable numérica como sigue:
En:=expresión numérica (por ejemplo: e1:=val(v10)+5) Y se pueden cambiar o asignar el valor de una variable de cadena como sigue:
Sn:=(formato) (por ejemplo: s5:=(v10)).
Téngase en cuenta que se precisan paréntesis alrededor de formato.
Se puede usar una variable numérica en todos los casos en que se deban usar valores numéricos, por ejemplo como operando de expresiones numéricas como if e1+10<25 then … fi. Como cualquier otro valor numérico, las expresiones numéricas no pueden ser mostradas directamente, pero pueden ser tratadas previamente usando la función F (veasé pág. 67 del "Manual de Referencia CDS/ISIS. Versión 3.0").
Las variables de cadena pueden usarse tanto como operandos de cualquier expresión de cadena como cualquier comando de formato.
Comando WHILE El comando WHILE proporciona capacidad iterativa en la medida que se necesite la ejecución repetida de un formato. Se codifica como se indica a continuación:
WHILE condición (formato) donde:
condición es una expresión Booleana según se definen en la pág. 61 y sigs. del "Manual de Referencia CDS/ISIS. Versión 3.0"; formato es el formato CDS/ISIS que debe ser repetido mientras que la expresión Booleana sea Verdadera.
Si el valor inicial de condición es Falso entonces no se ejecutará en ningún caso el formato. Para que termine el ciclo se debe incluir en el formato algún comando que garantice que en algún momento la condición resulte Falso, y se cierre el ciclo. Por ejemplo:
e1:=1,e2:=nocc(v70), while e1<=e2 (f(e1,1,0),". ",v70[e1]/ e1:=e1+1) éste ejemplo muestra cada ocurrencia del campo 70 en una nueva línea, precedida por el número de la ocurrencia, p.ej.:
1. Primer Autor 2. Segundo Autor 3. Tercer Autor A continuación se indica un ejemplo más complejo:
En éste ejemplo se extraen los descriptores del campo 69 enmarcados entre < >, y se muestran en una nueva línea precedidos por su número secuencial, p.ej.:
1. Primer descriptor 2. Segundo descriptor 3. Tercer descriptor El ambiente gráfico de Windows Microsoft Windows, como la mayor parte de los ambientes gráficos, ofrece amplias capacidades de tratamiento en la visualización e impresión de caracteres de texto. Por ejemplo le permite escoger las fuentes[5]que serán usadas en el dispositivo de salida de texto.
CDS/ISIS para Windows proporciona nuevos comandos para manipular la visualización usando varias fuentes, incluso proporcionales, variando su tamaño y color. Se pueden añadir estos nuevos comandos a formatos existentes para mejorar la calidad tipográfica de las salidas a pantalla o impresora.
Los formatos definidos en la versión para MS-DOS se muestran usando por defecto la fuente fija, no proporcional "Courier New", para simular la salida en dicho ambiente bajo Windows e interpretar correctamente los parámetros de sangría expresados en número de caracteres. Sin embargo cuando se usan fuentes proporcionales, un comando como: "Sangrar la primera línea con 5 caracteres" no tendrá siempre el mismo efecto, dado que cada carácter tiene diferente anchura. Los nuevos comandos le podrán ayudar para el diseño de formatos con una apariencia adecuada en estos casos.
Los siguientes apartados describen en detalle dichos comandos.
Comando FONTS El comando FONTS define el conjunto de fuentes (también llamado tabla de fuentes) que se usará en su formato. Si está presente, siempre debe ser el primer comando en el formato. En otro caso CDS/ISIS usará el parámetro por defecto el definido en el parámetro 110 del SYSPAR.PAR, o el conjunto de fuentes definido por defecto en Windows si también dicho parámetro del syspar.par está ausente.
El comando FONTS se codifica como sigue:
FONTS ((familia1,fuente1) , (familia2,fuente), . . . ) donde:
familian es la familia de fuentes, y fuenten es el nombre de la fuente.
Una fuente en particular se define con los nombres de la familia y de la fuente, separados por una coma y encerrados entre paréntesis. La familia es un conjunto de fuentes que tienen similares características, la fuente representa a una fuente específica de una familia en particular. Las familias están predefinidas, las fuentes dependen del conjunto de las disponibles (instaladas en su programa Windows), en su ordenador (se puede obtener una lista de ellas utilizando el comando Fuentes del Panel de Control de Windows).
La siguiente tabla indica las familias de fuentes que se pueden usar y da ejemplos de fuentes para cada una de ellas.
CDS/ISIS numera cada fuente definida en el comando fonts a partir de 0. Por ejemplo, si se desean utilizar las fuentes "Times New Roman" y "Arial" se deberá usar el siguiente comando:
Página anterior | Volver al principio del trabajo | Página siguiente |