Skip to main content
ExLibris
  • Subscribe by RSS
  • Ex Libris Knowledge Center

    Funcionalidades lingüísticas de Primo VE

    Esta sección describe las distintas funcionalidades lingüísticas que admite Primo.

    Detección de idioma

    Para ofrecer servicios basados en idiomas, Primo debe detectar primero el idioma del texto indexado y de la consulta. Actualmente, Primo puede detectar los siguientes idiomas:

    • Basados en latín: inglés, español, italiano, alemán, francés y danés.

    • Asiáticos: chino, japonés y coreano. Si los caracteres están en chino y la ubicación de Primo está en japonés o coreano, Primo utiliza la ubicación del idioma seleccionado.

    • Otros idiomas que poseen un rango de caracteres específico: hebreo, árabe, etc.

    La detección de idiomas se basa en comparar las palabras del registro y la consulta con un diccionario. Si el cincuenta por ciento o más de las palabras coinciden, se identifica el idioma.

    Palabras reservadas

    Las palabras reservadas se incluyen en búsquedas de frases y se omiten en búsquedas de palabras clave. Por ejemplo, si un usuario busca las aventuras de huckleberry finn, Primo realiza las siguientes búsquedas:

    las aventuras de huckleberry finn

    o

    aventuras huckleberry finn

    Primo utiliza las listas de palabras reservadas al indexar y al buscar.

    Nombres de autores

    Primo trata las palabras con apóstrofo O' como si fueran palabras reservadas en muchos idiomas provenientes del Latín y las indexa como si fueran dos palabras separadas. Esto también sucede con autores como O'Leary, que se indexa como o y leary. Como resultado, una búsqueda de Oleary no tendrá el mismo número de resultados que una búsqueda de O'Leary. Cuando los usuarios buscan nombres que suelen incluir apóstrofos pero no incluyen el apóstrofo, Primo también buscará el nombre como si los usuarios lo hubiesen incluido. Por ejemplo, si la consulta del usuario es Oleary, Primo modificará la consulta para buscar oleary o o leary.

    Derivación

    La derivación es un proceso que reduce palabras flexivas (o a veces derivadas) a su raíz, base o forma de raíz. Primo utiliza la derivación cuando una búsqueda devuelve menos de 25 resultados. Si la búsqueda devuelve menos resultados que dicha cantidad, Primo deriva los términos de búsqueda utilizando la derivación Kstem.

    Primo identifica el idioma de la consulta y aplica una lógica de derivación pertinente que puede ser diferente de acuerdo al idioma. En los casos en que Primo no pueda identificar el idioma de los términos de la consulta, se fijará en el idioma de la interfaz del usuario para definir qué lógica de idioma aplicar.

    Primo no deje de realizar la derivación de términos, excepto en casos de plurales. Si el conjunto de resultados es menor que el umbral por defecto, Primo pluraliza los términos, clasificando los resultados más bajos. Por ejemplo, una búsqueda de flor silvestre se expande a silvestre Y (flor O flores^0.5).

    El siguiente parámetro en la página Ajustes de descubrimiento del cliente (Menú de Configuración > Descubrimiento > Otros > Ajustes del cliente) permite deshabilitar o limitar el uso de la derivación:

    • maximum_results_for_stemming: Cuando se configura a verdadero, este parámetro establece el número máximo de resultados devueltos antes de que el sistema use la derivación para devolver más resultados. Si este parámetro está configurado como 0, la derivación no se usará para devolver resultados. Por defecto, este parámetro está configurado a 25 resultados. 

    Sinónimos

    Primo añade los siguientes tipos de sinónimos a una consulta de búsqueda:

    • Números – cuando la búsqueda contiene un dígito, Primo añade el número deletreado a la consulta de búsqueda. Por ejemplo, Primo añade la palabra noveno a la consulta de búsqueda .

    • Escritura de EE. UU. o británica – cuando una búsqueda contiene una palabra escrita de acuerdo a la escritura de EE. UU. o británica, Primo añade el sinónimo correspondiente a la consulta de búsqueda. Por ejemplo, Primo añade la palabra colour a una consulta de búsqueda de color.

    • Palabras con errores ortográficos habituales – en el caso de palabras con errores ortográficos habituales, Primo añade la palabra correcta a la consulta de búsqueda.

    Además del sinónimo, Primo incluye también el término de búsqueda original en la consulta. Por ejemplo, si la consulta es quinta dimensión, Primo busca (quinta O 5ª) Y dimensión.

    Primo aplica un conjunto diferente de listas de sinónimos de acuerdo al reconocimiento del idioma.

    El siguiente parámetro en la página Ajustes de descubrimiento del cliente (Menú de Configuración > Descubrimiento > Otros > Ajustes del cliente) permite deshabilitar el uso de sinónimos:

    • disable_synonyms – Cuando se configura a verdadero, este parámetro deshabilita el uso de sinónimos en consultas de búsqueda. Por defecto, este parámetro está configurado como falso.

    Quiso Decir:

    Las sugerencias de Quiso Decir mejoran las consultas de búsqueda al corregir errores tipográficos y errores ortográficos comunes en los términos de búsqueda, con el fin de devolver los resultados de búsqueda esperados a los usuarios. Se proporcionan sugerencias Quiso Decir cuando la consulta original devuelve menos del umbral de 15 resultados de búsqueda, que no es configurable.

    En el siguiente ejemplo, al término de búsqueda leucemia le falta un solo carácter y no devuelve ningún resultado. Los usuarios pueden seleccionar la sugerencia que aparece debajo del cuadro de búsqueda si desean ver los resultados de esa sugerencia.

    PVE_DYM_Example.png

    Ejemplo de Quiso decir

    ¿Cómo funciona Quiso Decir?

    Quiso Decir se activa cuando la consulta de búsqueda original devuelve menos de 15 resultados. Si se activa, el algoritmo Quiso Decir realiza lo siguiente:

    1. Por cada término de búsqueda en la consulta original:

      1. Se verifican las siguientes fuentes para una coincidencia:

        • Índice Quiso Decir: este índice se crea aplicando la distancia de Levenshtein, que es la distancia entre dos palabras usando un número mínimo de ediciones de un solo carácter (como inserciones, eliminaciones o sustituciones) al índice de títulos regulares. Para Quiso Decir, el índice limita las ediciones a un solo carácter.

          Por ejemplo, si la palabra leucemia se indexa en el índice del título normal, los siguientes términos podrían devolver una sugerencia para leucemia:

          • lecemia: falta la letra u.

          • leecemia: la letra u ha sido reemplazada por la segunda e.

          • aleucemia: la letra a se ha agregado al comienzo del término.

        • Diccionario: el diccionario contiene palabras comúnmente mal escritas para verificar.

      2. Por cada coincidencia encontrada, se crea una consulta candidata reemplazando el término en la consulta original con su coincidencia.

    2. Cada consulta candidata se prueba y, para la sugerencia, se utiliza la candidata de mayor ranking que devuelve suficientes resultados.

    Opciones de Configuración

    Esta funcionalidad no es configurable, pero primero debe ejecutar la tarea Construir Estructuras de Ranking (Menú Admin > Administrar Tareas y Conjuntos> Supervisar Tareas> Programado) para habilitarla. Ex Libris recomienda que ejecute esta tarea cada semana para mantener actualizado el índice.

    Actualmente, no hay forma de deshabilitar Quiso Decir en Primo VE después de haberlo habilitado.

    • Was this article helpful?