Skip to main content
ExLibris
  • Subscribe by RSS
  • Ex Libris Knowledge Center

    Funcionalidades lingüísticas de Primo VE

    Esta sección describe las distintas funcionalidades lingüísticas que admite Primo.

    Detección de idioma

    Para ofrecer servicios basados en idiomas, Primo debe detectar primero el idioma del texto indexado y de la consulta. Actualmente, Primo puede detectar los siguientes idiomas:

    • Basados en latín: inglés, español, italiano, alemán, francés y danés.

    • Asiáticos: chino, japonés y coreano. Si los caracteres están en chino y la ubicación de Primo está en japonés o coreano, Primo utiliza la ubicación del idioma seleccionado.

    • Otros idiomas que poseen un rango de caracteres específico: hebreo, árabe, etc.

    La detección de idiomas se basa en comparar las palabras del registro y la consulta con un diccionario. Si el cincuenta por ciento o más de las palabras coinciden, se identifica el idioma.

    Palabras reservadas

    Las palabras reservadas se incluyen en búsquedas de frases y se omiten en búsquedas de palabras clave. Por ejemplo, si un usuario busca las aventuras de huckleberry finn, Primo realiza las siguientes búsquedas:

    las aventuras de huckleberry finn

    o

    aventuras huckleberry finn

    Primo utiliza las listas de palabras reservadas al indexar y al buscar.

    Nombres de autores

    Primo trata las palabras con apóstrofo O' como si fueran palabras reservadas en muchos idiomas provenientes del Latín y las indexa como si fueran dos palabras separadas. Esto también sucede con autores como O'Leary, que se indexa como o y leary. Como resultado, una búsqueda de Oleary no tendrá el mismo número de resultados que una búsqueda de O'Leary. Cuando los usuarios buscan nombres que suelen incluir apóstrofos pero no incluyen el apóstrofo, Primo también buscará el nombre como si los usuarios lo hubiesen incluido. Por ejemplo, si la consulta del usuario es Oleary, Primo modificará la consulta para buscar oleary o o leary.

    Derivación

    La derivación es un proceso que reduce palabras flexivas (o a veces derivadas) a su raíz, base o forma de raíz. Cuando se activa la derivación, la forma derivada del término de búsqueda se agrega a la consulta con un impulso muy bajo para mejorar los resultados de la búsqueda.

    • La derivación funciona independientemente del mecanismo inteligente de búsqueda y rango que aumenta las palabras de consulta adyacentes. Esto permite al sistema aumentar las versiones derivadas de los términos de búsqueda cuando no son adyacentes a otros términos de búsqueda.

    • Primo VE no deja de derivar los términos, excepto en el caso de las pluralizaciones. Si se activa la derivación, Primo VE incluirá la forma plural del término y otorgará a sus resultados un rango inferior. Por ejemplo, una búsqueda de flor silvestre se expande a silvestre Y (flor O flores^0.5).

    El parámetro add_keywords_stemming_to_query en la página Ajustes de descubrimiento del cliente (Menú de Configuración > Descubrimiento > Otros > Ajustes del cliente) le permite activar/desactivar el uso de la derivación.

    Sinónimos

    Primo añade los siguientes tipos de sinónimos a una consulta de búsqueda:

    • Números – cuando la búsqueda contiene un dígito, Primo añade el número deletreado a la consulta de búsqueda. Por ejemplo, Primo añade la palabra noveno a la consulta de búsqueda .

    • Escritura de EE. UU. o británica – cuando una búsqueda contiene una palabra escrita de acuerdo a la escritura de EE. UU. o británica, Primo añade el sinónimo correspondiente a la consulta de búsqueda. Por ejemplo, Primo añade la palabra colour a una consulta de búsqueda de color.

    • Palabras con errores ortográficos habituales – en el caso de palabras con errores ortográficos habituales, Primo añade la palabra correcta a la consulta de búsqueda.

    Además del sinónimo, Primo incluye también el término de búsqueda original en la consulta. Por ejemplo, si la consulta es quinta dimensión, Primo busca (quinta O 5ª) Y dimensión.

    Primo aplica un conjunto diferente de listas de sinónimos de acuerdo al reconocimiento del idioma.

    El siguiente parámetro en la página Ajustes de descubrimiento del cliente (Menú de Configuración > Descubrimiento > Otros > Ajustes del cliente) permite deshabilitar el uso de sinónimos:

    • disable_synonyms – Cuando se configura a verdadero, este parámetro deshabilita el uso de sinónimos en consultas de búsqueda. Por defecto, este parámetro está configurado como falso.

    Quiso Decir:

    Las sugerencias de Quiso Decir mejoran las consultas de búsqueda al corregir errores tipográficos y errores ortográficos comunes en los términos de búsqueda, con el fin de devolver los resultados de búsqueda esperados a los usuarios. Se proporcionan sugerencias Quiso Decir cuando la consulta original devuelve menos del umbral de 15 resultados de búsqueda, que no es configurable.

    En el siguiente ejemplo, al término de búsqueda leucemia le falta un solo carácter y no devuelve ningún resultado. Los usuarios pueden seleccionar la sugerencia que aparece debajo del cuadro de búsqueda si desean ver los resultados de esa sugerencia.

    PVE_DYM_Example.png

    Ejemplo de Quiso decir

    ¿Cómo funciona Quiso Decir?

    Quiso Decir se activa cuando la consulta de búsqueda original devuelve menos de 15 resultados. Si se activa, el algoritmo Quiso Decir realiza lo siguiente:

    1. Por cada término de búsqueda en la consulta original:

      1. Se verifican las siguientes fuentes para una coincidencia:

        • Índice Quiso Decir: este índice se crea aplicando la distancia de Levenshtein, que es la distancia entre dos palabras usando un número mínimo de ediciones de un solo carácter (como inserciones, eliminaciones o sustituciones) al índice de títulos regulares. Para Quiso Decir, el índice limita las ediciones a un solo carácter.

          Por ejemplo, si la palabra leucemia se indexa en el índice del título normal, los siguientes términos podrían devolver una sugerencia para leucemia:

          • lecemia: falta la letra u.

          • leecemia: la letra u ha sido reemplazada por la segunda e.

          • aleucemia: la letra a se ha agregado al comienzo del término.

        • Diccionario: el diccionario contiene palabras comúnmente mal escritas para verificar.

      2. Por cada coincidencia encontrada, se crea una consulta candidata reemplazando el término en la consulta original con su coincidencia.

    2. Cada consulta candidata se prueba y, para la sugerencia, se utiliza la candidata de mayor ranking que devuelve suficientes resultados.

    Opciones de Configuración

    Esta funcionalidad está habilitada por defecto y no es configurable.

    Normalización de Caracteres Especiales

    En función del idioma de indexación configurado, Primo VE normaliza caracteres especiales y caracteres con signos diacríticos en el índice de búsqueda. Primo VE admite los siguientes idiomas de indexación: Alemán (de), noruego (no), danés (da), sueco (sv) , español (es), polaco (po), coreano (ko), chino (zh), y japonés (ja).

    Específicamente para Hong Kong, su biblioteca puede decidir usar chino o TSVCC para la conversión de caracteres.

    Si desea cambiar su idioma de indexación a uno de los idiomas admitidos, abra una solicitud de soporte en Salesforce. Tengo en cuenta que esto requerirá indexar de nuevo sus datos. Después de completar la reindexación, las búsquedas utilizarán las conversiones de caracteres específicas para el idioma descritas a continuación, con independencia del idioma seleccionado en la IU.

    Alemán

    Carácter Conversión

    00DC (Ü)

    0075 0065 (ue)

    00FC (ü)

    0075 0065 (ue)

    00C4 (Ä)

    0061 0065 (ae)

    00E4 (ä)

    0061 0065 (ae)

    00D6 (Ö)

    006F 0065 (oe)

    00F6 (ö)

    006F 0065 (oe)

    Noruego

    Carácter Conversión

    00E4 (ä)

    0061 0065 (ae)

    00C4 (Ä)

    0061 0065 (ae)

    00E5 (å)

    0061 0061 (aa)

    00C5 (Å)

    0061 0061 (aa)

    00D8 (Ø)

    006F 0065 (oe)

    00F8 (ø)

    006F 0065 (oe)

    00D6 (Ö)

    006F 0065 (oe)

    00F6 (ö)

    006F 0065 (oe)

    Danés

    Carácter Conversión

    00E4 (ä)

    0061 0065 (ae)

    00C4 (Ä)

    0061 0065 (ae)

    00E5 (å)

    0061 0061 (aa)

    00C5 (Å)

    0061 0061 (aa)

    00D8 (Ø)

    006F 0065 (oe)

    00F8 (ø)

    006F 0065 (oe)

    00D6 (Ö)

    006F 0065 (oe)

    00F6 (ö)

    006F 0065 (oe)

    Sueco

    Carácter Conversión

    00E4 (ä)

    0061 0065 (ae)

    00C4 (Ä)

    0061 0065 (ae)

    00E5 (å)

    0061 0061 (aa)

    00C5 (Å)

    0061 0061 (aa)

    00D8 (Ø)

    006F 0065 (oe)

    00F8 (ø)

    006F 0065 (oe)

    00D6 (Ö)

    006F 0065 (oe)

    00F6 (ö)

    006F 0065 (oe)

    Español

    Carácter Conversión

    00D1 (Ñ)

    00F1 (ñ)

    00F1 (ñ)

    00F1 (ñ)

    00C7 (Ç)

    00E7 (ç)

    00E7 (ç)

    00E7 (ç)

    0140 (ŀ)

    0140 (ŀ)

    013F (Ŀ)

    0140 (ŀ)

     Polaco

    Carácter Conversión

    0104 (Ą)

    0061 0061 (aa)

    0105 (ą)

    0061 0061 (aa)

    0106 (Ć)

    0063 0063 (cc)

    0107 (ć)

    0063 0063 (cc)

    0118 (Ę)

    0065 0065 (ee)

    0119 (ę)

    0065 0065 (ee)

    0141 (Ł)

    006C 006C (ll)

    0142 (ł)

    006C 006C (ll)

    0143 (Ń)

    006E 006E (nn)

    0144 (ń)

    006E 006E (nn)

    00D3 (Ó)

    006F 006F (oo)

    00F3 (ó)

    006F 006F (oo)

    015A (Ś)

    0073 0073 (ss)

    015B (ś)

    0073 0073 (ss)

    0179 (Ź)

    007A 007A (zz)

    017A (ź)

    007A 007A (zz)

    017B (Ż)

    007A 0065 (ze)

    017C (ż)

    007A 0065 (ze)

    • Was this article helpful?