Translatable
Al usar la búsqueda en el repositorio de Alma (o al buscar usuarios, solicitudes de compra y solicitudes de servicios al usuario), puede buscar caracteres especiales y caracteres con diacríticos. La configuración del idioma de búsqueda (establecida por Ex Libris) está disponible en Alma para los idiomas siguientes. Para la mayoría de estos idiomas, Alma usa la implementación estándar para funcionar con caracteres especiales.
- El manejo de caracteres especiales de Alma es relevante solo para buscar en la zona de la institución.
- Solo se puede definir un idioma para la búsqueda de caracteres especiales.
La normalización para los idiomas enumerados a continuación es específica de los campos de texto, como el título y el autor. La normalización no se hace para los campos numéricos ni para los campos que contengan un valor normalizado, como una clasificación.
Caracteres alemanes
Cuando su sistema está configurado para alemán como idioma de búsqueda predeterminado, el sistema trata los caracteres del idioma alemán de la siguiente manera:
Carácter de idioma alemán/combinación de caracteres |
Almacenado en la base de datos de Alma |
ß |
ss |
ä, Ä |
ae |
ö, Ö |
oe |
ü, Ü |
ue |
ae |
ae |
oe |
oe |
ue (cuando no sigue a una vocal o q) |
ue |
Con su sistema configurado para alemán como idioma predeterminado y los caracteres especiales del idioma alemán guardados en el sistema tal y como se identifican en la tabla anterior, puede realizar búsquedas usando los caracteres especiales umlaut y Eszett o la versión latina ampliada de estos caracteres (como se muestra en la segunda columna más arriba) y los resultados se tratarán de la misma forma. Así que, por ejemplo, si busca Müller, el sistema devolverá resultados tanto para Müller como para Mueller, pero no para Muller.
Para los sistemas cuyo idioma predeterminado no sea el alemán, una búsqueda de Müller devolverá resultados de búsqueda para Müller y Muller, pero no Mueller.
Cuando su institución (y la Zona de red, si trabaja con una) esté configurada para alemán como idioma de búsqueda predeterminado, esta función de búsqueda de caracteres especiales del idioma alemán estándar está disponible en la Zona de la institución, en la Zona de red y en la Zona de la comunidad.
Para las instituciones que tengan el alemán configurado como el idioma de búsqueda predeterminado, los resultados de búsqueda en el repositorio, los resultados de búsqueda de usuarios y los resultados de búsqueda de solicitudes de servicios al usuario se clasifican utilizando el DIN 5007-1/2, sección 6.1.1.4.1/2 estándar. Además de considerar los caracteres especiales del idioma alemán, los guiones se ignoran cuando se clasifican los resultados de búsqueda.
Al clasificar el contenido de los encabezados de autoridad y bibliográficos, Alma elimina los guiones con fines de clasificación en las instituciones que tengan el parámetro del idioma de búsqueda establecido en alemán.
Cuando usa la función Navegar por encabezados bibliográficos de Alma, se usa el mismo estándar de clasificación (DIN 5007-1/2, sección 6.1.1.4.1/2) para clasificar los encabezados bibliográficos. Véase
Navegar por encabezados bibliográficos para más información.
Caracteres españoles y catalanes
Cuando su sistema está configurado para español como el idioma de búsqueda predeterminado (establecido por Ex Libris), los caracteres especiales del idioma español se tratan como letras completamente independientes para la búsqueda en el repositorio, la navegación por los encabezados bibliográficos/F3 y la clasificación. Los caracteres ingleses estándar no se sustituyen por los caracteres españoles especiales. La siguiente tabla describe cómo gestiona Alma los caracteres especiales españoles:
Carta |
Buscar |
Ordenar |
Ñ/ñ |
Buscar Ñ/ñ no devuelve resultados para N/n y viceversa. |
Clasificado después de n. |
Ç/ç |
Buscar Ç/ç no devuelve resultados para C/c y viceversa. |
Clasificado después de c. |
L·L/l·l |
Se busca como si fuera el dígrafo ll. |
Clasificado como ll. |
Los diacríticos se clasifican en el siguiente orden:
- Sin diacríticos
- Acento agudo
- Acento grave
- Diéresis
Caracteres escandinavos (suecos, noruegos, daneses)
Alma normaliza los caracteres escandinavos intercambiables æ Æ ä Ä ö Ö ø Ø y las variantes dobles (aa, ao, ae, oe y oo) transformándolos en æ Æ å Å ø Ø.
Los caracteres especiales catalogados en idiomas no escandinavos (tales como las letras francesas con acentos) son normalizados durante la indexación. Esto significa que la búsqueda de un término que incluye estos caracteres especiales se comporta ahora como si la búsqueda se hiciera sin ellos. (Sin embargo, no sucede lo contrario: una búsqueda de un término sin estos caracteres especiales no es tratada como si se hiciese con estos caracteres especiales.) La siguiente tabla incluye las reglas para todos los caracteres con signos diacríticos para clientes de caracteres escandinavos:
Idioma |
Mayúscula |
Minúscula |
Variante plegada |
El carácter (en mayúscula/minúscula) puede ser buscado con las siguientes fórmulas: |
Sueco |
Å |
å |
Aa/aa |
Å/å/Aa/aa |
Ä |
ä |
Ae/ae |
Ä/Ae/ä/ae |
Ö |
ö |
Oe/oe |
Ø/Ö/Oe/ø/ö/oe |
Æ |
æ |
Ae/ae |
Æ/æ/Ae/ae |
Ø |
ø |
Oe/oe |
Ø/Ö/Oe/ø/ö/oe |
Otros acentos (p.ej. È) |
Otros acentos (p. ej. è) |
Caracteres base (p. ej. E/e) |
Caracteres base (p. ej. E/e) |
Por ejemplo: Ö puede ser buscado con Oe, pero Oe no puede ser buscado con Ö [Ö y Oe no son equivalentes]. Esto significa que una búsqueda del término Edgar Allan Poe devolverá resultados para Edgar Allan Pö, pero no al revés: una búsqueda del término Pötry no devuelve resultados para Poetry.
|
Noruego/Danés |
Å |
å |
Aa/aa |
Å/Aa/å/aa
Excepción: Å/å es equivalente a Aa/aa, y son intercambiables en una búsuqeda. Una búsqueda de Aalborg devuelve resultados para Ålborg, y una búsqueda de Ålborg devuelve asimismo resultados para Aalborg .
|
Æ |
æ |
Ae/ae |
Æ/Ä/Ae/æ/ae/ä |
Ø |
ø |
Oe/oe |
Ø/Ö/Oe/ø/ö/oe |
Ö |
ö |
Oe/oe |
Ø/Ö/Oe/ø/ö/oe |
Ä |
ä |
Ae/ae |
Æ/Ä/Ae/æ/ae/ä |
Otros acentos (p. ej. È) |
Otros acentos (p. ej. è) |
Caracteres base (p. ej. E/e) |
Caracteres base (p. ej. E/e) |
Por ejemplo:
- Una búsqueda del término båd devuelve resultados para båd/baad, pero no para bad
- Una búsqueda del término haan devuelve resultados para haan/hån, pero no para han
- Una búsqueda del término søn devuelve resultados para søn / soen, pero no para son o soon
- Una búsqueda del término baer devuelve resultados para bær / baer, pero no viceversa (bær no devolverá baer)
|
La clasificación de los caracteres especiales de los idiomas noruego y danés para la búsqueda del personal y la funcionalidad Navegar por los encabezados bibliográficos/F3 se maneja de manera diferente a la clasificación de los caracteres especiales del idioma sueco. Vea, a continuación, la clasificación para cada idioma:
Clasificación del noruego/danés |
Clasificación del sueco |
- a/A-z/Z (con Ü/ü clasificada como Y/y)
- æ/Æ ; ä/Ä
- ø/Ø ; ö/
- å/Å ; aa/Aa
|
- a/A-z/Z (con æ/Æ clasificada como ae/Ae; Ü/ü se clasifica como Y/y)
- å/Å
- ä/Ä
- ö/Ö ; ø/Ø
|
La normalización para noruego y danés se gestiona de la manera descrita en el
Filtro de normalización escandinava. Para el sueco, Alma normaliza los caracteres escandinavos de la misma manera.
Caracteres islandeses
Cuando su sistema está configurado con el islandés como el idioma de búsqueda por defecto (establecido por Ex Libris), los caracteres del idioma islandés son tratados como letras completamente independientes para la búsqueda en el repositorio, la navegación por encabezados bibliográficos/F3 y la clasificación. Los caracteres ingleses estándar no se sustituyen por los caracteres islandeses especiales. Por ejemplo, a no arroja á (y viceversa) en los resultados de búsqueda (cuando se busca “sál”, Alma no arroja “sal"). No se consideran los mismos caracteres.
Los siguientes caracteres se convierten de la siguiente manera:
- El carácter Ø/ø se convierte a Ö/ö. Se clasifica después de Ó/ó.
- El carácter Å/å se convierte a AA/aa.
- Todos los demás caracteres especiales con acentos y diéresis, como ä, ë, ü, û, è, se convierten a sus valores por defecto (a, e, u, etc.).
La lista de resultados se ordena según el orden alfabético islandés (véase la tabla de caracteres islandeses más abajo). Esta función también se aplica a la búsqueda de personal para usuarios, solicitudes de compra y de servicios al usuario, y depósitos.
Caracteres islandeses
Mayúsculas |
Minúsculas |
Diacríticos |
A |
a |
|
Á |
á |
acento agudo |
B |
b |
|
C |
c |
|
D |
d |
|
Ð |
ð |
eth |
E |
e |
|
É |
é |
acento agudo |
F |
f |
|
G |
g |
|
H |
h |
|
I |
i |
|
Í |
í |
acento agudo |
J |
j |
|
K |
k |
|
L |
l |
|
M |
m |
|
N |
n |
|
O |
o |
|
Ó |
ó |
acento agudo |
P |
p |
|
Q |
q |
|
R |
r |
|
S |
s |
|
T |
t |
|
U |
u |
|
Ú |
ú |
acento agudo |
V |
v |
|
W |
w |
|
X |
x |
|
Y |
y |
|
Ý |
ý |
acento agudo |
Z |
z |
|
Þ |
þ |
thorn |
Æ |
æ |
ae |
Ö |
ö |
Diéresis |
Idiomas CJK
Caracteres chinos y coreanos
Alma hace transliteración de hiragana a katakana, transliteración de chino tradicional a chino simplificado, y divide las palabras en bigramas y unigramas. Véase el
Filtro de transformación ICU para obtener más información.
Alma también hace transliteración de hanja a hangul. La clasificación es única para el idioma coreano.
Caracteres japoneses
Para las instituciones que tengan la configuración de la búsqueda en japonés para la búsqueda en el repositorio, navegar por los encabezados Bib y navegar por los encabezados Auth, Alma hace lo siguiente:
- Eliminación de puntuación
- Normalización entre hiragana y katakana
- Normalización de caracteres repetidos
- Normalización de variantes de caracteres kanji
Manejo de puntuación CJK
Para instituciones que tengan la configuración de búsqueda en chino, Hong Kong o coreano, todos los símbolos de puntuación se eliminan durante la indexación cuando aparecen dentro del texto CJK. Sin embargo, la puntuación se mantiene cuando está realizando una búsqueda. Esto ayuda a garantizar que se recuperen los mejores resultados. Tenga en cuenta que la visualización de contenido CJK continúa mostrando la puntuación.
Véase el problema de búsqueda conocido relacionado con la puntuación que se describe en la
nota de la sección
Usar la búsqueda avanzada.
TSVCC de Hong Kong
Alma implementa la versión 1.0 estándar del TSVCC (caracteres de chino tradicional, simplificado y variantes) del Hong Kong Innovative Users Group (HKIUG), lanzada el 18 de julio de 2006. Además de gestionar los caracteres de chino tradicional y simplificado, Alma también gestiona los caracteres de las variantes del chino al hacer lo siguiente:
- Buscar registros de metadatos
- Navegar por encabezados bibliográficos
Esto incluye buscar caracteres TSVCC introducidos como un valor en Navegar por encabezados bibliográficos y clasificar adecuadamente los encabezados que aparezcan para navegar. Cuando se da el mismo título en distintas formas de chino (incluidos los caracteres de variantes del chino), todos los títulos que sean equivalentes se muestran juntos en la lista de encabezados de navegación.
- Buscar nombres de usuarios chinos
La gestión de los caracteres chinos de TSVCC está disponible para las instituciones que tengan el parámentro de idioma de búsqueda de Alma establecido para Hong Kong. Contacte con el servicio de asistencia de Ex Libris si necesita que se habilite este parámetro de la institución.
Caracteres polacos
Cuando su sistema está configurado con el polaco como el idioma de búsqueda por defecto (establecido por Ex Libris), los caracteres del idioma polaco son tratados como letras completamente independientes para la búsqueda en el repositorio, la navegación por encabezados bibliográficos/F3 y la clasificación. Los caracteres ingleses estándar no se sustituyen por los caracteres polacos especiales. Por ejemplo, C no devuelve Ć (y viceversa) en los resultados de búsqueda. No se consideran los mismos caracteres.
La lista de resultados se ordena según el orden alfabético polaco (ver la tabla Caracteres polacos más abajo). Por ejemplo, być viene después de bycie. Esta función también se aplica a la búsqueda de personal para usuarios, solicitudes de compra y de servicios al usuario, y depósitos.
Caracteres polacos
Mayúsculas |
Minúsculas |
Diacríticos |
A |
a |
|
Ą |
ą |
ogónec |
B |
b |
|
C |
c |
|
Ć |
ć |
acento agudo |
D |
d |
|
E |
e |
|
Ę |
ę |
ogónec |
F |
f |
|
G |
g |
|
H |
h |
|
I |
i |
|
J |
j |
|
K |
k |
|
L |
l |
|
Ł |
ł |
trazo |
M |
m |
|
N |
n |
|
Ń |
ń |
acento agudo |
O |
o |
|
Ó |
ó |
acento agudo |
P |
p |
|
Q |
q |
|
R |
r |
|
S |
s |
|
Ś |
ś |
acento agudo |
T |
t |
|
U |
u |
|
V |
v |
|
W |
w |
|
X |
x |
|
Y |
y |
|
Z |
z |
|
Ź |
ź |
acento agudo |
Ż |
ż |
dot
|
Caracteres checos
Cuando el sistema está configurado en checo como el idioma de búsqueda por defecto (establecido por Ex Libris), los caracteres del idioma checo se tratan como letras completamente independientes para buscar en el repositorio, navegar por encabezados bibliográficos/F3 y ordenar. Los caracteres especiales checos no sustituyen a los caracteres ingleses estándar. Por ejemplo, C no devuelve Ć (y viceversa) en los resultados de búsqueda. No se consideran los mismos caracteres.
La lista de resultados se ordena según el orden alfabético checo (véase la tabla de caracteres checos más abajo). Esto significa que las palabras que empiezan con el dígrafo ch (chemie) se ordenan entre la H y la I. Esta función también se aplica a la búsqueda de personal para usuarios, solicitudes de compra y de servicios al usuario, y depósitos.
Caracteres checos
Mayúsculas |
Minúsculas |
Diacríticos |
A |
a |
|
Á |
á |
acento agudo |
B |
B |
|
C |
c |
|
Č |
č |
carón |
D |
d |
|
Ď |
ď |
acento agudo |
E |
e |
|
É |
é |
acento agudo |
Ě |
ě |
carón |
F |
f |
|
G |
g |
|
H |
h |
|
Ch |
ch |
|
I |
i |
|
Í |
í |
acento agudo |
J |
j |
|
K |
k |
|
L |
l |
|
M |
m |
|
N |
n |
|
Ň |
ň |
carón |
O |
o |
|
Ó |
ó |
acento agudo |
P |
p |
|
Q |
q |
|
R |
r |
|
Ř |
ř |
carón |
S |
s |
|
Š |
š |
carón |
T |
t |
|
Ť |
ť |
acento agudo |
U |
u |
|
Ú |
ú |
acento agudo |
Ů |
ů |
anillo |
V |
v |
|
W |
w |
|
X |
x |
|
Y |
y |
|
Ý |
ý |
acento agudo |
Z |
z |
|
Ž |
ž |
carón |
Caracteres lituanos
Cuando su sistema está configurado para lituano como el idioma de búsqueda predeterminado (establecido por Ex LIbrIs), los caracteres de idioma lituano se tratan como letras totalmente independientes para la búsqueda en el repositorio, la navegación por los encabezados bibliográficos/F3 y la clasificación. Los caracteres ingleses estándar no se sustituyen por los caracteres lituanos especiales. Esto se refiere a todos los caracteres lituanos siguientes:ą č ę ė į š ų ū ž Ą Č Ę Ė Į Š Ų Ū Ž.
Los caracteres lituanos pueden buscarse y encontrarse utilizando las letras latinas correspondientes en las consultas:
- Aa => Ąą
- Cc => Čč
- Ee => ĘĖęė
- Ii => Įį
- Ss => Šš
- Uu => ŲŪųū
- Zz => Žž
- La misma regla se aplica a las letras basadas en latín no estándar: alemán, polaco, letón, etc.
Por ejemplo: Š se indexa como Š y S (y opciones de minúsculas); el texto “Šarūnas“ se puede encontrar con todas las siguientes consultas de búsqueda: Šarūnas, Sarūnas, Sarunas, SaruNAS.
Las letras que no son parte del alfabeto lituano oficial (Q/W/X) se clasifican por sus lugares naturales en latín. Por ejemplo:
- Q está ordenada entre P y R
- W está ordenada entre V y Z
El orden de clasificación de letras es el siguiente:
- Las letras lituanas (incluyen letras lituanas tanto latinas como las especiales anteriores) con otras letras de bases latinas que no son latinas puras (por ejemplo, polaco, alemán, escandinavo).
- Alfabetos cirílico y todos los de base no latina
- El chino aparece al final
La lista de resultados se ordena según el orden alfabético lituano (véase la tabla de caracteres lituano a continuación). Esta función también se aplica a la búsqueda de personal para usuarios, solicitudes de compra y de servicios al usuario, además de depósitos.
Caracteres lituanos
Mayúsculas |
Minúsculas |
A |
a |
Ą |
ą |
B |
b |
C |
c |
Č |
č |
D |
d |
E |
e |
Ę |
ę |
Ė |
ė |
F |
f |
G |
g |
H |
h |
I |
i |
Į |
į |
Y |
y |
J |
j |
K |
k |
L |
l |
Ł |
ł |
M |
m |
N |
n |
O |
o |
P |
p |
R |
r |
S |
s |
Š |
š |
T |
t |
U |
u |
Ų |
ų |
Ū |
ū |
V |
v |
Z |
z |
Ż |
ż |
Comillas lituanas
- Las comillas lituanas se interpretan del mismo modo que las latinas. Así que para la indexación, búsqueda y el orden, los términos "Gran Bretaña" y„Gran Bretaña“ se interpretan como iguales.
- En la consulta de búsqueda, cuando se usan comillas para especificar la frase exacta que se debe buscar, solo las comillas latinas se interpretan en Alma como búsqueda de frases exactas. Las comillas lituanas no indican una búsqueda de frases exacta. Se espera que el usuario use la comilla regular para la búsqueda de frase exacta.
Transliteración de letras rusas
Alma es compatible con la transliteración de letras rusas, por lo que los resultados incluyen frases lituanas y rusas. Por ejemplo: cuando el texto de la consulta real eskaunas, Alma encontrará tanto kaunas(latíno) como каунас (cirílico).
Caracteres árabes y persas
Los caracteres árabes/persas similares son tratados como caracteres iguales para la búsqueda en el repositorio, la navegación por encabezados bibliográficos/F3 y la clasificación. Por ejemplo, ڤ devuelve ف (y viceversa) en los resultados de búsqueda.
Los siguientes grupos de caracteres son tratados como un mismo carácter y son intercambiables:
ا – أ – إ – آ
ى – ي - ئ
ه - ة - ۀ
و - ؤ
ك – گ – ک
ف - ڤ
ز - ژ
ب - پ
ج - چ
ق - ڨ