Skip to main content
ExLibris
  • Subscribe by RSS
  • Ex Libris Knowledge Center

    Configurações de Busca para Diferentes Idiomas

    Translatable
    Ao usar a busca no repositório do Alma (ou ao buscar por usuários, solicitações de compra e solicitações de serviços ao usuário), você pode buscar por caracteres especiais e com diacríticos. A configuração do idioma de busca (definida pela Ex Libris) está disponível no Alma para os idiomas abaixo. Para a maioria destes idiomas, o Alma usa a implementação padrão para uso de caracteres especiais.
    • O processamento de caracteres especiais do Alma é relevante somente para a busca na área da instituição.
    • Somente um idioma pode ser definido para a busca com caracteres especiais.
    A normalização para os idiomas listados abaixo é específica para campos de texto, como título e autor. Portanto, não é feita para campos numéricos ou que contenham um valor normalizado, como um número de chamada.

    Caracteres Alemães

    Quando o sistema é configurado com alemão como o idioma de busca padrão, caracteres alemães são tratados pelo sistema da seguinte maneira:
    Caracteres do Idioma Alemão/Combinações de Caracteres Armazenado na Base de Dados do Alma
    ß ss
    ä, Ä ae
    ö, Ö oe
    ü, Ü ue
    ae ae
    oe oe
    ue (quando não é seguido de uma vogal ou q) ue
    Com o sistema configurado para alemão como idioma padrão e os caracteres especiais do idioma armazenados no sistema conforme identificado na tabela acima, você pode buscar usando os caracteres especiais umlaut e Eszett ou a versão latina estendida destes caracteres (como mostrado na segunda coluna acima) e os resultados serão os mesmos. Então, por exemplo, se você buscar por Müller, o sistema retornará resultados para Müller e Mueller, mas não para Muller.
    Para sistemas cujo idioma padrão não é alemão, uma busca por Müller retornará resultados de busca para Müller e Muller, mas não Mueller.
    Quando a instituição (e Área da Rede, se você estiver trabalhando com uma) é configurada com alemão como idioma de busca padrão, esta funcionalidade de busca por caractere especial do idioma alemão fica disponível nas Áreas da Instituição, da Rede e da Comunidade.
    Para instituições com alemão configurado como o idioma de busca padrão, os resultados da busca no repositório, por usuários e por solicitação de serviços ao usuário são armazenados usando a seção DIN 5007-1/2, padrão 6.1.1.4.1/2. Além de considerar caracteres especiais do alemão, hifens são ignorados quando os resultados da busca são armazenados.
    Ao ordenar conteúdo de cabeçalhos bibliográficos e de autoridade, o Alma remove travessões nas instituições cujo parâmetro de idioma de busca estiver configurado para alemão.
    Ao usar a funcionalidade Explorar Cabeçalhos Bibliográficos do Alma, o mesmo padrão de ordenação (DIN 5007-1/2, seção 6.1.1.4.1/2) é usado para cabeçalhos bibliográficos. Visite Explorar Cabeçalhos Bibliográficos para mais informações.

    Caracteres Espanhóis e Catalães

    Quando o sistema estiver configurado com espanhol como idioma de busca padrão (definido pela Ex Libris), caracteres especiais do idioma são tratados como letras totalmente independentes para buscar no repositório, explorar cabeçalhos bibliográficos/F3 e ordenar. Caracteres padrão do inglês não são substituídos pelos caracteres especiais do espanhol. A seguinte tabela descreve como o Alma processa caracteres especiais do espanhol.
    Letra Busca Ordem
    Ñ/ñ Buscar por Ñ/ñ não recupera resultados para N/n e vice-versa. Ordenado após n.
    Ç/ç Buscar por Ç/ç não recupera resultados para C/c e vice-versa. Ordenado após c.
    L·L/l·l Buscado como o dígrafo ll. Ordenado como ll.
    Diacríticos são ordenados na seguinte ordem:
    • Sem diacríticos
    • Acento agudo
    • Acento grave
    • Trema

    Caracteres Escandinavos (Suecos, Noruegueses, Dinamarqueses)

    O Alma normaliza os caracteres escandinavos intercambiáveis æ Æ ä Ä ö Ö ø Ø e as variantes dobradas (aa, ao, ae, oe e oo) transformando-os em æ Æ å Å ø Ø.

    Caracteres especiais catalogados em idiomas não escandinavos (como letras francesas com acentos) são normalizadas durante a indexação. Isto significa que uma busca por um termo que inclua estes caracteres especiais se comportará como se a busca fosse feita sem eles. (Entretanto, o oposto não acontece; uma busca por um termo sem estes caracteres especiais não é tratada como se fosse feita com os caracteres especiais). A tabela abaixo inclui as regras para todos os caracteres com diacríticos para clientes que usam caracteres escandinavos:

    Idioma Maiúsculo Minúscula Variante dobrada O caractere (maiúsculo ou minúsculo) pode ser buscado com as seguintes fórmulas:
    Sueco Å å Aa/aa Å/å/Aa/aa
    Ä ä Ae/ae Ä/Ae/ä/ae
    Ö ö Oe/oe Ø/Ö/Oe/ø/ö/oe
    Æ æ Ae/ae Æ/æ/Ae/ae
    Ø ø Oe/oe Ø/Ö/Oe/ø/ö/oe
    Outros acentos (ex: È) Outros acentos (ex: è) Caracteres base (ex: E/e) Caracteres base (ex: E/e)

    Por exemplo: Ö pode ser buscado com Oe, mas Oe não pode ser buscado por Ö [Ö e Oe não são equivalentes]. Isto significa que uma busca pelo termo Edgar Allan Poe retornará resultados para Edgar Allan Pö, mas não o oposto; buscar pelo termo Pötry não retornará resultados para Poetry.

    Norueguês/Dinamarquês Å å Aa/aa

    Å/Aa/å/aa 

    Exceção: Å/å é equivalente a Aa/aa e podem ser buscados de maneira intercambiável. Uma busca por Aalborg retornará resultados para Ålborg e uma busca por Ålborg também retornará resultados para Aalborg.

    Æ æ Ae/ae Æ/Ä/Ae/æ/ae/ä
    Ø ø Oe/oe Ø/Ö/Oe/ø/ö/oe
    Ö ö Oe/oe Ø/Ö/Oe/ø/ö/oe
    Ä ä Ae/ae Æ/Ä/Ae/æ/ae/ä
    Outros acentos (ex: È) Outros acentos (ex: è) Caracteres base (ex: E/e) Caracteres base (ex: E/e)

    Por exemplo:

    • Buscar pelo termo båd retornará resultados para båd/baad, mas não para bad
    • Buscar pelo termo haan retornará resultados para haan/hån, mas não para han
    • Buscar pelo termo søn retornará resultados para søn / soen, mas não para son ou soon
    • Buscar pelo termo baer retornará resultados para bær / baer, mas não vice-versa (bær não retornará baer)
    A ordem dos caracteres especiais de idioma norueguês e dinamarquês para a busca de operadores e para a funcionalidade Explorar Cabeçalhos Bibliográficos/F3 é processada diferentemente da ordem dos caracteres especiais suecos. Veja a ordem para cada idioma abaixo:
    Ordem do Norueguês/Dinamarquês Ordem do Sueco
    • a/A-z/Z (com Ü/ü ordenado como Y/y)
    • æ/Æ ; ä/Ä
    • ø/Ø ; ö/
    • å/Å ; aa/Aa
    • a/A-z/Z (com æ/Æ ordenado como ae/Ae; Ü/ü é ordenado como Y/y)
    • å/Å
    • ä/Ä
    • ö/Ö ; ø/Ø
     
    A normalização para norueguês e dinamarquês é processada conforme descrito em Scandinavian Normalization Filter. Para o sueco, o Alma normaliza caracteres escandinavos da mesma maneira.

    Caracteres Islandeses

    Quando o sistema é configurado com islandês como idioma de busca padrão (definido pela Ex Libris), caracteres idioma são tratados como letras totalmente independentes para buscar no repositório, explorar cabeçalhos bibliográficos/F3 e ordenar. Caracteres padrão do inglês não são substituídos pelos caracteres especiais do islandês. Por exemplo, a não retornará á (e vice-versa) nos resultados da busca (ao buscar por “sál”, Alma não retornará “sal"). Eles não são considerados os mesmos caracteres. 

    Os seguintes caracteres são convertidos da seguinte maneira: 

    • O caractere Ø/ø é convertido para Ö/ö. É ordenado após Ó/ó.
    • O caractere Å/å é convertido para AA/aa. 
    •  Todos os outros caracteres especiais com acentos e trema, como ä, ë, ü, û, è, são convertidos para os seus valores padrões (a, e, u etc.)
    A lista de resultados é ordenada com base na ordem alfabética do islandês (veja a tabela Caracteres Islandeses abaixo). Esta funcionalidade também se aplica à busca de operadores por usuários, solicitações de compras e de serviços ao usuário, e depósitos.
    Caracteres Islandeses
    Maiúsculo Minúsculo Diacríticos
    D a  
    Á á acento agudo
    B b  
    C c  
    D d  
    Ð ð eth
    E e  
    É é acento agudo
    F f  
    G g  
    H h  
    I i  
    Í í acento agudo
    J j  
    K k  
    L l  
    M m  
    N n  
    O o  
    Ó ó acento agudo
    P p  
    Q q  
    R r  
    S s  
    T t  
    U u  
    Ú ú acento agudo
    V v  
    W w  
    X x  
    Y y  
    Ý ý acento agudo
    Z z  
    Þ þ thorn
    Æ æ ae
    Ö ö Trema 

    Idiomas CJK

    Caracteres Chineses e Coreanos

    O Alma faz transliteração de hiragana para katakana, chinês tradicional para simplificado e divide palavras em bigramas e unigramas. Veja o ICU Transform Filter para mais informações.
    O Alma também faz transliteração de hanja para hangul. A ordem é única para o idioma coreano.

    Caracteres Japoneses

    Para instituições cuja configuração de busca está como japonês para Buscar no Repositório, Explorar Cabeçalhos Bibliográficos e Explorar Cabeçalhos de Autoridade, o Alma faz o seguinte:
    • Remoção de pontuação
    • Normalização entre hiragana e katakana
    • Normalização de caracteres repetidos
    • Normalização de variantes de caracteres kanji

    Processamento de Pontuação para CJK

    Para instituições cuja busca está configurada para chinês, Hong Kong, japonês ou coreano, todos os pontos são removidos durante a indexação quando aparecerem em textos CJK. Entretanto, a pontuação permanecerá durante a busca. Isto ajuda a garantir que os melhores resultados serão recuperados. Observe que a exibição de conteúdo CJK continuará a mostrar a pontuação.
    Veja o problema conhecido da busca relacionado à pontuação que está descrito na nota na seção Usar a Busca avançada.

    Hong Kong - TSVCC

    O Alma implementa a versão padrão 1.0 do TSVCC (Caracteres do Chinês Tradicionais, Simplificados e Variantes) do Hong Kong Innovative Users Group (HKIUG) lançado em 18 de julho de 2006. Além disso, para processar os caracteres chineses tradicionais e simplificados, o Alma também processa os caracteres variantes do chinês ao fazer o seguinte:
    • Buscar registros de metadados
    • Explorar cabeçalhos bibliográficos
      Isto inclui buscar por caracteres TSVCC inseridos como um valor em Explorar Cabeçalhos Bibliográficos e ordenar corretamente os cabeçalhos que aparecem. Quando o mesmo título ocorre em diferentes formas de chinês (incluindo caracteres variantes), todos os títulos equivalentes são ordenados juntos na lista de cabeçalhos para explorar.
    • Buscar por nomes de usuários chineses
    O processamento de caracteres chineses TSVCC está disponível para instituições que tenham o parâmetro de idioma de busca do Alma configurado como Hong Kong. Entre em contato com o Suporte da Ex Libris se você precisa habilitar este parâmetro na instituição.
    Para a tabela completa de HKIUG TSVCC (versão UNICODE), visite http://hkiug-archive.lib.hku.hk/unicode/hkiug_tsvcc_table-UnicodeVersion-1.0.html.

    Caracteres Poloneses

    Quando o sistema é configurado com polonês como idioma de busca padrão (definido pela Ex Libris), caracteres do idioma são tratados como letras totalmente independentes para buscar no repositório, explorar cabeçalhos bibliográficos/F3 e ordenar. Caracteres padrão do inglês não são substituídos pelos caracteres especiais do polonês. Por exemplo, C não retornará Ć (e vice-versa) nos resultados da busca. Eles não são considerados os mesmos caracteres.
    A lista de resultados é ordenada com base na ordem alfabética do polonês (veja a tabela Caracteres Poloneses abaixo). Por exemplo, być vem depois de bycie. Esta funcionalidade também se aplica à busca de operadores por usuários, solicitações de compras e de serviços ao usuário, e depósitos.
    Caracteres Poloneses
    Maiúsculo Minúsculo Diacríticos
    D a  
    Ą ą ogonek
    B b  
    C c  
    Ć ć acento agudo
    D d  
    E e  
    Ę ę ogonek
    F f  
    G g  
    H h  
    I i  
    J j  
    K k  
    L l  
    Ł ł traço
    M m  
    N n  
    Ń ń acento agudo
    O o  
    Ó ó acento agudo
    P p  
    Q q  
    R r  
    S s  
    Ś ś acento agudo
    T t  
    U u  
    V v  
    W w  
    X x  
    Y y  
    Z z  
    Ź ź acento agudo
    Ż ż

    ponto

    Caracteres Checos

    Quando o sistema é configurado com checo como idioma de busca padrão (definido pela Ex Libris), caracteres do idioma são tratados como letras totalmente independentes para buscar no repositório, explorar cabeçalhos bibliográficos/F3 e ordenar. Caracteres padrão do inglês não são substituídos pelos caracteres especiais do checo. Por exemplo, C não retornará Ć (e vice-versa) nos resultados da busca. Eles não são considerados os mesmos caracteres.
    A lista de resultados é ordenada com base na ordem alfabética do checo (veja a tabela Caracteres Checos abaixo). Isto significa que palavras começando com o dígrafo ch (chemie) são ordenadas entre H e I. Esta funcionalidade também se aplica à busca de operadores por usuários, solicitações de compras e de serviços ao usuário, e depósitos.
    Caracteres Checos
    Maiúsculo Minúsculo Diacríticos
    D a  
    Á á acento agudo
    B B  
    C c  
    Č č caron
    D d  
    Ď ď acento agudo
    E e  
    É é acento agudo
    Ě ě caron
    F f  
    G g  
    H h  
    Ch ch  
    I i  
    Í í acento agudo
    J j  
    K k  
    L l  
    M m  
    N n  
    Ň ň caron
    O o  
    Ó ó acento agudo
    P p  
    Q q  
    R r  
    Ř ř caron
    S s  
    Š š caron
    T t  
    Ť ť acento agudo
    U u  
    Ú ú acento agudo
    Ů ů anel
    V v  
    W w  
    X x  
    Y y  
    Ý ý acento agudo
    Z z  
    Ž ž caron

    Caracteres Lituanos

    Quando o sistema é configurado com lituano como idioma de busca padrão (definido pela Ex Libris), caracteres do idioma são tratados como letras totalmente independentes para buscar no repositório, explorar cabeçalhos bibliográficos/F3 e ordenar. Caracteres padrão do inglês não são substituídos pelos caracteres especiais do lituano. Isto se refere a todos os caracteres lituanos: ą č ę ė į š ų ū ž Ą Č Ę Ė Į Š Ų Ū Ž.

    Caracteres lituanos podem ser buscados e encontrados usando as letras latinas correspondentes nas expressões: 

    • Aa => Ąą
    • Cc => Čč
    • Ee => ĘĖęė
    • Ii => Įį
    • Ss => Šš
    • Uu =>  ŲŪųū
    • Zz => Žž
    • A mesma regra se aplica a todas as letras baseadas em latim não padrão: alemão, polonês, letão, etc. 

    Por exemplo: Š é indexada como Š e S (e opções em minúsculo); o texto “Šarūnas“ pode ser encontrado com todas as seguintes expressões de busca: Šarūnas, Sarūnas, sarunas, saruNAS.

    Letras que não fazem parte do alfabeto lituano oficial (Q/W/X) são ordenadas de acordo com o latim. Por exemplo:  

    • Q está ordenada entre P e R
    • W está ordenada entre V e Z

    A ordem das letras é a seguinte:

    • Letras do lituano (inclui as letras latinas e as lituanas especiais citadas acima) com outras letras baseadas em latim que não latim puro (ex: polonês, alemão, escandinavo).
    • Alfabetos cirílico e não baseados e latim 
    • Chinês está no final 
    A lista de resultados é ordenada com base na ordem alfabética do lituano (veja a tabela Caracteres Lituanos abaixo). Esta ordem também se aplica à busca de operadores por usuários, solicitações de compras e de serviços ao usuário, e depósitos.
    Caracteres Lituanos
    Maiúsculo Minúsculo
    D a
    Ą ą
    B b
    C c
    Č č
    D d
    E e
    Ę ę
    Ė ė
    F f
    G g
    H h
    I i
    Į į
    Y y
    J j
    K k
    L l
    Ł ł
    M m
    N n
    O o
    P p
    R r
    S s
    Š š
    T t
    U u
    Ų ų
    Ū ū
    V v
    Z z
    Ż ż

    Aspas do lituano

    • Aspas do lituano são interpretadas da mesma maneira que no latim. Assim. para indexação, busca e ordenação, os termos “Grã-bretanha” e Grã-bretanha“ são interpretados da mesma maneira.
    • Na expressão de busca, ao usar aspas para especificar que a mesma frase deve ser buscada, somente as aspas latinas são interpretadas no Alma como busca de frase exata. As aspas do lituano não indicam uma busca de frase exata. O usuário deve usar as aspas regulares para busca de frase exata.

    Transliteração de letras russas

    O suporta transliteração de letras russas, assim resultados incluem frases tanto lituanas como russas. Por exemplo, quando o texto da expressão for kaunas, Alma encontrará tanto kaunas (Latim) como каунас (cirílico).

    Caracteres Arábicos e Persas

    Caracteres similares arábicos e persas são tratados como os mesmos caracteres para buscar no repositório, explorar cabeçalhos bibliográficos/F3 e ordenar. Por exemplo, ڤ retornará ف (e vice-versa) nos resultados da busca. 
    Os seguintes grupos de caracteres são tratados como os mesmos caracteres e são intercambiáveis:
    ا – أ – إ – آ
    ى – ي - ئ
    ه - ة - ۀ
    و - ؤ
    ك – گ – ک
    ف - ڤ
    ز - ژ
    ب - پ
    ج - چ
    ق - ڨ
    • Was this article helpful?