不同语言的检索配置
当使用Alma仓储检索(或在检索用户、采购请求和读者服务请求时),您可以检索特殊字符和带有变音符号的字符。Alma中有以下语言的检索语言配置(由Ex Libris设置)可用。Alma使用标准程序来处理这些语言中的大多数特数字符。
- Alma的特殊字符处理仅与在机构区检索有空。
- 只能对特殊字符检索定义一种语言。
语言的规范化特定于文本字段,如题名和作者。对于包含规范化值的字段(例如索书号)或数字字段,不进行规范化。
德语字符
当您的系统配置德语作为默认检索语言时,系统会按照以下方式处理德语语言字符:
德语字符/字符组合 | 存储在Alma数据库中 |
---|---|
ß | ss |
ä, Ä | ae |
ö, Ö | oe |
ü, Ü | ue |
ae | ae |
oe | oe |
ue(不跟随元音或q) | ue |
将您的系统配置德语作为默认语言且上表中标识的德语特殊字符存储在系统中时,您可以使用特殊umlaut和Eszett字符或这些字符的扩展拉丁语版本检索(如上面的第二列所示),检索结果将被平等对待。所以,例如,如果您检索Müller,系统将返回üMüller和Mueller的结果,而不是Muller。
对于默认语言不是德语的系统,检索Müller将返回Müller和Muller而不是Mueller的检索结果。
当您的机构(以及网络区)配置德语作为默认检索语言时,标准德语特殊字符检索功能在机构区、网络区和共享区中可用。
对于配置德语为默认检索语言的机构,使用DIN 5007-1/2,第6.1.1.4.1/2节标准对仓储检索结果、用户检索结果和读者服务请求检索结果进行排序。除了考虑特殊的德语字符之外,当检索结果排序时,忽略连字符
当对书目和规范题名内容排序时,出于排序目的,Alma会为检索语言参数配置为德语的机构移除破折号。
当您使用Alma浏览书目题名功能时,使用相同的分类标准(DIN 5007-1/2,第6.1.1.4.1/2节)对书目题名进行排序。有关更多信息,见浏览书目题名。
西班牙语和加泰罗尼亚语字符
当您的系统配置西班牙语作为默认检索语言时(由Ex Libris设置),仓储检索、浏览书目主题/F3和排序时将特殊西班牙语字符作为完整的单独字母处理。标准英语字符不会替代特殊西班牙语字符。下表描述Alma如何处理特殊西班牙语字符:
信件 | 检索 | 排序 |
---|---|---|
Ñ/ñ | 检索Ñ/ñ不会检索N/n的结果,反之亦然。 | 排在n之后。 |
Ç/ç | 检索Ç/ç不会检索C/c的结果,反之亦然。 | 排在c之后。 |
L·L/l·l | 按照连字ll检索。 | 做为ll排序。 |
变音符号按以下顺序排列:
- 没有变音符号
- Acute
- Grave
- Dieresis
北欧语言字符(瑞典语、挪威语、丹麦语)
Alma通过将可互换的斯堪的纳维亚字符æ Æ ä Ä ö Ö ø Ø 和折叠变体(aa, ao, ae, oe and oo)转换成æ Æ å Å ø Ø来实现规范化。
在非斯堪的纳维亚语言中编目的特殊字符(如带有音调的法语字母)索引时不会规范化。这意味着对含有特殊字符的词语的检索与不含有特殊字符的检索一致。(但是,相反的情况不会发生:对于不含有特殊字符的词语的检索不会与含有特殊字符的检索一致。)下表为对北欧客户的所有有变音符号的字符的规则:
语言 | 大写 | 小写 | 折叠变体 | 字符(大写/小写)可以通过以下方式检索: |
---|---|---|---|---|
瑞典语 | Å | å | Aa/aa | Å/å/Aa/aa |
Ä | ä | Ae/ae | Ä/Ae/ä/ae | |
Ö | ö | Oe/oe | Ø/Ö/Oe/ø/ö/oe | |
Æ | æ | Ae/ae | Æ/æ/Ae/ae | |
Ø | ø | Oe/oe | Ø/Ö/Oe/ø/ö/oe | |
其他符号(例如È) | 其他符号(例如è) | 基础字符(例如E/e) | 基础字符(例如E/e) | |
例如,Ö可以通过Oe检索,但是Oe不可以通过Ö检索[Ö和Oe不等同]。这意味着检索Edgar Allan Poe会返回Edgar Allan Pö的结果,但是反过来则不行:检索Pötry不会返回Poetry的结果。 | ||||
挪威语/丹麦语 | Å | å | Aa/aa | Å/Aa/å/aa 例外:Å/å等同于Aa/aa,它们可以替换检索。检索Aalborg返回Ålborg的结果,检索Ålborg也会返回Aalborg的结果。 |
Æ | æ | Ae/ae | Æ/Ä/Ae/æ/ae/ä | |
Ø | ø | Oe/oe | Ø/Ö/Oe/ø/ö/oe | |
Ö | ö | Oe/oe | Ø/Ö/Oe/ø/ö/oe | |
Ä | ä | Ae/ae | Æ/Ä/Ae/æ/ae/ä | |
其他符号(例如È) | 其他符号(例如è) | 基础字符(例如E/e) | 基础字符(例如E/e) | |
例如:
|
员工检索和浏览书目主题/F3的挪威语和丹麦语特殊字符排序处理方式与瑞典语特殊字符的排序方式不同。见下文对每种语言的排序方式:
挪威语/丹麦语排序 | 瑞典语排序 |
---|---|
|
|
挪威语和丹麦语的规范化以斯堪的纳维亚语规范化过滤器中描述的方式处理。对于瑞典语,Alma以相同的方式对斯堪的纳维亚文字进行规范化。
冰岛语字符
当您的系统配置冰岛语作为默认检索语言时(由Ex Libris设置),仓储检索、浏览书目主题/F3和排序时将冰岛语字符作为完整的单独字母处理。标准英语字符不会替代特殊冰岛语字符。例如,a不会返回á的检索结果,反之亦然(检索“sál”时,Alma不会返回“sal”)。它们不会被考虑为相同的字符。
以下字符的转换方式如下:
- Ø/ø转换为Ö/ö。排在Ó/ó之后。
- Å/å转换为AA/aa。
- 所有其他带有特殊符号和变音符的字符,例如ä、ë、ü、û、è,都转换为默认值(a、e、u等)。
结果列表根据冰岛语字母顺序排序(见下表的冰岛语字符)。该功能也应用于用户、采购、读者服务请求和缴存的员工检索。
大写 | 小写 | 区分标志 |
---|---|---|
A | a | |
Á | á | acute |
B | b | |
C | c | |
D | d | |
Ð | ð | eth |
E | e | |
É | é | acute |
F | f | |
G | g | |
H | h | |
I | i | |
Í | í | acute |
J | j | |
K | k | |
L | l | |
M | m | |
N | n | |
O | o | |
Ó | ó | acute |
P | p | |
Q | q | |
R | r | |
S | s | |
T | t | |
U | u | |
Ú | ú | acute |
V | v | |
W | w | |
X | x | |
Y | y | |
Ý | ý | acute |
Z | z | |
Þ | þ | thorn |
Æ | æ | ae |
Ö | ö | 分音符 |
CJK语言
CJK标点符号处理
对于有中文、香港、日语或韩语检索设置的机构,在显示CJK文本时在索引过程中移除所有的标点。但是,在检索时标点保留。这保证可以得到最佳的检索结果。请注意,CJK内容的显示会显示标点。
香港 TSVCC
Alma执行于2006年7月18日发布的香港创新用户组(HKIUG)TSVCC(繁体,简体,变体汉字)标准1.0版本。除了处理传统和简体中文外,在执行以下操作时,Alma也会处理不同的汉字:
- 检索元数据记录
- 浏览书目题名 这包括检索在浏览书目主题中为检索值输入的TSVCC字符,并正确排列用于浏览的题名。当相同的题名出现在不同的中文形式(包括不同的汉字)中时,所有相同的题名在题名列表中一起排列,以进行浏览。
- 检索中文用户名
TSVCC汉字处理适用于将Alma检索语言参数设置为香港的机构。如果您需要启用此机构参数,请联系Ex Libris支持。
有关完整的HKIUG TSVCC表(UNICODE版本),见http://hkiug-archive.lib.hku.hk/unicode/hkiug_tsvcc_table-UnicodeVersion-1.0.html。
波兰语字符
当您的系统配置波兰语作为默认检索语言时(由Ex Libris设置),仓储检索、浏览书目主题/F3和排序时将波兰语字符作为完整的单独字母处理。标准英语字符不会替代特殊波兰语字符。例如,检索结果中C不会返回Ć(反之亦然)。它们不会被考虑为相同的字符。
结果列表根据波兰语字母顺序排序(见下表的波兰语字符)。例如,być在bycie之后。该功能也应用于用户、采购、读者服务请求和缴存的员工检索。
大写 | 小写 | 区分标志 |
---|---|---|
A | a | |
Ą | ą | ogonek |
B | b | |
C | c | |
Ć | ć | acute |
D | d | |
E | e | |
Ę | ę | ogonek |
F | f | |
G | g | |
H | h | |
I | i | |
J | j | |
K | k | |
L | l | |
Ł | ł | stroke |
M | m | |
N | n | |
Ń | ń | acute |
O | o | |
Ó | ó | acute |
P | p | |
Q | q | |
R | r | |
S | s | |
Ś | ś | acute |
T | t | |
U | u | |
V | v | |
W | w | |
X | x | |
Y | y | |
Z | z | |
Ź | ź | acute |
Ż | ż | dot |
捷克语字符
当您的系统配置捷克语作为默认检索语言时(由Ex Libris设置),仓储检索、浏览书目主题/F3和排序时将捷克语字符作为完整的单独字母处理。标准英语字符不会替代特殊捷克语字符。例如,检索结果中C不会返回Ć(反之亦然)。它们不会被考虑为相同的字符。
结果列表根据捷克语字母顺序排序(见下表的捷克语字符)。这意味着以复合字母ch开头的单词(chemie)排在H和I之间。该功能也应用于用户、采购、读者服务请求和缴存的员工检索。
大写 | 小写 | 区分标志 |
---|---|---|
A | a | |
Á | á | acute |
B | B | |
C | c | |
Č | č | caron |
D | d | |
Ď | ď | acute |
E | e | |
É | é | acute |
Ě | ě | caron |
F | f | |
G | g | |
H | h | |
Ch | ch | |
I | i | |
Í | í | acute |
J | j | |
K | k | |
L | l | |
M | m | |
N | n | |
Ň | ň | caron |
O | o | |
Ó | ó | acute |
P | p | |
Q | q | |
R | r | |
Ř | ř | caron |
S | s | |
Š | š | caron |
T | t | |
Ť | ť | acute |
U | u | |
Ú | ú | acute |
Ů | ů | ring |
V | v | |
W | w | |
X | x | |
Y | y | |
Ý | ý | acute |
Z | z | |
Ž | ž | caron |
立陶宛语字符
当您的系统配置立陶宛语作为默认检索语言时(由Ex Libris设置),仓储检索、浏览书目主题/F3和排序时将立陶宛语字符作为完整的单独字母处理。标准英语字符不会替代特殊立陶宛语字符。这适用于以下立陶宛语字符:ą č ę ė į š ų ū ž Ą Č Ę Ė Į Š Ų Ū Ž。
可以使用对应的拉丁字母查找立陶宛语字符:
- Aa => Ąą
- Cc => Čč
- Ee => ĘĖęė
- Ii => Įį
- Ss => Šš
- Uu => ŲŪųū
- z => Žž
- 相同的规则适用于所有非标准拉丁字母:德语、波兰语、拉脱维亚语等。
例如:Š索引为Š和S(以及小写选项);文本“Šarūnas“可在以下检索中找到:Šarūnas、Sarūnas、sarunas、saruNAS。
不为官方立陶宛语字母表一部分的字母(Q/W/X)根据拉丁语中的自然顺序排序。例如:
- Q排在P和R之间
- W排在V和Z之间
字母的排序顺序如下:
- 立陶宛语字母(同时包含拉丁语和特殊立陶宛语字母)与其他基于拉丁语但不是纯拉丁语的字母(例如,波兰语、德语、斯堪的纳维亚语)。
- 西里尔和所有不基于拉丁语的字母
- 中文在最后
结果列表根据立陶宛语字母顺序排序(见下文立陶宛语表格)。该排序方式也应用于用户、采购、读者服务请求和缴存的员工检索。
大写 | 小写 |
---|---|
A | a |
Ą | ą |
B | b |
C | c |
Č | č |
D | d |
E | e |
Ę | ę |
Ė | ė |
F | f |
G | g |
H | h |
I | i |
Į | į |
Y | y |
J | j |
K | k |
L | l |
Ł | ł |
M | m |
N | n |
O | o |
P | p |
R | r |
S | s |
Š | š |
T | t |
U | u |
Ų | ų |
Ū | ū |
V | v |
Z | z |
Ż | ż |
立陶宛语引号
- 立陶宛语引号与拉丁语的解读方式一致。因此对于索引、检索和下订,词语"Great Britain"和„Great Britain“一样。
- 在检索查询中,使用引号指定精确检索的短语是,Alma中只会将拉丁引号理解为精确短语检索 。立陶宛语引号不代表精确检索。用户需要使用常规引号进行精确检索。
俄语字母音译
Alma支持俄语字母音译,因此结果会同时包含立陶宛语和俄语短语。例如,当检索文本为kaunas时,Alma会找到kaunas和каунас 。
阿拉伯语和波斯语字符
仓储检索、浏览书目主题/F3和排序中类似的阿拉伯语/波斯语字符作为相同的字符对待。例如,ڤ返回ف的结果(反之亦然)。
以下字符组被视为相同的字符,不可交换更改:
ا – أ – إ – آ
ى – ي - ئ
ه - ة - ۀ
و - ؤ
ك – گ – ک
ف - ڤ
ز - ژ
ب - پ
ج - چ
ق - ڨ
ا – أ – إ – آ
ى – ي - ئ
ه - ة - ۀ
و - ؤ
ك – گ – ک
ف - ڤ
ز - ژ
ب - پ
ج - چ
ق - ڨ