さまざまな言語の構成を検索する
- Almaの特殊文字の処理は、施設ゾーンでの検索にのみ関連しています。
- 特殊文字検索用に定義できる言語は1つだけです。
ドイツ語文字
| ドイツ語の文字/文字の組み合わせ | Almaデータベースに保存 |
|---|---|
| ß | ss |
| ä、Ä | ae |
| ö、Ö | oe |
| ü、Ü | ue |
| ae | ae |
| oe | oe |
| ue(母音またはqに続いていない場合) | ue |
スペイン語とカタロニア語 文字
| レター | 検索 | 並べ替え |
|---|---|---|
| Ñ/ñ | Ñ/ñを検索してもN/nの結果は返しません。 | nの後に並び替えられます。 |
| Ç/ç | Ç/çを検索してもC/cの結果は返しません。 | cの後に並び替えられます。 |
| L·L/l·l | ダイアグラフllの検索として検索されます。 | llとして並べ替え。 |
- 分音記号なし
- 急性
- 重大
- 分流
スカンジナビア語文字(スウェーデン語、ノルウェー語、デンマーク語)
スカンジナビア語以外の言語で、目録化された特殊文字(アクセント付きのフランス語文字など)は、 索引付け中に正規化されます。これは、 これらの特殊文字を含む用語 を検索すると、 あたかも特殊文字なしで検索したか のように動作します。(ただし、逆のことは起こりません:これらの特殊文字のない用語の検索は、 これらの特殊文字で行われたかのように扱われません 。)次の表には、スカンジナビア語文字の顧客向けの発音区別符号付きのすべての文字の規則が含まれています。
| 言語 | 大文字 | 小文字 | 折りたたまれたバリアント | 文字(大文字/小文字)は、次のフォーミュラで検索できます。 |
|---|---|---|---|---|
| スウェーデン語 | Å | å | Aa/aa | Å/å/Aa/aa |
| Ä | ä | Ae / ae | Ä/Ae/ä/ae | |
| Ö | ö | Oe/oe | Ø/Ö/Oe/ø/ö/oe | |
| Æ | æ | Ae / ae | Æ/æ/Ae/ae | |
| Ø | ø | Oe/oe | Ø/Ö/Oe/ø/ö/oe | |
| その他のアクセント(例:È) | その他のアクセント(例:è) | 基本文字(例:E/e) | 基本文字(例:E/e) | |
| 例:Öは Oeで検索可能ですが、 OeはÖで検索できません(ÖとOe は同等ではありません )。つまり、 Edgar Allan Poe という用語を 検索すると、 Edgar Allan Pö の結果が返されますが、その逆はありません。 Pötry という用語を検索しても、 Poetryの結果は返されません。 | ||||
| ノルウェー語/デンマーク語 | Å | å | Aa/aa | Å/Aa/å/aa 例外:Å/åはAa/aaと同等であり、 互換的に検索できます 。Aalborg を検索すると Ålborgの結果が返され、Ålborg を検索すると Aalborg の結果も返されます。 |
| Æ | æ | Ae / ae | Æ/Ä/Ae/æ/ae/ä | |
| Ø | ø | Oe/oe | Ø/Ö/Oe/ø/ö/oe | |
| Ö | ö | Oe/oe | Ø/Ö/Oe/ø/ö/oe | |
| Ä | ä | Ae / ae | Æ/Ä/Ae/æ/ae/ä | |
| その他のアクセント(例: È) | その他のアクセント(例: è) | 基本文字(例:E/e) | 基本文字(例:E/e) | |
| 例:
| ||||
| ノルウェー語/デンマーク語のソート | スウェーデン語の並べ替え |
|---|---|
|
|
アイスランド語文字
次の文字は 次のように変換されます。
- 文字Ø/ø は Ö/öに変換されます。 Ó/óの後にソートされます。
- 文字 Å/å は AA/aaに変換されます。
- å、ä、ë、ü、û、èなど、アクセントとウムラウトが付いた他のすべての特殊文字は、 デフォルト値 (a、e、uなど)に変換されます。
| 大文字 | 小文字 | 発音記号 |
|---|---|---|
| A | a | |
| Á | á | 急性 |
| B | b | |
| C | c | |
| D | d | |
| Ð | ð | eth |
| E | e | |
| É | é | 急性 |
| F | f | |
| G | g | |
| H | h | |
| I | i | |
| Í | í | 急性 |
| J | j | |
| K | k | |
| L | l | |
| M | m | |
| N | n | |
| O | o | |
| Ó | ó | 急性 |
| P | p | |
| Q | q | |
| R | r | |
| S | s | |
| T | t | |
| U | u | |
| Ú | ú | 急性 |
| V | v | |
| W | w | |
| X | x | |
| Y | y | |
| Ý | ý | 急性 |
| Z | z | |
| Þ | þ | thorn |
| Æ | æ | ae |
| Ö | ö | 分音記号 |
中国語・日本語・韓国語
中国語と韓国語の文字
日本語の文字
- 句読点の削除
- ひらがなとカタカナ間の正規化
- 反復文字正規化
- 異体字漢字の正規化
中国語・日本語・韓国語の句読点の処理
香港TSVCC
- メタデータレコードを検索
- 書誌見出しを閲覧 これには、[書誌見出しの参照]に値として入力されたTSVCC文字の検索と、参照用に表示される見出しの適切な並べ替えが含まれます。同じタイトルが異なる中国語形式(中国語の異体字を含む)で発生する場合、同等のすべてのタイトルは、参照用の見出しリストで一緒に並べ替えられます。
- 中国語のユーザー名を検索
ポーランド語文字
| 大文字 | 小文字 | 発音記号 |
|---|---|---|
| A | a | |
| Ą | ą | オゴネク |
| B | b | |
| C | c | |
| Ć | ć | 急性 |
| D | d | |
| E | e | |
| Ę | ę | オゴネク |
| F | f | |
| G | g | |
| H | h | |
| I | i | |
| J | j | |
| K | k | |
| L | l | |
| Ł | ł | ストローク |
| M | m | |
| N | n | |
| Ń | ń | 急性 |
| O | o | |
| Ó | ó | 急性 |
| P | p | |
| Q | q | |
| R | r | |
| S | s | |
| Ś | ś | 急性 |
| T | t | |
| U | u | |
| V | v | |
| W | w | |
| X | x | |
| Y | y | |
| Z | z | |
| Ź | ź | 急性 |
| Ż | ż | ドット |
チェコ語文字
| 大文字 | 小文字 | 発音記号 |
|---|---|---|
| A | a | |
| Á | á | 急性 |
| B | B | |
| C | c | |
| Č | č | caron |
| D | d | |
| Ď | ď | 急性 |
| E | e | |
| É | é | 急性 |
| Ě | ě | caron |
| F | f | |
| G | g | |
| H | h | |
| Ch | ch | |
| I | i | |
| Í | í | 急性 |
| J | j | |
| K | k | |
| L | l | |
| M | m | |
| N | n | |
| Ň | ň | caron |
| O | o | |
| Ó | ó | 急性 |
| P | p | |
| Q | q | |
| R | r | |
| Ř | ř | caron |
| S | s | |
| Š | š | caron |
| T | t | |
| Ť | ť | 急性 |
| U | u | |
| Ú | ú | 急性 |
| Ů | ů | ring |
| V | v | |
| W | w | |
| X | x | |
| Y | y | |
| Ý | ý | 急性 |
| Z | z | |
| Ž | ž | caron |
リトアニア語文字
リトアニア語の文字は、クエリで対応するラテン文字を使用して検索および発見できます:
- Aa => Ąą
- Cc => Čč
- Ee =>ĘĖęė
- Ii => Įį
- Ss => Šš
- Uu => ŲŪųū
- Zz => Žž
- 同じルールが すべての非標準ラテン語ベースの文字(ドイツ語、ポーランド語、ラトビア語など)に適用されます。
たとえば、ŠはŠとS(および小文字のオプション)として索引付けされます。「Šarūnas」 という文字列は、Šarūnas、Sarūnas、sarunas、saruNASのすべての検索クエリで見つけることができます。
リトアニア語の公式アルファベット(Q / W / X)に含まれていない文字はラテン語におけるそれぞれの自然な位置 で ソートされます。例:
- QはPとRの間でソートされます
- W はVとZの間でソートされます
文字の ソート順 は次の通りです:
- リトアニア語の文字(上記のラテン語と特別なリトアニア語の文字の両方を含む)と、純粋なラテン語ではない他のラテン語ベースの文字 (例えば ポーランド語、ドイツ語、スカンジナビア語 )。
- キリル文字とすべての 非ラテン語ベースのアルファベット
- 中国語 は 最後に あります
| 大文字 | 小文字 |
|---|---|
| A | a |
| Ą | ą |
| B | b |
| C | c |
| Č | č |
| D | d |
| E | e |
| Ę | ę |
| Ė | ė |
| F | f |
| G | g |
| H | h |
| I | i |
| Į | į |
| Y | y |
| J | j |
| K | k |
| L | l |
| Ł | ł |
| M | m |
| N | n |
| O | o |
| P | p |
| R | r |
| S | s |
| Š | š |
| T | t |
| U | u |
| Ų | ų |
| Ū | ū |
| V | v |
| Z | z |
| Ż | ż |
リトアニア語の引用符
- リトアニア語の引用符は ラテン語と同じように解釈されます。したがって、索引付け中、検索、および順序付けの場合、用語 「イギリス」と „イギリス」も同じように解釈されます。
- 検索クエリで、引用符を使用して完全一致検索するように指定すると、Almaではラテン語の引用符のみが完全一致検索として解釈されます。 リトアニア語の引用符は、完全一致検索を示しません。ユーザーは、完全一致検索に通常の引用符を使用する必要があります。
ロシア語の文字の音訳
Almaはロシア語の文字の音訳をサポートしているため、結果にはリトアニア語 とロシア語のフレーズの両方が含まれます。例:実際のクエリ文字列が kaunasの場合、 Almaは kaunas (ラテン語)と каунас (キリル語)の両方を見つけます。
アラビア語とペルシア語 文字
ا – أ – إ – آ
ى – ي - ئ
ه - ة - ۀ
و - ؤ
ك – گ – ک
ف - ڤ
ز - ژ
ب - پ
ج - چ
ق - ڨ
クロアチア語文字
クロアチア語の文字は、次のようなクエリで対応するラテン文字を使用して検索および発見できます:
- Cc => ČĆčć
- Dd => DžĐdžđ
- Ee =>ĘĖęė
- Li => Ljlj
- Nn => Njnj
- Ss => Šš
- Zz => Žž
同じルールが すべての非標準ラテン語ベースの文字(ドイツ語、ポーランド語、ラトビア語など)に適用されます。
たとえば、ŠはŠおよびS(および小文字のオプション)として索引付けされます。Šrętan という文字列は、Šrętan、Srętan、sretan、sreTANのすべての検索クエリで見つけることができます。
クロアチア語の公式アルファベット(Q / W / X)に含まれていない文字はラテン語におけるそれぞれの自然な位置 で ソートされます。例:
- QはPとRの間でソートされます
- W はVとZの間でソートされます
文字の ソート順 は次の通りです:
- クロアチア語の文字(上記のラテン語と特別なクロアチア語の文字の両方を含む)と、純粋なラテン語ではない他のラテン語ベースの文字 (例えば ポーランド語、ドイツ語、スカンジナビア語)。
- キリル文字とすべての 非ラテン語ベースのアルファベット
- 中国語 は 最後に あります
| 大文字 | 小文字 |
|---|---|
| A | a |
| B | b |
| C | c |
| Č | č |
| Ć | ć |
| D | d |
| Dž | dž |
| Đ | đ |
| E | e |
| F | f |
| G | g |
| H | h |
| I | i |
| J | j |
| K | k |
| L | l |
| Lj | lj |
| M | m |
| N | n |
| Nj | nj |
| O | o |
| P | p |
| R | r |
| S | s |
| Š | š |
| T | t |
| U | u |
| V | v |
| Z | z |
| Ž | ž |

