元数据编辑器中的AI元数据助手
什么是AI元数据助手
AI元数据助手使用大型语言模型生成式AI来处理有关图书馆资源的信息,并向编目员建议相关元数据,以协助执行更快速、更高效的编目。然后,编目员可以复核建议的数据并接受、更正或删除它,以及添加更复杂、更专业的元数据和特定于图书馆的元数据。
AI元数据助手可以处理图书馆资源的图像以及其他提供的信息,提取文本和含义,并根据编目标准将其以结构化方式返回。它可用于创建新的书目记录,以及完善现有的简要记录。
阶段I
Alma的AI元数据助手第I阶段支持用英语创建和完善MARC 21记录 – 随着我们与社区合作评估AI的功能和元数据质量,未来阶段将添加更多的编目和资源语言与格式。
所提供的主题根据美国国会图书馆词汇进行验证,并计划在未来阶段增加规范词汇的选择。
未来计划
未来阶段的计划包括支持更多语言、规范词汇和编目格式。
我们正在与世界各地的各种图书馆合作,评估以下方面的可用性和元数据质量:
- 更多语言、主题词汇和编目格式。
- 批量记录完善流程
- 批量记录创建流程
我们也在探索批量流程的选项 – 评估哪些元数据在哪些场景和工作流程中对图书馆有用。
功能和限制
该服务应用生成AI,这可能会导致输出的局限性、不准确性或偏差 – 中介工作流程将AI功能与图书馆员的专业知识相结合,以平衡效率和准确性。
大型语言模型生成式AI工具非常灵活,其响应因用途不同而有所区别,并且随着时间的推移而演变。我们正在持续与社区合作,最大限度地提高返回数据的实用性和准确性,同时保持提示和数据处理的效率。
然而,尽管我们谨慎地措辞提示,但仍存在AI出现以下问题的情况:
- 返回不准确或通用的数据(例如不相关的版本信息)。
- 不像专家编目员那样准确遵循编目标准(例如缺少ISBD标点符号或使用错误的MARC字段指示符)。
- 不返回所有请求的元数据字段。
- 在对某些语言的资源进行编目时无法准确处理这些语言。
- 对于某些规范词汇,没有返回正确的主题。
- 在某些条件下无法始终顺利处理图像,例如图像质量不佳、图像背景包含大量噪点或图像未直立。
我们正在采取哪些措施来缓解这些限制
-
与编目员和Alma共享区合作评估元数据质量并进行改进。
-
根据规范文件验证返回的主题:我们检查返回的主题是否与现有的规范记录相匹配,并将全部或部分链接至该主题。它可能与首选或非首选词匹配 - 如果AI建议使用非首选词,则编目员可以使用元数据编辑器中的F3键将其更新为首选词,或者通过计划的“规范 - 首选词更正”作业自动更新(有关更多信息,请见与规范记录相关的作业)。
-
与不同语言和词汇的图书馆合作,根据AI模型不断增长的能力,逐步增加对不同语言和词汇的支持。
-
应用规范化进程来格式化和清理数据,以及添加数据出处信息。
-
使用新的计划作业“同步AI设置”监控编目员的反馈并定期更新我们的提示。
-
针对图书馆开发工具来配置本地规范化进程并自行决定保留或添加哪些数据。
在您的Alma环境中启用AI元数据助手
要启用AI元数据助手,您必须具有以下角色:
- 通用管理员
- 编目管理员
所有机构默认禁用AI元数据助手。
一旦管理员复核这种生成式AI工具的优势和局限性,了解其风险,并决定图书馆是否以及如何使用它,他们就可以在配置菜单 > 资源 > 编目 > AI使用配置文件下接受元数据编辑器中的AI元数据助手免责声明,方法是将其设置为“是”并保存。
管理员在环境中启用AI元数据助手后,具有“AI辅助编目”角色的编目员将能够开始使用该助手。
在沙盒环境中测试
使用新作业“同步AI设置”定期更新AI元数据助手设置。这可确保随着AI模型的发展和变化,AI提示仍然有效且保持最新状态。
由于计划作业在沙盒环境中被禁用,在测试AI元数据助手之前,请运行“同步AI设置”,以便使用当前设置进行测试。
- 转至“监控作业”>“已计划”选项卡
- 过滤至作业类别 = 数据服务
- 在“同步AI设置”的行操作中选择“立即运行”(在沙盒环境中可用)
作业完成后,具有所需角色的编目员可以在元数据编辑器中测试AI助手 - 有关更多信息,请见使用AI元数据助手。
在“AI使用量配置文件”配置页面中启用AI元数据助手可能需要在沙盒刷新后重新设置。
配置AI元数据助手
要配置AI元数据助手,您必须具有以下角色:
- 通用管理员
- 编目管理员
使用规范化进程更正生成的元数据
为了让图书馆更全面地控制AI生成元数据的使用,机构可以使用规范化进程更正元数据。规范化规则可用于移除、替换或添加元数据字段与子字段 - 例如,机构可以选择添加与其编目相关的本地字段,在由AI生成时将数据出处子字段(例如备注字段中的$$7)添加到特定字段,移除他们不想包含生成元数据(如果已生成)的某些字段,等等。
在生成的草稿可供编目员使用之前,所选的规范化进程将应用于创建和完善工作流程中生成的元数据。
如果生成的数据与现有记录合并(使用AI助手增强记录时)或从模板扩展以添加缺失字段(创建新记录时) - 在合并之前,规范化进程将仅适用于AI生成的数据。
可以在“AI使用量配置文件”页面(配置菜单 > 资源 > 编目 > AI使用量配置文件)中配置在操作AI元数据助手时使用的规范化进程。
选择利用AI助手完善记录的合并方法
当利用AI元数据助手完善记录时,生成的元数据会与完善的记录合并 - 图书馆的现有记录视为首选记录。
立即使用,图书馆的数据不会被覆盖。如果出现以下情况,AI生成的元数据将添加到记录中:
- 该字段是可重复的
- 该字段不可重复,且在首选记录中不存在
机构可以通过覆盖默认合并规则并选择本地合并规则来控制AI元数据助手在完善过程中生成的数据的使用 - 例如,如果记录中已经存在某些可重复字段(例如生产和出版信息),则选择不添加这些字段,或者覆盖已知有问题的某些字段。更多信息见使用合并规则。
可以在“AI使用量配置文件”页面(配置菜单 > 资源 > 编目 > AI 使用配置文件)配置在利用AI元数据助手完善记录时使用的覆盖合并方法。
使用AI元数据助手
要使用元数据编辑器中的AI元数据助手,您必须同时具备以下两个角色:
- 编目员
- AI辅助编目
使用AI元数据助手需要专用的角色,以便让图书馆控制哪些编目员使用生成式AI工具。
您可以使用AI元数据助手创建新的书目记录,或完善现有的简要记录。一旦助手完成记录处理,包含其建议元数据的草稿将推送到元数据编辑器,供您复核并接受、更正或解除。实时通知将表明草稿已准备好供您处理。
创建新报告
- 在元数据编辑器的“新建”菜单下,选择使用AI助手创建。
这将打开“来自AI助手的新记录”弹出窗口。“来自AI助手的新记录”字段: 字段 描述 题名 必备。提供要创建的资源的题名。 著者 可选。提供有关资源著者或创建者的信息。 ISBN 可选。提供图书的ISBN。 内容备注 可选。提供有关资源内容的信息。 摘要备注 可选。提供资源摘要。 记录格式 当前,仅支持Marc21。 从模板扩展 扩展生成的元数据时使用的模板。
选中时,在处理和规范化AI生成的元数据后,模板中缺失的任何字段都将添加到生成的草稿记录中,以确保编目员不会遗漏图书馆所需的任何字段。
Alma会记住您选择的模板以供将来使用AI元数据助手,因此仅当您更改正在编目的资源类型并需要使用其他模板时,才需要更改此设置。附件 可选。上传最多4个包含资源相关信息的文件(例如,图书的封底、目录、从出版商处收到的资源描述等)。
支持的格式为:
- jpeg
- png
- gif
- pdf - 上传pdf文件时,AI将提取并处理该pdf的前4页
您可以从设备中选择一个文件,或者使用设备相机拍摄资源的图像。可以裁剪图像以聚焦包含相关信息的区域,从而提高返回响应的质量。
- 选择生成记录将信息提交给AI。
当AI处理信息时,您可以继续在Alma中工作,并且当生成的元数据建议可以在元数据编辑器中处理时,您会收到通知 - 有关更多信息,见审查AI元数据建议。
完善简要记录
- 在元数据编辑器中,以编辑模式打开您想要完善的记录。在“编辑”操作下,选择通过AI助手增强。 这将打开“完善来自AI助手的记录”弹出窗口,其中显示您选择完善的记录的题名,以便您确保正在完善所选的记录。
您还可以附加最多4张资源图像,其中包含相关信息(例如,图书的封底、目录、从出版商处收到的资源描述等)。支持的格式为:jpeg、png、gif 和 pdf(上传pdf文件时,将提取pdf的前4页并由AI处理)。
您可以从设备中选择一个文件,或者使用设备相机拍摄资源的图像。可以裁剪图像以聚焦包含相关信息的区域,从而提高返回响应的质量。
- 选择完善记录将信息提交给AI。
- 该记录被锁定以进行编辑,直到AI处理完成为止,并且可以在MDE中作为仅查看记录使用。当AI处理信息时,您可以继续在Alma中工作,并且当建议的元数据可以在元数据编辑器中处理时,您会收到通知 - 有关更多信息,见审查AI元数据建议。
审查AI生成的元数据建议
当包含AI生成的元数据建议的草稿可供您处理时,将显示一个包含元数据编辑器中草稿链接的通知:
您还可以在“实时通知”菜单的“编目”类别中查看有关已触发的已完成AI元数据助手任务的信息:
在元数据编辑器中,需要审查的草稿记录标有“AI生成”或“AI完善”标记,以便于识别 - 一旦编目员审查并保存草稿,此标记就会移除:
可以根据需要编辑、保存或解除草稿。
AI生成的未保存元数据建议以紫色显示,以帮助编目员识别和审查它们;如果有需要审查的警告,则以橙色显示(无论来源如何,带有警告的字段都以相同方式显示:现有记录、模板或AI生成)。
在Alma移动应用程序中使用AI元数据助手 - 即将推出!
Alma移动应用程序可让图书馆员使用移动设备相机处理图书馆资源 - 例如扫描单册条码。
具有“AI辅助编目”角色的编目员将能够使用该功能轻松拍摄图书馆资源的照片并将其发送给AI元数据助手进行处理。
一旦助手完成图像处理,包含AI助手建议的元数据的草稿将推送到元数据编辑器,供编目员复核并接受、更正或解除。
您可以通过扫描单册条码来检索要完善的记录,从而完善现有记录,然后使用移动设备的相机拍摄该单册的照片并将其提交给AI元数据助手。
您还可以通过提交题名和图像(以及根据需要填写更多可选信息)来创建新记录。
提交反馈
要提交有关所生成元数据建议质量的反馈,请在处理使用AI元数据助手创建/完善的草稿时点击MD编辑器中的“AI反馈”按钮。此反馈用于监控和维护一段时间内AI生成的元数据质量。
选择您想要为AI生成的元数据建议给出的分数(从1到5),然后输入评论以提供更多详细信息:
使用AI建议的元数据识别记录
使用AI元数据助手创建或完善记录时,该信息以两种方式在Alma中进行维护:
- 已生成草稿中的MARC 21元数据:
- 除了AI生成的元数据建议之外,还向草稿中添加588描述来源备注 - 此字段可在Alma中检索。
- 如果AI生成的元数据包含520摘要备注,则会添加数据出处($$7)子字段,表明它是由AI生成(无论摘要是从图像复制还是由AI创建,始终都会添加此字段,因为AI复制数据的过程可能会对其进行一些更改)。
- 管理员还可以配置规范化进程,将其他字段或子字段添加到草稿中(例如,包含编目AI元数据策略信息的本地字段) - 有关更多信息,见配置AI元数据助手。
- 书目记录信息:保存包含AI生成的元数据建议的草稿时(未发布或丢弃) - 会记录有关使用AI元数据助手的信息,然后可以在分析报告和记录版本中查看这些信息。
在分析报告中查看AI元数据助手信息
您可以在分析报告的题名主题区域中找到AI元数据助手信息。
每条记录的书目详细信息都包含有关它是使用AI创建还是使用AI完善的信息。
此外,题名度量表可让图书馆创建使用AI助手创建或使用AI助手完善的题名数量的报告。
常见问题
-
问:我用来创建或完善记录的数据是否用于训练AI?
答:否,我们与AI共享数据只是为了处理,而不是为了训练AI。 -
问:元数据来自何处?
答:元数据由AI LLM根据编目员提供的信息(手动或从正在完善的书目记录中提供)生成。目前,支持的输入信息是书目元数据,例如资源的题名(必填),以及包含资源图像的文件(例如题名页、封底、目录、出版商描述)。与所有AI模型一样,该模型的训练数据也用于生成响应 - 其中包括MARC字段和子字段、相关LC主题的知识,以及AI模型的训练数据中是否存在有关特定资源的信息(例如出版年份、著者出生年份、资源描述) - 这些信息也可以用于生成元数据。
-
问:AI会执行在线搜索来为我获取数据吗?
答:不会 - 我们的AI平台不使用在线检索,而是根据图书馆生成的信息以及AI训练数据中存在的信息提供元数据。 -
问:如果我上传图书图像,它们会保存在任何位置吗?
答:不会,我们仅使用图像来建议元数据,而不会将其保存用于任何其他用途。 -
问:AI会为我编目吗?
答:AI助手建议供编目员复核的元数据。
编目员对其进行复核,并可以接受、更正或拒绝建议。由于生成式AI可能会导致输出不准确或偏差,因此结合人力和技术能力可以提供更简化、更高效的编目体验,同时保持数据完整性。 -
问:为什么每次使用AI元数据助手时,我都会获得针对同一资源的不同元数据建议?
答:大型语言模型生成式AI工具非常灵活,其响应因用途而异,并且会随着时间的推移而发展。AI返回的元数据每次都会根据提供给它的信息、正在编目的资源以及AI本身的内部处理而变化。 -
问:AI元数据助手可以用来完善编目中的任何记录吗?
答:不可以 - AI助手只能用于完善未锁定编辑的记录,并且用户可以根据自己编目角色和级别进行编辑。
此外,第I阶段仅支持MARC 21格式的记录,不支持完善CZ记录。
对于网络区成员来说,创建或完善网络区记录的能力也取决于网络区的设置。 -
问:第I阶段支持使用LC规范对图书进行英文MARC 21编目 - 下一阶段有什么计划?
答:我们正在与世界各地的图书馆进行交流,以了解工作流程和评估需求,并与社区一起决定下一步的关注重点。选项包括更多工作流程、更多编目语言和更多主题词汇。 -
问:如何确保返回的主题是真实的?
答:我们检查返回的主题是否与现有的规范记录相匹配,并将全部或部分链接至该主题。它可能与首选或非首选词匹配 - 如果AI建议使用非首选词,则编目员可以使用元数据编辑器中的F3键将其更新为首选词,或者通过计划的“规范 - 首选词更正”作业自动更新(有关更多信息,请见与规范记录相关的作业)。 -
问:AI可以提供任何MARC 21字段吗?
答:不可以。我们要求AI助手生成最有用的字段,保持实用性和准确性的平衡,并且Alma会处理来自AI的建议元数据字段,以记录草稿格式向编目员提供建议,以便于审查和执行工作流程。我们正在与社区合作,评估并决定不同字段的实用性。
AI还可能生成未请求的字段,其中可能包含有用的信息。由于AI以概率的方式生成元数据,它有时也可能生成不相关的字段,例如本地字段、系统编号或不代表记录的记录气源(因为没有复制记录,而是仅生成特定元数据) - 此类字段可能包含不相关或通用的数据,在处理结果时,Alma会移除这些数据。 -
问:图书馆内的每个人都可以使用AI元数据助手吗?
答:图书馆控制对此工具的访问:AI元数据助手工作流程嵌入在元数据编辑器中 - 需要成为一名编目员才能创建或编辑书目记录,并且要拥有新的AI辅助编目角色才能使用新的工作流程。 -
问:我可以选择不在自己的图书馆中使用AI完善的数据吗?
答:当然可以!图书馆可以完全控制此工具的使用。要使用AI元数据助手,图书馆的总管理员应首先在新的AI使用配置文件配置页面中为机构启用此功能。 -
问:我是网络区成员 – 可以使用AI来完善网络区记录吗?
答:当然可以!如果网络区启用AI元数据助手,那么其机构内启用该助手的任何成员都将能够使用它来增强网络区记录。 -
问:我的网络区限制某些字段的编辑 – AI是否仍然可以创建它们?
答:不可以。网络区强制执行的任何限制也适用于AI元数据助手工作流程 – 编目员只能使用该助手来创建或完善其被允许手动创建或完善的元数据。