元数据编辑器中的AI元数据助手
什么是AI元数据助手
AI元数据助手使用大型语言模型生成式AI来处理有关图书馆资源的信息,并向编目员建议相关元数据,以协助执行更快速、更高效的编目。然后,编目员可以复核建议的数据并接受、更正或删除它,以及添加更复杂、更专业的元数据和特定于图书馆的元数据。
AI元数据助手可以处理图书馆资源的图像以及其他提供的信息,提取文本和含义,并根据编目标准将其以结构化方式返回。它可用于创建新的书目记录,以及完善现有的简要记录。
第I阶段预览模式
Alma的AI元数据助手第I阶段支持用英语创建和完善MARC 21记录 – 随着我们与社区合作评估AI的功能和元数据质量,未来阶段将添加更多的编目和资源语言与格式。
所提供的主题根据美国国会图书馆词汇进行验证,并计划在未来阶段增加规范词汇的选择。
请注意,预览模式不是AI元数据助手的最终形式!这是一种初始模式,旨在为图书馆提供体验元数据完善和参与反馈过程的机会。当该功能正式发布并投入使用时,预计工作流程本身和返回的元数据都会得到进一步的改进。
与此同时,欢迎图书馆在其沙盒或生产环境中使用该功能,并获得其作用的初步印象 - 请参阅下面的“在您的Alma中启用AI元数据助手”。
我们欢迎您提供反馈,您可以在处理使用AI创建或完善的草稿时通过MD编辑器中的“AI反馈”按钮提交反馈。
功能和限制
该服务应用生成AI,这可能会导致输出的局限性、不准确性或偏差 – 中介工作流程将AI功能与图书馆员的专业知识相结合,以平衡效率和准确性。
大型语言模型生成式AI工具非常灵活,其响应因用途不同而有所区别,并且随着时间的推移而演变。我们正在与社区合作,最大限度地提高返回数据的实用性和准确性,同时保持提示和数据处理的效率。
然而,尽管我们谨慎地措辞提示,但仍存在AI出现以下问题的情况:
- 返回不准确或通用的数据(例如不相关的版本信息)。
- 不像专家编目员那样准确遵循编目标准(例如缺少ISBD标点符号或使用错误的MARC字段指示符)。
- 未返回所有请求的MARC字段。
- 在对某些语言的资源进行编目时无法准确处理这些语言。
- 对于某些规范词汇,没有返回正确的主题。
- 在某些条件下无法始终顺利处理图像,例如图像质量不佳、图像背景包含大量噪点或图像未直立。
我们正在采取哪些措施来缓解这些限制
-
与编目员和Alma共享区合作评估元数据质量并进行改进。
-
根据规范文件验证返回的主题:我们检查返回的主题是否与现有的规范记录相匹配,并将全部或部分链接至该主题。它可能与首选或非首选词匹配 - 如果AI建议使用非首选词,则编目员可以使用元数据编辑器中的F3键将其更新为首选词,或者通过计划的“规范 - 首选词更正”作业自动更新(有关更多信息,请见与规范记录相关的作业)。
-
与不同语言和词汇的图书馆合作,根据AI模型不断增长的能力,逐步增加对不同语言和词汇的支持。
-
应用规范化进程来格式化和清理数据,以及添加数据出处信息。
-
使用新的计划作业“同步AI设置”监控编目员的反馈并定期更新我们的提示。
-
针对图书馆开发工具来配置本地规范化进程并自行决定保留或添加哪些数据。
我们的全面推出计划
AI元数据助手的第I阶段目前已推出预览模式
我们正在不断增强和改进AI元数据助手的功能。为全面推出第I阶段的版本,我们正在开展的一些工作包括:
- 在AI的帮助下选择在创建新记录时使用机构的哪个模板,以便生成的草稿包括图书馆首选字段、本地信息等,并可立即供编目员使用。
- 配置使用AI元数据助手创建或完善书目记录时使用的本地规范化规则,以便更妥善地控制使用哪些AI生成的元数据。
- 配置在完善现有书目记录时使用的本地合并方法。
- 与编目员合作进一步增强提示,以改进:
- 建议元数据的质量和一致性
- 对非英语资源进行分类的支持(取决于AI对该语言的处理准确性)。
- 根据早期访问的反馈,我们正探索在AI元数据助手工作流程中添加最多4张图书馆资源图像的选项 - 限制提供图像的数量以平衡编目员的需求、技术影响和版权问题,从而最大限度地提升效率和表现。
在您的Alma环境中启用AI元数据助手
要启用AI元数据助手,您必须具有以下角色:
- 通用管理员
- 编目管理员
所有机构默认禁用AI元数据助手。
一旦管理员复核这种生成式AI工具的优势和局限性,了解其风险,并决定图书馆是否以及如何使用它,他们就可以在配置菜单 > 资源 > 编目 > AI使用配置文件下接受元数据编辑器中的AI元数据助手免责声明,方法是将其设置为“是”并保存。
管理员在环境中启用AI元数据助手后,具有“AI辅助编目”角色的编目员将能够开始使用该助手。
在沙盒环境中测试
使用新作业“同步AI设置”定期更新AI元数据助手设置。这可确保随着AI模型的发展和变化,AI提示仍然有效且保持最新状态。
由于计划作业在沙盒环境中被禁用,在测试AI元数据助手之前,请运行“同步AI设置”,以便使用当前设置进行测试。
- 转至“监控作业”>“已计划”选项卡
- 过滤至作业类别 = 数据服务
- 在“同步AI设置”的行操作中选择“立即运行”(在沙盒环境中可用)
作业完成后,具有所需角色的编目员可以在元数据编辑器中测试AI助手 - 有关更多信息,请见使用AI元数据助手。
使用AI元数据助手
要使用元数据编辑器中的AI元数据助手,您必须同时具备以下两个角色:
- 编目员
- AI辅助编目
使用AI元数据助手需要专用的角色,以便让图书馆控制哪些编目员使用生成式AI工具。
您可以使用AI元数据助手创建新的书目记录,或完善现有的简要记录。一旦助手完成记录处理,包含其建议元数据的草稿将推送到元数据编辑器,供您复核并接受、更正或解除。实时通知将表明草稿已准备好供您处理。
创建新报告
- 在元数据编辑器的“新建”菜单下,选择使用AI助手创建。
这将打开“来自AI助手的新记录”弹出窗口。“来自AI助手的新记录”字段: 字段 描述 题名 必备。提供要创建的资源的题名。 著者 可选。提供有关资源著者或创建者的信息。 ISBN 可选。提供图书的ISBN。 内容备注 可选。提供有关资源内容的信息。 摘要备注 可选。提供资源摘要。 附件 可选。提供资源的图像,其中包含相关信息(例如,图书的封底或目录)– 您可以从设备中选择图像或使用设备相机上传图像。可以裁剪图像以聚焦包含相关信息的区域,从而提高返回响应的质量。 - 选择生成记录将信息提交给AI。
当AI处理信息时,您可以继续在Alma中工作,并且当建议的元数据可以在元数据编辑器中处理时,您会收到通知。
可以根据需要编辑、保存或解除草稿记录。
完善简要记录
- 在元数据编辑器中,以编辑模式打开您想要完善的记录。在“编辑”操作下,选择通过AI助手增强。 这将打开“完善来自AI助手的记录”弹出窗口,其中显示您选择完善的记录的题名,以便您确保正在完善所选的记录。如果记录中包含以下信息,则除了题名之外,这些信息页将作为完善过程的一部分发送给AI:
- 著者
- ISBN
- 内容备注
- 摘要备注
您还可以附加包含相关信息的资源图像(例如图书的封底或目录),可从您的设备中选择图像或使用您的设备相机上传图像。可以裁剪图像以聚焦包含相关信息的区域,从而提高返回响应的质量。 - 选择完善记录将信息提交给AI。
当AI处理信息时,您可以继续在Alma中工作,并且当建议的元数据可以在元数据编辑器中处理时,您会收到通知。
AI建议的元数据将与现有记录合并,并且创建新的草稿 - 未保存的建议将以紫色显示,以帮助编目员对其进行复核。
通过开箱即用的合并方法进行合并后,图书馆现有的记录视为首选记录,并且该方法会添加AI建议的元数据,而不会覆盖现有元数据。如果出现以下情况,则将添加AI建议:
- 该字段是可重复的,或者
- 该字段在图书馆记录中尚不存在
在未来,您可以选择在将AI建议与首选图书馆记录合并时使用的本地合并规则。
常见问题
- 问:我用来创建或完善记录的数据是否用于训练AI?
答:否,我们与AI共享数据只是为了处理,而不是为了训练AI。 -
问:元数据来自何处?
答:元数据由AI LLM根据编目员提供的信息(手动或从正在完善的书目记录中提供)生成。目前支持的输入信息有资源的题名(必填),以及可选的著者、ISBN、摘要说明和内容说明,还有资源的图像(例如题名页、封底、目录)。与所有AI模型一样,该模型的训练数据也用于生成响应 - 其中包括MARC字段和子字段、相关LC主题的知识,以及AI模型的训练数据中是否存在有关特定资源的信息(例如出版年份、著者出生年份、资源描述) - 这些信息也可以用于生成元数据。
-
问:AI会执行在线搜索来为我获取数据吗?
答:不会 - 我们的AI平台不使用在线搜索,而是根据图书馆提供的信息以及AI训练数据中存在的信息提供元数据。 -
问:如果我上传图书图像,它们会保存在任何位置吗?
答:不会,我们仅使用图像来建议元数据,而不会将其保存用于任何其他用途。 -
问:AI会为我编目吗?
答:AI助手建议供编目员复核的元数据。
编目员对其进行复核,并可以接受、更正或拒绝建议。由于生成式AI可能会导致输出不准确或偏差,因此结合人力和技术能力可以提供更简化、更高效的编目体验,同时保持数据完整性。 -
问:为什么每次使用AI元数据助手时,我都会获得针对同一资源的不同元数据建议?
答:大型语言模型生成式AI工具非常灵活,其响应因用途而异,并且会随着时间的推移而发展。AI返回的元数据每次都会根据提供给它的信息、正在编目的资源以及AI本身的内部处理而变化。 -
问:AI元数据助手可以用来完善编目中的任何记录吗?
答:不可以 - AI助手只能用于完善未锁定编辑的记录,并且用户可以根据自己编目角色和级别进行编辑。
此外,第I阶段仅支持MARC 21格式的记录,不支持完善CZ记录。
对于网络区成员来说,创建或完善网络区记录的能力也取决于网络区的设置。 -
问:第I阶段支持使用LC规范对图书进行英文MARC 21编目 - 下一阶段有什么计划?
答:我们正在与世界各地的图书馆进行交流,以了解工作流程和评估需求,并与社区一起决定下一步的关注重点。选项包括更多资料类型、更多编目语言和更多主题词汇。 -
问:如何确保返回的主题是真实的?
答:我们检查返回的主题是否与现有的规范记录相匹配,并将全部或部分链接至该主题。它可能与首选或非首选词匹配 - 如果AI建议使用非首选词,则编目员可以使用元数据编辑器中的F3键将其更新为首选词,或者通过计划的“规范 - 首选词更正”作业自动更新(有关更多信息,请见与规范记录相关的作业)。 -
问:AI可以提供任何MARC 21字段吗?
答:不可以。我们要求AI助手生成最有用的字段,保持实用性和准确性的平衡,并且Alma会处理来自AI的建议元数据字段,以记录草稿格式向编目员提供建议,以便于审查和执行工作流程。我们正在与社区合作,评估并决定不同字段的实用性。
AI还可能生成未请求的字段,其中可能包含有用的信息。由于AI以概率的方式生成元数据,它有时也可能生成不相关的字段,例如本地字段、系统编号或不代表记录的记录气源(因为没有复制记录,而是仅生成特定字段) - sch字段可能包含不相关或通用的数据,在处理结果时,Alma会移除这些数据。 -
问:图书馆内的每个人都可以使用AI元数据助手吗?
答:图书馆控制对此工具的访问:AI元数据助手工作流程嵌入在元数据编辑器中 - 需要成为一名编目员才能创建或编辑书目记录,并且要拥有新的AI辅助编目角色才能使用新的工作流程。 -
问:我可以选择不在自己的图书馆中使用AI完善的数据吗?
答:当然可以!图书馆可以完全控制此工具的使用。要使用AI元数据助手,图书馆的总管理员应首先在新的AI使用配置文件配置页面中启用此功能。 -
问:我是网络区成员 – 可以使用AI来完善网络区记录吗?
答:当然可以!如果网络区启用AI元数据助手,那么其机构内启用该助手的任何成员都将能够使用它来增强网络区记录。 -
问:我的网络区限制某些字段的编辑 – AI是否仍然可以创建它们?
答:不可以。网络区强制执行的任何限制也适用于AI元数据助手工作流程 – 编目员只能使用该助手来创建或完善其被允许手动创建或完善的元数据。