Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

了解搜索集成服务

如果您想对对象元数据使用外部搜索和数据分析服务,则可以为 S3 存储桶启用搜索集成。

搜索集成服务是一种自定义StorageGRID服务,每当创建或删除对象,或者更新其元数据或标签时,它都会自动且异步地将 S3 对象元数据发送到目标端点。然后,您可以使用目标服务提供的复杂搜索、数据分析、可视化或机器学习工具来搜索、分析和洞察对象数据。

例如,您可以配置存储桶以将 S3 对象元数据发送到远程 Elasticsearch 服务。然后,您可以使用 Elasticsearch 跨存储桶执行搜索,并对对象元数据中存在的模式执行复杂的分析。

尽管可以在启用了 S3 对象锁定的存储桶上配置 Elasticsearch 集成,但对象的 S3 对象锁定元数据(包括保留截止日期和合法保留状态)将不会包含在发送到 Elasticsearch 的元数据中。

备注 由于搜索集成服务会导致对象元数据被发送到目的地,因此其配置 XML 被称为“_metadata_通知配置 XML”。此配置 XML 与用于启用_事件_通知的“通知配置 XML”不同。

搜索集成和 S3 存储桶

您可以为任何版本化或未版本化的存储桶启用搜索集成服务。通过将元数据通知配置 XML 与指定要操作的对象以及对象元数据的目的地的存储桶关联起来,可以配置搜索集成。

元数据通知以 JSON 文档的形式生成,该文档以存储桶名称、对象名称和版本 ID(如果有)命名。每个元数据通知除了包含对象的所有标签和用户元数据之外,还包含该对象的一组标准系统元数据。

备注 对于标签和用户元数据, StorageGRID将日期和数字作为字符串或 S3 事件通知传递给 Elasticsearch。要配置 Elasticsearch 将这些字符串解释为日期或数字,请按照 Elasticsearch 的动态字段映射和映射日期格式的说明进行操作。在配置搜索集成服务之前,您必须在索引上启用动态字段映射。文档被索引后,您无法在索引中编辑文档的字段类型。

搜索通知

每当出现以下情况时,就会生成元数据通知并排队等待传送:

  • 已创建一个对象。

  • 对象被删除,包括由于网格的 ILM 策略操作而删除对象的情况。

  • 添加、更新或删除对象元数据或标签。更新时总是会发送完整的元数据和标签集——而不仅仅是更改的值。

将元数据通知配置 XML 添加到存储桶后,系统会为您创建的任何新对象以及通过更新其数据、用户元数据或标签而修改的任何对象发送通知。但是,不会针对存储桶中已经存在的任何对象发送通知。为了确保存储桶中所有对象的对象元数据都发送到目标,您应该执行以下操作之一:

  • 在创建存储桶之后和添加任何对象之前立即配置搜索集成服务。

  • 对存储桶中已有的所有对象执行操作,该操作将触发元数据通知消息发送到目标。

搜索集成服务和 Elasticsearch

StorageGRID搜索集成服务支持 Elasticsearch 集群作为目标。与其他平台服务一样,目的地在端点中指定,该端点的 URN 用于服务的配置 XML。使用 "NetApp 互操作性表工具"确定支持的 Elasticsearch 版本。