Skip to main content
简体中文版经机器翻译而成,仅供参考。如与英语版出现任何冲突,应以英语版为准。

了解搜索集成服务

贡献者

如果要对对象元数据使用外部搜索和数据分析服务,则可以为 S3 存储分段启用搜索集成。

搜索集成服务是一种自定义StorageGRID服务、每当创建或删除对象或更新其元数据或标记时、该服务都会自动异步将S3对象元数据发送到目标端点。然后,您可以使用目标服务提供的复杂搜索,数据分析,可视化或机器学习工具来搜索,分析对象数据并从中获得洞察力。

例如,您可以将存储分段配置为将 S3 对象元数据发送到远程 Elasticsearch 服务。然后,您可以使用 Elasticsearch 跨存储分段执行搜索,并对对象元数据中存在的模式执行复杂的分析。

虽然可以在启用了S3对象锁定的存储分段上配置Ela才 搜索集成、但对象的S3对象锁定元数据(包括"保留到日期"和"合法保留状态")不会包含在发送到Ela才 搜索的元数据中。

备注 由于搜索集成服务会将对象元数据发送到目标、因此其配置XML称为"_metadata_Notification configuration XML"。此配置XML与用于启用_event_通知的"通知配置XML"不同。

搜索集成和S3存储分段

您可以为任何版本控制或未版本控制的存储分段启用搜索集成服务。搜索集成是通过将元数据通知配置 XML 与用于指定要对哪些对象执行操作的存储分段以及对象元数据的目标进行关联来配置的。

元数据通知以JSON文档的形式生成、该文档使用存储分段名称、对象名称和版本ID (如果有)命名。除了对象的所有标记和用户元数据之外,每个元数据通知还包含一组标准的对象系统元数据。

备注 对于标记和用户元数据, StorageGRID 会将日期和数字作为字符串或 S3 事件通知传递给 Elasticsearch 。要配置 Elasticsearch 以将这些字符串解释为日期或数字,请按照 Elasticsearch 说明进行动态字段映射和映射日期格式。在配置搜索集成服务之前,必须在索引上启用动态字段映射。为文档编制索引后、无法在索引中编辑文档的域类型。

搜索通知

在以下情况下、系统会生成元数据通知并将其排队以供传送:

  • 已创建对象。

  • 删除对象,包括因网格的 ILM 策略操作而删除对象的时间。

  • 添加,更新或删除对象元数据或标记。更新时始终会发送一组完整的元数据和标记,而不仅仅是更改后的值。

将元数据通知配置 XML 添加到存储分段后,系统会为您创建的任何新对象以及您通过更新其数据,用户元数据或标记来修改的任何对象发送通知。但是、不会为存储分段中已有的任何对象发送通知。要确保将存储分段中所有对象的对象元数据发送到目标,应执行以下任一操作:

  • 创建存储分段后以及添加任何对象之前,请立即配置搜索集成服务。

  • 对存储分段中已有的所有对象执行操作,此操作将触发元数据通知消息以发送到目标。

搜索集成服务和El在职 搜索

StorageGRID 搜索集成服务支持将 Elasticsearch 集群作为目标。与其他平台服务一样,目标也会在端点中指定,而此端点的 URN 会在该服务的配置 XML 中使用。使用 "NetApp 互操作性表工具"确定受支持的ElASISearch版本。