Início rápido Data-to-RAG para AI Data Engine
Vá de um sistema AI Data Engine (AIDE) recém-implantado para um endpoint de geração aumentada por recuperação (RAG) em funcionamento usando este fluxo de trabalho. Entenda como administradores de storage, engenheiros de dados e cientistas de dados colaboram usando ONTAP System Manager e AIDE Console.
-
Você instalou e adicionou nós de computação de dados (DCNs) ao cluster ONTAP.
-
Você instalou e licenciou AI Data Engine software para vetorização e guardrails.
-
Você configurou "OpenID Connect (OIDC)" e mapeou as funções de administrador, engenheiro de dados e cientista de dados.
Defina o escopo e a governança dos dadosComo administrador de storage ou administrador de segurança, você deseja preparar o ambiente no AIDE Console e ONTAP System Manager:
-
"Crie um ou mais espaços de trabalho" de fontes de dados locais e remotas.
-
"Configure classificadores e políticas de proteção" no AIDE Console.
-
"Atribua acesso de engenheiro de dados e cientista de dados aos espaços de trabalho".
Explorar metadados do workspaceComo engenheiro de dados ou cientista de dados, você deseja explorar os metadados do workspace usando AIDE Console:
-
"Explorar metadados do workspace" para compreender o conteúdo disponível.
-
Defina um ou mais subconjuntos lógicos de dados que devem alimentar RAG (por exemplo, artigos de suporte, manuais de produtos ou notas clínicas anonimizadas).
Criar e publicar uma coleta de dadosComo engenheiro de dados ou cientista de dados, você deseja transformar o subconjunto escolhido em uma coleção pronta para RAG:
-
"Criar uma coleta de dados" a partir do espaço de trabalho usando os filtros selecionados.
-
"Publicar a coleta de dados" e monitorar a indexação até que ela atinja
Readyestado. -
Copie o URI do endpoint de recuperação para a coleção escolhida e forneça aos cientistas de dados ou desenvolvedores de aplicativos.
-
"Visualizar o status da coleta de dados e a pegada vetorial" conforme necessário.