Amazon Q Business 커넥터를 관리합니다
Amazon Q Business용 커넥터를 만든 후에는 커넥터 세부 정보를 보거나 커넥터를 수정하거나 추가 데이터 원본을 통합하거나 커넥터를 삭제할 수 있습니다.
커넥터에 대한 정보를 봅니다
통합된 커넥터 및 데이터 원본에 대한 설정 정보를 볼 수 있습니다.
-
중 하나를 사용하여 워크로드 팩토리에 "콘솔 환경"로그인합니다.
-
워크로드 팩토리 탐색 메뉴에서 * AI * 를 선택하십시오.
-
보려는 연결선을 선택합니다.
-
커넥터 세부 정보를 보려면 * 커넥터 관리 * 를 선택하고
선택합니다.
이 페이지에는 게시된 상태, 데이터 원본의 포함 상태, 포함 모드, 포함된 모든 데이터 원본의 목록 등이 표시됩니다.
조치 * 메뉴를 사용하면 커넥터를 원하는 경우 관리할 수 있습니다.
연결선을 편집합니다
일부 설정을 변경하여 연결선을 업데이트하거나 데이터 원본을 추가 또는 제거할 수 있습니다.
커넥터에서 데이터 원본을 추가, 수정 또는 제거할 때마다 GenAI는 다시 인덱싱되도록 데이터 원본 정보를 Amazon Q Business로 전송해야 합니다. 동기화는 증분 방식이므로 Amazon Q Business는 마지막 동기화 이후 추가, 수정 또는 삭제된 FSx for ONTAP 볼륨의 객체만 처리합니다.
-
중 하나를 사용하여 워크로드 팩토리에 "콘솔 환경"로그인합니다.
-
Knowledge Base & Connectors 인벤토리 페이지에서 업데이트할 커넥터를 선택합니다.
-
을
선택하고 * 커넥터 관리 * 를 선택합니다.
이 페이지에는 게시된 상태, 데이터 원본의 포함 상태, 포함 모드, 포함된 모든 데이터 원본의 목록 등이 표시됩니다.
-
작업 * 메뉴를 선택하고 * 커넥터 편집 * 을 선택합니다.
-
커넥터 편집 페이지에서 커넥터가 포함된 볼륨에 사용되는 커넥터 이름, 설명, 포함 모델, 데이터 가드레일 사용 및 스냅샷 정책을 변경할 수 있습니다.
임베딩을 포함한 모든 데이터 소스 스캔에는 비용이 소요됩니다. 커넥터를 만든 후 데이터 가드레일을 활성화하면 데이터 소스가 다시 검사되어 비용이 발생합니다. -
변경한 후 * 저장 * 을 선택합니다.
커넥터에 데이터 원본을 추가합니다
커넥터에 추가 데이터 원본을 포함시켜 추가 조직 데이터로 채울 수 있습니다.
-
중 하나를 사용하여 워크로드 팩토리에 "콘솔 환경"로그인합니다.
-
Knowledge Base & Connectors 인벤토리 페이지에서 데이터 원본을 추가할 커넥터를 선택합니다.
-
를
선택하고 * 데이터 원본 추가 * 를 선택합니다.
-
추가하려는 데이터 소스 유형을 선택하세요.
-
ONTAP 파일 시스템용 FSx 추가(기존 ONTAP 볼륨용 FSx의 파일 사용)
-
파일 시스템 추가(일반 SMB 또는 NFS 공유의 파일 사용)
-
-
* 파일 시스템 선택 *: 데이터 소스 파일이 있는 FSx for ONTAP 파일 시스템을 선택하고 * 다음 * 을 선택합니다.
-
* 볼륨 선택 *: 데이터 원본 파일이 있는 볼륨을 선택하고 * 다음 * 을 선택합니다.
SMB 프로토콜을 사용하여 저장된 파일을 선택할 때 도메인, IP 주소, 사용자 이름 및 암호를 포함한 Active Directory 정보를 입력해야 합니다.
-
* 데이터 소스 선택 *: 파일을 저장한 위치를 기준으로 데이터 소스 위치를 선택합니다. 전체 볼륨일 수도 있고 볼륨의 특정 폴더 또는 하위 폴더일 수도 있고 * 다음 * 을 선택합니다.
-
* 구성 *: 데이터 소스가 파일에서 정보를 수집하는 방법과 검색에 포함할 파일을 구성합니다.
-
* 데이터 소스 정의 *: * 청크 전략 * 섹션에서 데이터 소스가 기술 문서에 통합될 때 GenAI 엔진이 데이터 소스 컨텐츠를 청크로 분할하는 방법을 정의합니다. 다음 전략 중 하나를 선택할 수 있습니다.
-
* 다중 문장 청킹 *: 데이터 소스의 정보를 문장 정의 청크로 정리합니다. 각 청크를 구성하는 문장의 수(최대 100개)를 선택할 수 있습니다.
-
* 오버랩 기반 청크 *: 데이터 소스의 정보를 인접 청크와 겹칠 수 있는 문자 정의 청크로 구성합니다. 각 청크의 크기를 문자 단위로 선택하고 각 청크가 인접한 청크와 겹치는 정도를 선택할 수 있습니다. 청크 크기는 50자에서 3000자 사이이고 겹치는 비율은 1 ~ 99%로 구성할 수 있습니다.
높은 중복 비율을 선택하면 검색 정확도가 약간 개선되어 저장소 요구 사항이 크게 증가할 수 있습니다.
-
-
* 파일 필터링 *: 검색에 포함할 파일을 구성합니다.
-
파일 형식 지원 * 섹션에서 모든 파일 형식을 포함하거나 데이터 원본 검색에 포함할 개별 파일 형식을 선택합니다.
이미지 또는 PDF 파일을 포함하는 경우 GenAI용 BlueXP 워크로드 공장에서 이미지(PDF 문서의 이미지 포함)의 텍스트를 구문 분석하므로 비용이 더 많이 듭니다.
이미지의 텍스트 데이터를 포함할 경우, 스캔된 텍스트 데이터가 사용자 환경에서 AWS로 전송되기 때문에 GenAI는 이미지에서 PII(개인 식별 정보)를 마스킹할 수 없습니다. 그러나 데이터가 저장되면 모든 PII가 GenAI 데이터베이스에 마스킹됩니다.
-
이미지 파일을 스캔에 포함할지 여부는 기술 자료 채팅 모델과 관련이 있습니다. 스캔에 이미지 파일을 포함할 경우 채팅 모델은 이미지를 지원해야 합니다. 여기에서 이미지 파일 형식을 선택하면 기술 문서를 이미지 파일을 지원하지 않는 채팅 모델로 전환할 수 없습니다. -
파일 수정 시간 필터 * 섹션에서 수정 시간에 따라 파일 포함을 활성화 또는 비활성화하도록 선택합니다. 수정 시간 필터링을 사용하는 경우 목록에서 날짜 범위를 선택합니다.
수정 날짜 범위를 기준으로 파일을 포함하는 경우 날짜 범위가 충족되지 않으면(지정한 날짜 범위 내에서 파일이 수정되지 않음) 파일이 정기 검색에서 제외되고 데이터 원본에 이러한 파일이 포함되지 않습니다.
-
-
선택한 데이터 원본이 SMB 프로토콜을 사용하는 볼륨에 있을 때만 사용할 수 있는 * 권한 인식 * 섹션에서 권한 인식 응답을 활성화하거나 비활성화할 수 있습니다.
-
사용: 이 기술 자료에 액세스하는 챗봇 사용자는 액세스 권한이 있는 데이터 원본에서 쿼리에 대한 응답만 받습니다.
-
* 사용 안 함 * : 챗봇 사용자는 모든 통합 데이터 소스의 콘텐츠를 사용하여 응답을 받습니다.
-
-
이 데이터 소스를 기술 문서에 추가하려면 * 추가 * 를 선택하십시오.
-
파일 시스템 선택: 데이터 소스 파일이 있는 파일 시스템 호스트의 IP 주소 또는 FQDN을 입력하고, 네트워크 공유에 대한 NFS 프로토콜을 선택하고 *다음*을 선택합니다.
-
* 데이터 소스 선택 *: 파일을 저장한 위치를 기준으로 데이터 소스 위치를 선택합니다. 전체 볼륨일 수도 있고 볼륨의 특정 폴더 또는 하위 폴더일 수도 있고 * 다음 * 을 선택합니다.
경우에 따라 NFS 내보내기 이름을 직접 입력하고 *디렉터리 검색*을 선택하여 사용 가능한 디렉터리를 표시해야 할 수도 있습니다. 내보내기 전체 또는 내보내기에서 특정 폴더만 선택할 수 있습니다. -
* 구성 *: 데이터 소스가 파일에서 정보를 수집하는 방법과 검색에 포함할 파일을 구성합니다.
-
* 데이터 소스 정의 *: * 청크 전략 * 섹션에서 데이터 소스가 기술 문서에 통합될 때 GenAI 엔진이 데이터 소스 컨텐츠를 청크로 분할하는 방법을 정의합니다. 다음 전략 중 하나를 선택할 수 있습니다.
-
* 다중 문장 청킹 *: 데이터 소스의 정보를 문장 정의 청크로 정리합니다. 각 청크를 구성하는 문장의 수(최대 100개)를 선택할 수 있습니다.
-
* 오버랩 기반 청크 *: 데이터 소스의 정보를 인접 청크와 겹칠 수 있는 문자 정의 청크로 구성합니다. 각 청크의 크기를 문자 단위로 선택하고 각 청크가 인접한 청크와 겹치는 정도를 선택할 수 있습니다. 청크 크기는 50자에서 3000자 사이이고 겹치는 비율은 1 ~ 99%로 구성할 수 있습니다.
높은 중복 비율을 선택하면 검색 정확도가 약간 개선되어 저장소 요구 사항이 크게 증가할 수 있습니다.
-
-
* 파일 필터링 *: 검색에 포함할 파일을 구성합니다.
-
파일 형식 지원 * 섹션에서 모든 파일 형식을 포함하거나 데이터 원본 검색에 포함할 개별 파일 형식을 선택합니다.
이미지 또는 PDF 파일을 포함하는 경우 GenAI용 BlueXP 워크로드 공장에서 이미지(PDF 문서의 이미지 포함)의 텍스트를 구문 분석하므로 비용이 더 많이 듭니다.
이미지의 텍스트 데이터를 포함할 경우, 스캔된 텍스트 데이터가 사용자 환경에서 AWS로 전송되기 때문에 GenAI는 이미지에서 PII(개인 식별 정보)를 마스킹할 수 없습니다. 그러나 데이터가 저장되면 모든 PII가 GenAI 데이터베이스에 마스킹됩니다.
-
이미지 파일을 스캔에 포함할지 여부는 기술 자료 채팅 모델과 관련이 있습니다. 스캔에 이미지 파일을 포함할 경우 채팅 모델은 이미지를 지원해야 합니다. 여기에서 이미지 파일 형식을 선택하면 기술 문서를 이미지 파일을 지원하지 않는 채팅 모델로 전환할 수 없습니다. -
파일 수정 시간 필터 * 섹션에서 수정 시간에 따라 파일 포함을 활성화 또는 비활성화하도록 선택합니다. 수정 시간 필터링을 사용하는 경우 목록에서 날짜 범위를 선택합니다.
수정 날짜 범위를 기준으로 파일을 포함하는 경우 날짜 범위가 충족되지 않으면(지정한 날짜 범위 내에서 파일이 수정되지 않음) 파일이 정기 검색에서 제외되고 데이터 원본에 이러한 파일이 포함되지 않습니다.
-
-
*데이터 소스 추가*를 선택하여 이 데이터 소스를 지식 기반에 추가하세요.
-
파일 시스템 선택:
-
데이터 소스 파일이 있는 파일 시스템 호스트의 IP 주소나 FQDN을 입력하세요.
-
네트워크 공유에 SMB 프로토콜을 선택합니다.
-
도메인, IP 주소, 사용자 이름, 비밀번호 등 Active Directory 정보를 입력합니다.
-
다음 * 을 선택합니다.
-
-
* 데이터 소스 선택 *: 파일을 저장한 위치를 기준으로 데이터 소스 위치를 선택합니다. 전체 볼륨일 수도 있고 볼륨의 특정 폴더 또는 하위 폴더일 수도 있고 * 다음 * 을 선택합니다.
경우에 따라 SMB 공유 이름을 직접 입력하고 *디렉터리 검색*을 선택하여 사용 가능한 디렉터리를 표시해야 할 수도 있습니다. 전체 공유를 선택하거나 공유에서 특정 폴더만 선택할 수 있습니다. -
* 구성 *: 데이터 소스가 파일에서 정보를 수집하는 방법과 검색에 포함할 파일을 구성합니다.
-
* 데이터 소스 정의 *: * 청크 전략 * 섹션에서 데이터 소스가 기술 문서에 통합될 때 GenAI 엔진이 데이터 소스 컨텐츠를 청크로 분할하는 방법을 정의합니다. 다음 전략 중 하나를 선택할 수 있습니다.
-
* 다중 문장 청킹 *: 데이터 소스의 정보를 문장 정의 청크로 정리합니다. 각 청크를 구성하는 문장의 수(최대 100개)를 선택할 수 있습니다.
-
* 오버랩 기반 청크 *: 데이터 소스의 정보를 인접 청크와 겹칠 수 있는 문자 정의 청크로 구성합니다. 각 청크의 크기를 문자 단위로 선택하고 각 청크가 인접한 청크와 겹치는 정도를 선택할 수 있습니다. 청크 크기는 50자에서 3000자 사이이고 겹치는 비율은 1 ~ 99%로 구성할 수 있습니다.
높은 중복 비율을 선택하면 검색 정확도가 약간 개선되어 저장소 요구 사항이 크게 증가할 수 있습니다.
-
-
권한 인식: 권한 인식 응답을 활성화하거나 비활성화합니다.
-
사용: 이 기술 자료에 액세스하는 챗봇 사용자는 액세스 권한이 있는 데이터 원본에서 쿼리에 대한 응답만 받습니다.
-
* 사용 안 함 * : 챗봇 사용자는 모든 통합 데이터 소스의 콘텐츠를 사용하여 응답을 받습니다.
-
-
* 파일 필터링 *: 검색에 포함할 파일을 구성합니다.
-
파일 형식 지원 * 섹션에서 모든 파일 형식을 포함하거나 데이터 원본 검색에 포함할 개별 파일 형식을 선택합니다.
이미지 또는 PDF 파일을 포함하는 경우 GenAI용 BlueXP 워크로드 공장에서 이미지(PDF 문서의 이미지 포함)의 텍스트를 구문 분석하므로 비용이 더 많이 듭니다.
이미지의 텍스트 데이터를 포함할 경우, 스캔된 텍스트 데이터가 사용자 환경에서 AWS로 전송되기 때문에 GenAI는 이미지에서 PII(개인 식별 정보)를 마스킹할 수 없습니다. 그러나 데이터가 저장되면 모든 PII가 GenAI 데이터베이스에 마스킹됩니다.
-
이미지 파일을 스캔에 포함할지 여부는 기술 자료 채팅 모델과 관련이 있습니다. 스캔에 이미지 파일을 포함할 경우 채팅 모델은 이미지를 지원해야 합니다. 여기에서 이미지 파일 형식을 선택하면 기술 문서를 이미지 파일을 지원하지 않는 채팅 모델로 전환할 수 없습니다. -
파일 수정 시간 필터 * 섹션에서 수정 시간에 따라 파일 포함을 활성화 또는 비활성화하도록 선택합니다. 수정 시간 필터링을 사용하는 경우 목록에서 날짜 범위를 선택합니다.
수정 날짜 범위를 기준으로 파일을 포함하는 경우 날짜 범위가 충족되지 않으면(지정한 날짜 범위 내에서 파일이 수정되지 않음) 파일이 정기 검색에서 제외되고 데이터 원본에 이러한 파일이 포함되지 않습니다.
-
-
*데이터 소스 추가*를 선택하여 이 데이터 소스를 지식 기반에 추가하세요.
데이터 원본이 커넥터에 통합되어 있습니다.
데이터 원본을 커넥터와 동기화합니다
데이터 원본은 하루에 한 번 연결된 커넥터와 자동으로 동기화되므로 데이터 원본 변경 내용이 Amazon Q Business에 반영됩니다. 데이터 원본을 변경하고 데이터를 즉시 동기화(검사)하려는 경우 필요 시 동기화를 수행할 수 있습니다.
동기화는 증분 동기화이므로 Amazon Q Business는 마지막 동기화 이후 추가, 수정 또는 삭제된 데이터 원본의 객체만 처리합니다.
-
중 하나를 사용하여 워크로드 팩토리에 "콘솔 환경"로그인합니다.
-
지식 기반 및 커넥터 탭에서 동기화할 커넥터를 선택합니다.
-
을
선택하고 * 커넥터 관리 * 를 선택합니다.
-
조치 * 메뉴를 선택하고 * 지금 스캔 * 을 선택합니다.
데이터 원본을 스캔한다는 메시지와 검사가 완료되면 최종 메시지가 표시됩니다.
커넥터는 첨부된 데이터 원본과 동기화되며 Amazon Q Business는 데이터 원본의 최신 정보를 사용하기 시작합니다.
예약된 동기화를 일시 중지하거나 다시 시작합니다
데이터 원본의 다음 동기화(스캔)를 일시 중지하거나 다시 시작하려면 언제든지 다시 시작할 수 있습니다. 데이터 원본을 변경하고 변경 기간 동안 동기화를 실행하지 않으려면 다음 예약된 동기화를 일시 중지해야 할 수 있습니다.
-
중 하나를 사용하여 워크로드 팩토리에 "콘솔 환경"로그인합니다.
-
커넥터 인벤토리 페이지에서 스캔을 일시 중지하거나 다시 시작할 커넥터를 선택합니다.
-
을
선택하고 * 커넥터 관리 * 를 선택합니다.
-
Actions * 메뉴를 선택하고 * Scan > Pause Scheduled Scan * 또는 * Scan > Resume Scheduled Scan * 을 선택합니다.
다음 예약된 스캔이 일시 중지되었거나 다시 시작되었다는 메시지가 표시됩니다.
연결선을 삭제합니다
연결선이 더 이상 필요하지 않으면 삭제할 수 있습니다. 커넥터를 삭제하면 작업 부하 공장에서 제거되고 커넥터가 포함된 볼륨이 삭제됩니다. 커넥터 삭제는 되돌릴 수 없습니다.
커넥터를 삭제할 때 커넥터와 관련된 모든 에이전트에서 커넥터를 연결 해제하여 커넥터와 연결된 모든 리소스를 완전히 삭제해야 합니다.
-
중 하나를 사용하여 워크로드 팩토리에 "콘솔 환경"로그인합니다.
-
Knowledge Base & Connectors 인벤토리 페이지에서 삭제할 커넥터를 선택합니다.
-
을
선택하고 * 커넥터 관리 * 를 선택합니다.
-
조치 * 메뉴를 선택하고 * 커넥터 삭제 * 를 선택합니다.
-
커넥터 삭제 대화 상자에서 삭제할 커넥터를 확인하고 * 삭제 * 를 선택합니다.
커넥터가 작업 부하 공장에서 제거되고 관련 볼륨이 삭제됩니다.