추출 요약 설명

완료됨

추출 요약은 원본 텍스트에서 직접 필수 문장을 추출하여 요약을 생성합니다. 새로운 텍스트를 생성하는 대신 자연어 처리 기술을 사용하여 문서의 주요 아이디어나 컨텍스트를 종합적으로 전달하는 문장을 찾습니다.

추출 요약은 azure_ai 확장의 azure_cognitive 스키마에 있는 summarize_extractive() 함수를 사용하여 수행됩니다. azure_cognitive 스키마에는 summarize_extractive() 함수의 세 가지 오버로드가 포함되어 있습니다. 세 가지 함수 오버로드가 예상하는 인수 목록은 다음과 같습니다.

인수 Type 기본값 설명
text text 또는 text[] 요약을 생성해야 하는 텍스트입니다.
language_text text 또는 text[] 요약할 텍스트의 언어를 나타내는 언어 코드(또는 언어 코드 배열)입니다. 필요한 언어 코드를 검색하려면 지원되는 언어 목록을 검토합니다.
sentence_count integer 3 생성할 요약 문장의 수입니다.
sort_by text 'offset' 생성된 요약 문장의 정렬 순서입니다. 허용되는 값은 "오프셋"과 "순위"입니다. 오프셋은 원본 콘텐츠 내에서 추출된 각 문장의 시작 위치를 나타내며 순위는 문장이 콘텐츠의 주요 아이디어와 얼마나 관련성이 있는지에 대한 AI 생성 표시기입니다.
batch_size integer 25 text[] 입력이 예상되는 두 가지 오버로드에만 해당됩니다. 한 번에 처리할 레코드 수를 지정합니다.
disable_service_logs boolean false 서비스 로그를 비활성화 여부를 나타내는 플래그입니다.
timeout_ms integer NULL 작업이 중지된 후의 시간 제한(밀리초)입니다.
throw_on_error boolean true 함수가 오류 발생 시 예외를 throw하여 래핑 트랜잭션을 롤백해야 하는지 여부를 나타내는 플래그입니다.
max_attempts integer 1 오류가 발생한 경우 Azure AI 서비스에 대한 호출을 다시 시도하는 횟수입니다.
retry_delay_ms integer 1000 Azure AI 서비스 엔드포인트 호출을 다시 시도하기 전에 대기하는 시간(밀리초)입니다.

각 함수는 아래 표와 같이 azure_cognitive.sentence 복합 형식을 사용하여 추출된 문장 배열과 각 문장에 대한 순위 점수를 반환합니다.

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

azure_cognitive.sentence는 추출 문장의 텍스트와 각 문장의 순위 점수를 포함하는 복합 형식입니다. 0에서 1(포함) 사이의 값인 순위 점수는 문장이 원본 문서의 주요 아이디어와 얼마나 관련성이 있는지를 나타냅니다. 문서 요약은 추출된 문장의 순위를 매기고, 함수의 sort_by 매개 변수를 사용하여 나타나는 순서대로 반환되는지 아니면 순위에 따라 반환되는지 확인할 수 있습니다.

속성 설명에 대한 추출 요약 생성

Margie's Travel의 개발자로서 사용자는 azure_ai 확장 및 Azure AI 서비스를 통해 액세스할 수 있는 추출 요약 기술을 평가하고 데이터베이스의 첫 번째 목록에 있는 다음 설명과 같이 긴 속성 설명의 간결한 자연어 요약을 생성하는 메서드의 기능을 평가하려고 합니다.

"Queen Anne Hill 서쪽 중앙에 위치한 이 매력적인 1베드룸 아파트에서 집처럼 편안하게 지내세요. 우아하게 장식된 이 프라이빗 아파트(복층 구조의 하단 단위)는 개방형 평면 구조, 대나무 바닥, 주방 완비, TV, DVD 플레이어, 기본 케이블, 퀸 사이즈 침대가 있는 아늑한 침실을 갖추고 있습니다. 이 숙소는 최대 4명(침실에 2명, 편안한 접이식 소파에 2명, 린넨 포함)이 숙박할 수 있으며 무료 Wi-Fi와 세탁 시설이 포함되어 있습니다. 아파트는 정원과 검은 대나무 숲이 내려다보이는 전용 바비큐 시설을 갖춘 전용 데크와 연결되어 있습니다. 아파트는 버스 노선에서 단 한 블록 떨어져 있어 버스를 타면 15분 안에 시애틀 시내에, 10분 안에 유서 깊은 발라드까지 갈 수 있습니다. 5분 정도 빠르게 걸어가면 천연 식료품점과 커피숍이 나옵니다. 아니면 다양한 저장소, 바, 레스토랑이 있는 Queen Anne Hill 꼭대기까지 15분만 걸어가세요."

다음 쿼리를 사용하여 위 속성 설명에 대한 두 문장 요약을 요청합니다.

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

추출 요약은 각 문장의 순위 점수와 함께 원본 텍스트에서 가장 높은 점수를 받은 두 문장을 반환합니다.

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}