Aracılığıyla paylaş


Tam Lucene arama söz dizimi örnekleri (gelişmiş sorgular)

Azure AI Search için sorgu oluştururken, özelleştirilmiş ve gelişmiş sorgu ifadelerini formüle etmek için varsayılan basit sorgu ayrıştırıcısını daha güçlü Lucene sorgu ayrıştırıcısıyla değiştirebilirsiniz.

Lucene ayrıştırıcısı alan kapsamlı sorgular, belirsiz arama, infix and suffix joker karakter araması, yakınlık araması, terim artırma ve normal ifade araması gibi karmaşık sorgu biçimlerini destekler. Ek güç, daha fazla işlem gereksinimiyle birlikte gelir, bu nedenle biraz daha uzun bir yürütme süresi beklemeniz gerekir. Bu makalede, tam söz dizimine göre sorgu işlemlerini gösteren örneklerde adım adım ilerleyebilirsiniz.

Not

Tam Lucene sorgu söz dizimi aracılığıyla etkinleştirilen özelleştirilmiş sorgu yapılarının çoğu metin analizi yapılmaz; bu da kök veya lemmatizasyon bekliyorsanız şaşırtıcı olabilir. Sözcük temelli analiz yalnızca tam terimler (terim sorgusu veya tümcecik sorgusu) üzerinde gerçekleştirilir. Tamamlanmamış terimlere sahip sorgu türleri (ön ek sorgusu, joker sorgu, regex sorgusu, belirsiz sorgu) doğrudan sorgu ağacına eklenir ve analiz aşaması atlanır. Kısmi sorgu terimlerinde gerçekleştirilen tek dönüştürme küçük harfe dönüştürmedir.

Oteller örnek dizini

Aşağıdaki sorgular, bu hızlı başlangıçtaki yönergeleri izleyerek oluşturabileceğiniz hotels-sample-index'i temel alır.

Örnek sorgular REST API ve POST istekleri kullanılarak ifade edilir. Bunları bir REST istemcisinde yapıştırabilir ve çalıştırabilirsiniz. Alternatif olarak Azure portalında Arama Gezgini'nin JSON görünümünü de kullanabilirsiniz. JSON görünümünde, bu makalede gösterilen sorgu örneklerini yapıştırabilirsiniz.

İstek üst bilgileri aşağıdaki değerlere sahip olmalıdır:

Anahtar Değer
İçerik Türü application/json
api-key <your-search-service-api-key>, sorgu veya yönetici anahtarı

URI parametreleri, aşağıdaki örneğe benzer şekilde dizin adı, belge koleksiyonları, arama komutu ve API sürümüne sahip arama hizmeti uç noktanızı içermelidir:

https://{{service-name}}.search.windows.net/indexes/hotels-sample-index/docs/search?api-version=2024-07-01

İstek gövdesi geçerli JSON olarak oluşturulmalıdır:

{
    "search": "*",
    "queryType": "full",
    "select": "HotelId, HotelName, Category, Tags, Description",
    "count": true
}
  • search * olarak ayarlanır, null veya boş aramaya eşdeğer belirtilmemiş bir sorgudur. Özellikle kullanışlı değildir, ancak yapabileceğiniz en basit aramadır ve dizindeki tüm alınabilir alanları ve tüm değerleri gösterir.

  • queryTypetam olarak ayarlanır, tam Lucene sorgu ayrıştırıcısını çağırır ve bu söz dizimi için gereklidir.

  • select virgülle ayrılmış bir alan listesi olarak ayarlanmışsa, arama sonucu oluşturma işlemi için yalnızca arama sonuçları bağlamında yararlı olan alanlar da dahil olmak üzere kullanılır.

  • count arama ölçütleriyle eşleşen belge sayısını döndürür. Boş bir arama dizesinde, sayı dizindeki tüm belgelerdir (hotels-sample-index içinde 50).

Alanlı arama kapsamları tek tek, eklenmiş arama ifadelerini belirli bir alana ekler. Bu örnek, içinde otel terimi olan ancak motel olmayan otel adlarını arar. kullanarak ANDbirden çok alan belirtebilirsiniz.

Bu sorgu söz dizimini kullandığınızda, sorgulamak istediğiniz alanlar arama ifadesinin içinde olduğunda parametresini atlayabilirsiniz searchFields . Alanlı aramaya eklerseniz searchFields , fieldName:searchExpression her zaman yerine searchFieldsöncelikli olur.

POST /indexes/hotel-samples-index/docs/search?api-version=2024-07-01
{
    "search": "HotelName:(hotel NOT motel) AND Category:'Boutique'",
    "queryType": "full",
    "select": "HotelName, Category",
    "count": true
}

Bu sorgunun yanıtı, Butik'te filtrelenmiş aşağıdaki örneğe benzer şekilde görünmelidir ve adı otel olan otelleri döndürürken, adı motel olan sonuçlar hariç tutulmalıdır.

{
  "@odata.count": 5,
  "value": [
    {
      "@search.score": 2.2289815,
      "HotelName": "Stay-Kay City Hotel",
      "Category": "Boutique"
    },
    {
      "@search.score": 1.3862944,
      "HotelName": "City Skyline Antiquity Hotel",
      "Category": "Boutique"
    },
    {
      "@search.score": 1.355046,
      "HotelName": "Old Century Hotel",
      "Category": "Boutique"
    },
    {
      "@search.score": 1.355046,
      "HotelName": "Sublime Palace Hotel",
      "Category": "Boutique"
    },
    {
      "@search.score": 1.355046,
      "HotelName": "Red Tide Hotel",
      "Category": "Boutique"
    }
  ]
}

Arama ifadesi, isteğe bağlı olarak Boole işleçleriyle tek bir terim veya tümcecik ya da parantez içinde daha karmaşık bir ifade olabilir. Bazı örnekler şunlardır:

  • HotelName:(hotel NOT motel)
  • Address/StateProvince:("WA" OR "CA")
  • Tags:("free wifi" NOT "free parking") AND "coffee in lobby"

Her iki dizenin de tek bir varlık olarak değerlendirilmesini istiyorsanız, bu durumda alanda iki ayrı konum ararken olduğu gibi, tırnak içine bir tümcecik eklediğinizden Address/StateProvince emin olun. İstemciye bağlı olarak, tırnak işaretlerini (\) kaçış olarak kullanmanız gerekebilir.

içinde fieldName:searchExpression belirtilen alan aranabilir bir alan olmalıdır. Alan tanımlarının nasıl özniteliklendirildiğini öğrenmek için bkz . Dizin Oluşturma (REST API).

Benzer arama, yanlış yazılmış sözcükler de dahil olmak üzere benzer terimlerle eşleşir. Benzer bir arama yapmak için, tek bir sözcüğün sonuna tilde ~ simgesini, düzenleme uzaklığı belirten isteğe bağlı bir parametre olan 0 ile 2 arasında bir değerle ekleyin. Örneğin, blue~ veya blue~1 mavi, mavi ve tutkal döndürür.

POST /indexes/hotel-samples-index/docs/search?api-version=2024-07-01
{
    "search": "Tags:conserge~",
    "queryType": "full",
    "select": "HotelName, Category, Tags",
    "searchFields": "HotelName, Category, Tags",
    "count": true
}

Bu sorgunun yanıtı, kısalık için kırpılmış eşleşen belgelerde concierge olarak çözümlenir:

{
  "@odata.count": 9,
  "value": [
    {
      "@search.score": 1.4947624,
      "HotelName": "Twin Vortex Hotel",
      "Category": "Luxury",
      "Tags": [
        "bar",
        "restaurant",
        "concierge"
      ]
    },
    {
      "@search.score": 1.1685618,
      "HotelName": "Stay-Kay City Hotel",
      "Category": "Boutique",
      "Tags": [
        "view",
        "air conditioning",
        "concierge"
      ]
    },
    {
      "@search.score": 1.1465473,
      "HotelName": "Old Century Hotel",
      "Category": "Boutique",
      "Tags": [
        "pool",
        "free wifi",
        "concierge"
      ]
    },
. . .
  ]
}

Tümcecikler doğrudan desteklenmez, ancak gibi search=Tags:landy~ AND sevic~çok parçalı bir tümceciğin her teriminde benzer bir eşleşme belirtebilirsiniz. Bu sorgu ifadesi çamaşırhane hizmetinde 15 eşleşme bulur.

Not

Benzer sorgular çözümlenmez. Tamamlanmamış terimlere sahip sorgu türleri (ön ek sorgusu, joker sorgu, regex sorgusu, belirsiz sorgu) doğrudan sorgu ağacına eklenir ve analiz aşaması atlanır. Kısmi sorgu terimlerinde gerçekleştirilen tek dönüştürme, küçük harfle ifade edilir.

Yakınlık araması, belgede birbirine yakın terimleri bulur. Tümceciğin sonuna bir tilde ~ simgesi ve ardından yakınlık sınırını oluşturan sözcük sayısını ekleyin.

Bu sorgu, bir belgede birbirinin beş sözcüğü içinde otel ve havaalanı terimlerini arar. Tümceciği korumak için tırnak işaretinden (\") çıkılır:

POST /indexes/hotel-samples-index/docs/search?api-version=2024-07-01
{
    "search": "Description: \"hotel airport\"~5",
    "queryType": "full",
    "select": "HotelName, Description",
    "searchFields": "HotelName, Description",
    "count": true
}

Bu sorgunun yanıtı aşağıdaki örneğe benzer olmalıdır:

{
  "@odata.count": 1,
  "value": [
    {
      "@search.score": 0.69167054,
      "HotelName": "Trails End Motel",
      "Description": "Only 8 miles from Downtown. On-site bar/restaurant, Free hot breakfast buffet, Free wireless internet, All non-smoking hotel. Only 15 miles from airport."
    }
  ]
}

Örnek 4: Terim artırma

Terim artırma, öne çıkarılmış terimi içeren bir belgeyi, terimi içermeyen belgelere göre daha yüksek derecelendirmeyi ifade eder. Bir terimi artırmak için, ^aradığınız terimin sonundaki bir destek faktörü (sayı) içeren şapka işaretini ( simgesi) kullanın. Yükseltme faktörü varsayılanı 1'dir ve pozitif olması gerekse de 1'den az olabilir (örneğin, 0,2). Terim artırma, puanlama profillerinin belirli terimler yerine belirli alanları artırması açısından puanlama profillerinden farklıdır.

Bu sorgudan önce, plaj erişimini arayın ve bir veya iki terimle eşleşen altı belge olduğuna dikkat edin.

POST /indexes/hotel-samples-index/docs/search?api-version=2024-07-01
{
    "search": "beach access",
    "queryType": "full",
    "select": "HotelName, Description, Tags",
    "searchFields": "HotelName, Description, Tags",
    "count": true
}

Aslında, erişimde yalnızca iki belge eşleşmektedir. İlk örnek, belgede plaj terimi eksik olsa bile ikinci konumdadır.

{
  "@odata.count": 6,
  "value": [
    {
      "@search.score": 1.068669,
      "HotelName": "Johnson's Family Resort",
      "Description": "Family oriented resort located in the heart of the northland. Operated since 1962 by the Smith family, we have grown into one of the largest family resorts in the state. The home of excellent Smallmouth Bass fishing with 10 small cabins, we're a home not only to fishermen but their families as well. Rebuilt in the early 2000's, all of our cabins have all the comforts of home. Sporting a huge **beach** with multiple water toys for those sunny summer days and a Lodge full of games for when you just can't swim anymore, there's always something for the family to do. A full marina offers watercraft rentals, boat launch, powered dock slips, canoes (free to use), & fish cleaning facility. Rent pontoons, 14' fishing boats, 16' fishing rigs or jet ski's for a fun day or week on the water. Pets are accepted in the lakeside cottages.",
      "Tags": [
        "24-hour front desk service",
        "pool",
        "coffee in lobby"
      ]
    },
    {
      "@search.score": 1.0162708,
      "HotelName": "Campus Commander Hotel",
      "Description": "Easy **access** to campus and steps away from the best shopping corridor in the city. From meetings in town or gameday, enjoy our prime location between the union and proximity to the university stadium.",
      "Tags": [
        "free parking",
        "coffee in lobby",
        "24-hour front desk service"
      ]
    },
    {
      "@search.score": 0.9050383,
      "HotelName": "Lakeside B & B",
      "Description": "Nature is Home on the **beach**. Explore the shore by day, and then come home to our shared living space to relax around a stone fireplace, sip something warm, and explore the library by night. Save up to 30 percent. Valid Now through the end of the year. Restrictions and blackouts may apply.",
      "Tags": [
        "laundry service",
        "concierge",
        "free parking"
      ]
    },
    {
      "@search.score": 0.8955848,
      "HotelName": "Windy Ocean Motel",
      "Description": "Oceanfront hotel overlooking the **beach** features rooms with a private balcony and 2 indoor and outdoor pools. Inspired by the natural beauty of the island, each room includes an original painting of local scenes by the owner. Rooms include a mini fridge, Keurig coffee maker, and flatscreen TV. Various shops and art entertainment are on the boardwalk, just steps away.",
      "Tags": [
        "pool",
        "air conditioning",
        "bar"
      ]
    },
    {
      "@search.score": 0.83636594,
      "HotelName": "Happy Lake Resort & Restaurant",
      "Description": "The largest year-round resort in the area offering more of everything for your vacation – at the best value! What can you enjoy while at the resort, aside from the mile-long sandy **beaches** of the lake? Check out our activities sure to excite both young and young-at-heart guests. We have it all, including being named “Property of the Year” and a “Top Ten Resort” by top publications.",
      "Tags": [
        "pool",
        "bar",
        "restaurant"
      ]
    },
    {
      "@search.score": 0.7808502,
      "HotelName": "Swirling Currents Hotel",
      "Description": "Spacious rooms, glamorous suites and residences, rooftop pool, walking **access** to shopping, dining, entertainment and the city center. Each room comes equipped with a microwave, a coffee maker and a minifridge. In-room entertainment includes complimentary W-Fi and flat-screen TVs. ",
      "Tags": [
        "air conditioning",
        "laundry service",
        "24-hour front desk service"
      ]
    }
  ]
}

Sonraki sorguda aramayı yineleyin, bu kez terim erişimi boyunca plaj terimiyle sonuçları artırın. Sorgunun okunabilir bir sürümüdür search=Description:beach^2 access. İstemcinize bağlı olarak olarak %5E2ifade ^2 etmeniz gerekebilir.

POST /indexes/hotel-samples-index/docs/search?api-version=2024-07-01
{
    "search": "Description:beach^2 access",
    "queryType": "full",
    "select": "HotelName, Description, Tags",
    "searchFields": "HotelName, Description, Tags",
    "count": true
}

Siz plaj terimini güçlendirdikten sonra Campus Commander Hotel'de maç beşinci sıraya iner.

{
  "@odata.count": 6,
  "value": [
    {
      "@search.score": 2.137338,
      "HotelName": "Johnson's Family Resort",
      "Description": "Family oriented resort located in the heart of the northland. Operated since 1962 by the Smith family, we have grown into one of the largest family resorts in the state. The home of excellent Smallmouth Bass fishing with 10 small cabins, we're a home not only to fishermen but their families as well. Rebuilt in the early 2000's, all of our cabins have all the comforts of home. Sporting a huge beach with multiple water toys for those sunny summer days and a Lodge full of games for when you just can't swim anymore, there's always something for the family to do. A full marina offers watercraft rentals, boat launch, powered dock slips, canoes (free to use), & fish cleaning facility. Rent pontoons, 14' fishing boats, 16' fishing rigs or jet ski's for a fun day or week on the water. Pets are accepted in the lakeside cottages.",
      "Tags": [
        "24-hour front desk service",
        "pool",
        "coffee in lobby"
      ]
    },
    {
      "@search.score": 1.8100766,
      "HotelName": "Lakeside B & B",
      "Description": "Nature is Home on the beach. Explore the shore by day, and then come home to our shared living space to relax around a stone fireplace, sip something warm, and explore the library by night. Save up to 30 percent. Valid Now through the end of the year. Restrictions and blackouts may apply.",
      "Tags": [
        "laundry service",
        "concierge",
        "free parking"
      ]
    },
    {
      "@search.score": 1.7911696,
      "HotelName": "Windy Ocean Motel",
      "Description": "Oceanfront hotel overlooking the beach features rooms with a private balcony and 2 indoor and outdoor pools. Inspired by the natural beauty of the island, each room includes an original painting of local scenes by the owner. Rooms include a mini fridge, Keurig coffee maker, and flatscreen TV. Various shops and art entertainment are on the boardwalk, just steps away.",
      "Tags": [
        "pool",
        "air conditioning",
        "bar"
      ]
    },
    {
      "@search.score": 1.6727319,
      "HotelName": "Happy Lake Resort & Restaurant",
      "Description": "The largest year-round resort in the area offering more of everything for your vacation – at the best value! What can you enjoy while at the resort, aside from the mile-long sandy beaches of the lake? Check out our activities sure to excite both young and young-at-heart guests. We have it all, including being named “Property of the Year” and a “Top Ten Resort” by top publications.",
      "Tags": [
        "pool",
        "bar",
        "restaurant"
      ]
    },
    {
      "@search.score": 1.0162708,
      "HotelName": "Campus Commander Hotel",
      "Description": "Easy access to campus and steps away from the best shopping corridor in the city. From meetings in town or gameday, enjoy our prime location between the union and proximity to the university stadium.",
      "Tags": [
        "free parking",
        "coffee in lobby",
        "24-hour front desk service"
      ]
    },
    {
      "@search.score": 0.7808502,
      "HotelName": "Swirling Currents Hotel",
      "Description": "Spacious rooms, glamorous suites and residences, rooftop pool, walking access to shopping, dining, entertainment and the city center. Each room comes equipped with a microwave, a coffee maker and a minifridge. In-room entertainment includes complimentary W-Fi and flat-screen TVs. ",
      "Tags": [
        "air conditioning",
        "laundry service",
        "24-hour front desk service"
      ]
    }
  ]
}

Örnek 5: Regex

Normal ifade araması, RegExp sınıfında belgelendiği gibi eğik çizgilerle / küçük harf dizeleri arasındaki içeriği temel alan bir eşleşme bulur.

POST /indexes/hotel-samples-index/docs/search?api-version=2024-07-01
{
    "search": "HotelName:/(Mo|Ho)tel/",
    "queryType": "full",
    "select": "HotelName",
    "count": true
}

Bu sorgunun yanıtı aşağıdaki örneğe benzer görünmelidir (kısa olması için kırpılmıştır):

{
  "@odata.count": 25,
  "value": [
    {
      "@search.score": 1,
      "HotelName": "Country Residence Hotel"
    },
    {
      "@search.score": 1,
      "HotelName": "Downtown Mix Hotel"
    },
    {
      "@search.score": 1,
      "HotelName": "Gastronomic Landscape Hotel"
    },
    . . . 
    {
      "@search.score": 1,
      "HotelName": "Trails End Motel"
    },
    {
      "@search.score": 1,
      "HotelName": "Nordick's Valley Motel"
    },
    {
      "@search.score": 1,
      "HotelName": "King's Cellar Hotel"
    }
  ]
}

Not

Regex sorguları çözümlenmez. Kısmi sorgu terimlerinde gerçekleştirilen tek dönüştürme, küçük harfle ifade edilir.

Birden çok () veya tek? (*) karakterli joker karakter araması için genel olarak tanınan söz dizimi kullanabilirsiniz. Lucene sorgu ayrıştırıcısı, bu simgelerin bir tümcecikle değil tek bir terimle kullanılmasını destekler.

Bu sorguda, sc ön ekini içeren otel adlarını arayın. Aramanın ilk karakteri olarak veya ? simgesini kullanamazsınız*.

POST /indexes/hotel-samples-index/docs/search?api-version=2024-07-01
{
    "search": "HotelName:sc*",
    "queryType": "full",
    "select": "HotelName",
    "count": true
}

Bu sorgunun yanıtı aşağıdaki örneğe benzer olmalıdır:

{
  "@odata.count": 1,
  "value": [
    {
      "@search.score": 1,
      "HotelName": "Waterfront Scottish Inn"
    }
  ]
}

Not

Joker karakter sorguları çözümlenmez. Kısmi sorgu terimlerinde gerçekleştirilen tek dönüştürme, küçük harfle ifade edilir.

Kodda sorgu belirtmeyi deneyin. Aşağıdaki bağlantı, Azure SDK'larını kullanarak arama sorguları ayarlamayı kapsar.

Aşağıdaki makalelerde daha fazla söz dizimi başvurusu, sorgu mimarisi ve örnek bulunabilir: