Adlandırılmış Varlık Tanıma (NER) kullanma
NER özelliği yapılandırılmamış metni değerlendirebilir ve kişi, konum, olay, ürün ve kuruluş gibi önceden tanımlanmış çeşitli kategorilerdeki metinlerden adlandırılmış varlıkları ayıklayabilir.
Dağıtım seçenekleri
Adlandırılmış varlık tanımayı kullanmak için analiz için yapılandırılmamış ham metin gönderir ve uygulamanızdaki API çıkışını işlersiniz. Analiz, verilerinizde kullanılan modelde ek özelleştirme yapılmadan olduğu gibi gerçekleştirilir. Adlandırılmış varlık tanımayı kullanmanın iki yolu vardır:
Geliştirme seçeneği | Açıklama |
---|---|
Dil stüdyosu | Language Studio, Azure hesabı olmadan metin örnekleriyle varlık bağlamayı ve kaydolduğunuz sırada kendi verilerinizi denemenize olanak tanıyan web tabanlı bir platformdur. Daha fazla bilgi için Language Studio web sitesine veya language studio hızlı başlangıcına bakın. |
REST API veya İstemci kitaplığı (Azure SDK) | REST API'sini veya çeşitli dillerde kullanılabilen istemci kitaplığını kullanarak adlandırılmış varlık tanımayı uygulamalarınızla tümleştirin. Daha fazla bilgi için adlandırılmış varlık tanıma hızlı başlangıcına bakın. |
Verilerin nasıl işleneceğini belirleme (isteğe bağlı)
Giriş dilleri
İşlenecek belgeleri gönderdiğinizde, desteklenen dillerden hangisinin yazılacağını belirtebilirsiniz. Dil belirtmezseniz, anahtar tümcecik ayıklama varsayılan olarak İngilizce olur. API, farklı çok dilli ve emoji kodlamalarını desteklemek için yanıtta uzaklıklar döndürebilir.
Veri gönderme
İstek alındığında analiz gerçekleştirilir. NER özelliğinin zaman uyumlu olarak kullanılması durum bilgisi yoktur. Hesabınızda hiçbir veri depolanmaz ve sonuçlar yanıtta hemen döndürülür.
Bu özelliği zaman uyumsuz olarak kullanırken, API sonuçları isteğin alındığı zamandan itibaren 24 saat boyunca kullanılabilir ve yanıtta belirtilir. Bu zaman aralığından sonra sonuçlar temizlenir ve artık alınamayacaktır.
API, belirli bir belge dili için tanımlı varlık kategorilerini algılamaya çalışır.
NER sonuçlarını alma
NER'den sonuç aldığınızda, sonuçları bir uygulamaya akışla aktarabilir veya çıkışı yerel sistemdeki bir dosyaya kaydedebilirsiniz. API yanıtı, kategorileri ve alt kategorileri ile güvenilirlik puanları da dahil olmak üzere tanınan varlıkları içerir.
Döndürülecek varlıkları seçme
API, belirli bir belge dili için tanımlı varlık türlerini ve etiketlerini algılamaya çalışır. Varlık türleri ve etiketleri, eski modellerin daha fazla esneklik için varlıkları tanımlamak için kullandığı kategorilerin ve alt kategorilerin yapısının yerini alır. Ayrıca hangi varlıkların algılanıp döndürüleceğini belirtebilir, isteğe bağlı includeList
ve excludeList
parametrelerini uygun varlık türleriyle kullanabilirsiniz. Aşağıdaki örnek yalnızca Location
öğesini algılar. Döndürülecek bir veya daha fazla varlık türü belirtebilirsiniz. Bu sürüm için sunulan türler ve etiketler hiyerarşisi göz önünde bulundurulduğunda, aşağıdaki gibi farklı ayrıntı düzeyine göre filtreleme esnekliğine sahip olursunuz:
Girdi:
Not
Bu örnekte yalnızca "Konum" varlık türünü döndürür.
{
"kind": "EntityRecognition",
"parameters":
{
"includeList" :
[
"Location"
]
},
"analysisInput":
{
"documents":
[
{
"id":"1",
"language": "en",
"text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
}
]
}
}
Yukarıdaki örnekler, varlık türleri ve etiketleri tarafından özetlenen , Structural
ve Geological
etiketli varlıklar gibi GPE
varlık türünün altına Location
düşen varlıkları döndürür. Ayrıca, yalnızca ana hatlarıyla belirtildiği gibi etiket üzerinde GPE
filtreleme gibi varlık türü için Location
varlık etiketlerinden birini kullanarak filtreleyerek döndürülen varlıkları daha fazla filtreleyebiliriz:
"parameters":
{
"includeList" :
[
"GPE"
]
}
Bu yöntem yalnızca etiketin altına düşen tüm Location
varlıkları döndürür ve veya etiketlenmiş varlıklar gibi Geological
Structural
Location
başka bir varlık etiketiyle etiketlenen türün Location
altına düşen diğer varlıkları yoksayar.GPE
Ayrıca parametresini kullanarak sonuçlarımızda daha fazla detaya excludeList
gidebiliriz. GPE
etiketli varlıklar şu etiketlerle etiketlenebilir: City
, State
, CountryRegion
, Continent
. Örneğin, örneğimizin ve etiketlerini dışlayabiliriz Continent
CountryRegion
:
"parameters":
{
"includeList" :
[
"GPE"
],
"excludeList": :
[
"Continent",
"CountryRegion"
]
}
Bu parametreleri kullanarak yalnızca Location
varlık türlerini başarıyla filtreleyebiliriz, çünkü parametresine includeList
dahil edilen GPE
varlık etiketi türün Location
altındadır. Ardından yalnızca Jeopolitik varlıkları filtreleyeceğiz ve veya CountryRegion
etiketleriyle Continent
etiketlenmiş varlıkları hariç tutacağız.
Ek çıkış öznitelikleri
NeR, kullanıcılara bir varlığın türleri hakkında daha fazla içgörü sağlamak ve daha fazla kullanılabilirlik sağlamak için çıkışta şu öznitelikleri destekler:
Özniteliğin adı | Tür | Tanım |
---|---|---|
type |
String | Algılanan varlığın en özel türü. Örneğin, "Seattle" bir City , GPE (Coğrafi Politik Varlık) ve bir Location ' dir. "Seattle" için en ayrıntılı sınıflandırma, bir City olmasıdır. Tür, "Seattle" metni için olabilir City . |
tags |
Liste (etiketler) | Algılanan varlığın bir hiyerarşiye veya başka bir gruplandırmaya benzini ifade eden etiket nesnelerinin listesi. Etiket iki alan içerir: 1. name : Etiket için benzersiz bir ad.2. confidenceScore : 0 ile 1 arasında bir etiket için ilişkili güvenilirlik puanı.Bu benzersiz tagName, ve exclusionList parametrelerinde inclusionList filtrelemek için kullanılır. |
metadata |
Object | Meta veriler, algılanan varlık türü hakkında daha fazla veri içeren bir nesnedir. alanına metadataKind göre değişir. |
Örnek çıktı
Bu örnek çıktı, ek çıkış özniteliklerinin bir örneğini içerir.
{
"kind": "EntityRecognitionResults",
"results": {
"documents": [
{
"id": "1",
"entities": [
{
"text": "Microsoft",
"category": "Organization",
"type": "Organization",
"offset": 0,
"length": 9,
"confidenceScore": 0.97,
"tags": [
{
"name": "Organization",
"confidenceScore": 0.97
}
]
},
{
"text": "One",
"category": "Quantity",
"type": "Number",
"subcategory": "Number",
"offset": 21,
"length": 3,
"confidenceScore": 0.9,
"tags": [
{
"name": "Number",
"confidenceScore": 0.8
},
{
"name": "Quantity",
"confidenceScore": 0.8
},
{
"name": "Numeric",
"confidenceScore": 0.8
}
],
"metadata": {
"metadataKind": "NumberMetadata",
"numberKind": "Integer",
"value": 1.0
}
}
],
"warnings": []
}
],
"errors": [],
"modelVersion": "2023-09-01"
}
}
NER modelini belirtme
Varsayılan olarak, bu özellik metninizde en son kullanılabilir yapay zeka modelini kullanır. API isteklerinizi belirli bir model sürümünü kullanacak şekilde de yapılandırabilirsiniz.
Hizmet ve veri sınırları
Dakika ve saniye başına gönderebileceğiniz isteklerin boyutu ve sayısı hakkında bilgi için hizmet sınırları makalesine bakın.