Aracılığıyla paylaş


Adlandırılmış Varlık Tanıma (NER) kullanma

NER özelliği yapılandırılmamış metni değerlendirebilir ve kişi, konum, olay, ürün ve kuruluş gibi önceden tanımlanmış çeşitli kategorilerdeki metinlerden adlandırılmış varlıkları ayıklayabilir.

Dağıtım seçenekleri

Adlandırılmış varlık tanımayı kullanmak için analiz için yapılandırılmamış ham metin gönderir ve uygulamanızdaki API çıkışını işlersiniz. Analiz, verilerinizde kullanılan modelde ek özelleştirme yapılmadan olduğu gibi gerçekleştirilir. Adlandırılmış varlık tanımayı kullanmanın iki yolu vardır:

Geliştirme seçeneği Açıklama
Dil stüdyosu Language Studio, Azure hesabı olmadan metin örnekleriyle varlık bağlamayı ve kaydolduğunuz sırada kendi verilerinizi denemenize olanak tanıyan web tabanlı bir platformdur. Daha fazla bilgi için Language Studio web sitesine veya language studio hızlı başlangıcına bakın.
REST API veya İstemci kitaplığı (Azure SDK) REST API'sini veya çeşitli dillerde kullanılabilen istemci kitaplığını kullanarak adlandırılmış varlık tanımayı uygulamalarınızla tümleştirin. Daha fazla bilgi için adlandırılmış varlık tanıma hızlı başlangıcına bakın.

Verilerin nasıl işleneceğini belirleme (isteğe bağlı)

Giriş dilleri

İşlenecek belgeleri gönderdiğinizde, desteklenen dillerden hangisinin yazılacağını belirtebilirsiniz. Dil belirtmezseniz, anahtar tümcecik ayıklama varsayılan olarak İngilizce olur. API, farklı çok dilli ve emoji kodlamalarını desteklemek için yanıtta uzaklıklar döndürebilir.

Veri gönderme

İstek alındığında analiz gerçekleştirilir. NER özelliğinin zaman uyumlu olarak kullanılması durum bilgisi yoktur. Hesabınızda hiçbir veri depolanmaz ve sonuçlar yanıtta hemen döndürülür.

Bu özelliği zaman uyumsuz olarak kullanırken, API sonuçları isteğin alındığı zamandan itibaren 24 saat boyunca kullanılabilir ve yanıtta belirtilir. Bu zaman aralığından sonra sonuçlar temizlenir ve artık alınamayacaktır.

API, belirli bir belge dili için tanımlı varlık kategorilerini algılamaya çalışır.

NER sonuçlarını alma

NER'den sonuç aldığınızda, sonuçları bir uygulamaya akışla aktarabilir veya çıkışı yerel sistemdeki bir dosyaya kaydedebilirsiniz. API yanıtı, kategorileri ve alt kategorileri ile güvenilirlik puanları da dahil olmak üzere tanınan varlıkları içerir.

Döndürülecek varlıkları seçme

API, belirli bir belge dili için tanımlı varlık türlerini ve etiketlerini algılamaya çalışır. Varlık türleri ve etiketleri, eski modellerin daha fazla esneklik için varlıkları tanımlamak için kullandığı kategorilerin ve alt kategorilerin yapısının yerini alır. Ayrıca hangi varlıkların algılanıp döndürüleceğini belirtebilir, isteğe bağlı includeList ve excludeList parametrelerini uygun varlık türleriyle kullanabilirsiniz. Aşağıdaki örnek yalnızca Locationöğesini algılar. Döndürülecek bir veya daha fazla varlık türü belirtebilirsiniz. Bu sürüm için sunulan türler ve etiketler hiyerarşisi göz önünde bulundurulduğunda, aşağıdaki gibi farklı ayrıntı düzeyine göre filtreleme esnekliğine sahip olursunuz:

Girdi:

Not

Bu örnekte yalnızca "Konum" varlık türünü döndürür.

{
    "kind": "EntityRecognition",
    "parameters": 
    {
        "includeList" :
        [
            "Location"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

Yukarıdaki örnekler, varlık türleri ve etiketleri tarafından özetlenen , Structuralve Geological etiketli varlıklar gibi GPEvarlık türünün altına Location düşen varlıkları döndürür. Ayrıca, yalnızca ana hatlarıyla belirtildiği gibi etiket üzerinde GPE filtreleme gibi varlık türü için Location varlık etiketlerinden birini kullanarak filtreleyerek döndürülen varlıkları daha fazla filtreleyebiliriz:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ]
    }
    

Bu yöntem yalnızca etiketin altına düşen tüm Location varlıkları döndürür ve veya etiketlenmiş varlıklar gibi Geological Structural Location başka bir varlık etiketiyle etiketlenen türün Location altına düşen diğer varlıkları yoksayar.GPE Ayrıca parametresini kullanarak sonuçlarımızda daha fazla detaya excludeList gidebiliriz. GPE etiketli varlıklar şu etiketlerle etiketlenebilir: City, State, CountryRegion, Continent. Örneğin, örneğimizin ve etiketlerini dışlayabiliriz Continent CountryRegion :


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ],
        "excludeList": :
        [
            "Continent",
            "CountryRegion"
        ]
    }
    

Bu parametreleri kullanarak yalnızca Location varlık türlerini başarıyla filtreleyebiliriz, çünkü parametresine includeList dahil edilen GPE varlık etiketi türün Location altındadır. Ardından yalnızca Jeopolitik varlıkları filtreleyeceğiz ve veya CountryRegion etiketleriyle Continent etiketlenmiş varlıkları hariç tutacağız.

Ek çıkış öznitelikleri

NeR, kullanıcılara bir varlığın türleri hakkında daha fazla içgörü sağlamak ve daha fazla kullanılabilirlik sağlamak için çıkışta şu öznitelikleri destekler:

Özniteliğin adı Tür Tanım
type String Algılanan varlığın en özel türü.

Örneğin, "Seattle" bir City, GPE (Coğrafi Politik Varlık) ve bir Location' dir. "Seattle" için en ayrıntılı sınıflandırma, bir Cityolmasıdır. Tür, "Seattle" metni için olabilir City .
tags Liste (etiketler) Algılanan varlığın bir hiyerarşiye veya başka bir gruplandırmaya benzini ifade eden etiket nesnelerinin listesi.

Etiket iki alan içerir:
1. name: Etiket için benzersiz bir ad.
2. confidenceScore: 0 ile 1 arasında bir etiket için ilişkili güvenilirlik puanı.

Bu benzersiz tagName, ve exclusionList parametrelerinde inclusionList filtrelemek için kullanılır.
metadata Object Meta veriler, algılanan varlık türü hakkında daha fazla veri içeren bir nesnedir. alanına metadataKindgöre değişir.

Örnek çıktı

Bu örnek çıktı, ek çıkış özniteliklerinin bir örneğini içerir.

{ 
    "kind": "EntityRecognitionResults", 
    "results": { 
        "documents": [ 
            { 
                "id": "1", 
                "entities": [ 
                    { 
                        "text": "Microsoft", 
                        "category": "Organization", 
                        "type": "Organization", 
                        "offset": 0, 
                        "length": 9, 
                        "confidenceScore": 0.97, 
                        "tags": [ 
                            { 
                                "name": "Organization", 
                                "confidenceScore": 0.97 
                            } 
                        ] 
                    }, 
                    { 
                        "text": "One", 
                        "category": "Quantity", 
                        "type": "Number", 
                        "subcategory": "Number", 
                        "offset": 21, 
                        "length": 3, 
                        "confidenceScore": 0.9, 
                        "tags": [ 
                            { 
                                "name": "Number", 
                                "confidenceScore": 0.8 
                            }, 
                            { 
                                "name": "Quantity", 
                                "confidenceScore": 0.8 
                            }, 
                            { 
                                "name": "Numeric", 
                                "confidenceScore": 0.8 
                            } 
                        ], 
                        "metadata": { 
                            "metadataKind": "NumberMetadata", 
                            "numberKind": "Integer", 
                            "value": 1.0 
                        } 
                    } 
                ], 
                "warnings": [] 
            } 
        ], 
        "errors": [], 
        "modelVersion": "2023-09-01" 
    } 
} 

NER modelini belirtme

Varsayılan olarak, bu özellik metninizde en son kullanılabilir yapay zeka modelini kullanır. API isteklerinizi belirli bir model sürümünü kullanacak şekilde de yapılandırabilirsiniz.

Hizmet ve veri sınırları

Dakika ve saniye başına gönderebileceğiniz isteklerin boyutu ve sayısı hakkında bilgi için hizmet sınırları makalesine bakın.

Sonraki adımlar

Adlandırılmış Varlık Tanıma'ya genel bakış