Dil algılama bilişsel becerisi
Dil Algılama becerisi, giriş metninin dilini algılar ve istekte gönderilen her belge için tek bir dil kodu bildirir. Dil kodu, analizin gücünü gösteren bir puanla eşleştirilir. Bu beceri, Azure Yapay Zeka Dili'nde sağlanan makine öğrenmesi modellerini kullanır.
Bu özellik özellikle metnin dilini diğer becerilere giriş olarak sağlamanız gerektiğinde kullanışlıdır (örneğin, Yaklaşım Analizi becerisi veya Metin Bölme becerisi).
Bkz. Dil Algılama için desteklenen diller . Desteklenmeyen bir dilde ifade edilen içeriğiniz varsa, yanıt şeklindedir (Unknown)
.
Not
Bu beceri Azure AI hizmetlerine bağlıdır ve günlük dizin oluşturucu başına 20 belgeyi aşan işlemler için faturalanabilir bir kaynak gerektirir. Yerleşik becerilerin yürütülmesi, mevcut Azure AI hizmetlerinin kullandıkça öde fiyatından ücretlendirilir.
@odata.type
Microsoft.Skills.Text.LanguageDetectionSkill
Veri sınırları
Kaydın boyut üst sınırı, tarafından String.Length
ölçülen 50.000 karakter olmalıdır. Verilerinizi dil algılama becerisine göndermeden önce bölmeniz gerekiyorsa Metin Bölme becerisini kullanabilirsiniz.
Beceri parametreleri
Parametreler büyük/küçük harfe duyarlıdır.
Girişler | Açıklama |
---|---|
defaultCountryHint |
(İsteğe bağlı) Iso 3166-1 alfa-2 iki harfli ülke kodu, dili kesinleştirmediyse dil algılama modeline bir ipucu olarak kullanılabilir. Özellikle parametresi, defaultCountryHint girişi açıkça belirtmeyen countryHint belgelerle birlikte kullanılır. |
modelVersion |
(İsteğe bağlı) Dil algılamayı çağırırken kullanılacak modelin sürümünü belirtir. Belirtilmediğinde varsayılan olarak en son kullanılabilir değeri kullanır. Gerekli olmadığı sürece bu değeri belirtmenizi öneririz. |
Beceri girişleri
Parametreler büyük/küçük harfe duyarlıdır.
Girişler | Açıklama |
---|---|
text |
Analiz edilecek metin. |
countryHint |
Dili kesinleştirme özelliğine sahip değilse dil algılama modeline ipucu olarak kullanılacak ISO 3166-1 alfa-2 iki harfli ülke kodu. |
Beceri çıkışları
Çıkış Adı | Açıklama |
---|---|
languageCode |
Tanımlanan dil için ISO 6391 dil kodu. Örneğin, "en". |
languageName |
Dilin adı. Örneğin, "İngilizce". |
score |
0 ile 1 arasında bir değer. Dilin doğru şekilde tanımlanması olasılığı. Cümlede karışık diller varsa puan 1'den düşük olabilir. |
Örnek tanım
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/text"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "myLanguageCode"
},
{
"name": "languageName",
"targetName": "myLanguageName"
},
{
"name": "score",
"targetName": "myLanguageScore"
}
]
}
Örnek girdi
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
},
{
"recordId": "3",
"data":
{
"text": "impossible",
"countryHint": "fr"
}
}
]
Örnek çıktı
{
"values": [
{
"recordId": "1",
"data":
{
"languageCode": "en",
"languageName": "English",
"score": 1,
}
},
{
"recordId": "2",
"data":
{
"languageCode": "es",
"languageName": "Spanish",
"score": 1,
}
},
{
"recordId": "3",
"data":
{
"languageCode": "fr",
"languageName": "French",
"score": 1,
}
}
]
}