Aracılığıyla paylaş


Hızlı Başlangıç: Çok modüllü içeriği analiz etme (önizleme)

Multimodal API, uygulamaları ve hizmetleri kullanıcı tarafından oluşturulan veya yapay zeka tarafından oluşturulan zararlı içeriklerden daha güvenli hale getirmek için hem görüntü içeriği hem de metin içeriği içeren malzemeleri analiz eder. Bir görüntüyü ve ilişkili metin içeriğini birlikte analiz etmek bağlamı koruyabilir ve içeriğin daha kapsamlı bir şekilde anlaşılmasını sağlayabilir.

İçeriğin filtrelenme şekli hakkında daha fazla bilgi için Bkz . Zarar kategorileri kavramı sayfası. API giriş sınırları için Genel Bakış'ın Giriş gereksinimleri bölümüne bakın.

Önemli

Bu özellik yalnızca belirli Azure bölgelerinde kullanılabilir. Bkz. Bölge kullanılabilirliği.

Önkoşullar

Resmi metinle analiz etme

Aşağıdaki bölümde, cURL ile örnek bir çok modlu denetim isteğinde yol gösterilir.

Örnek görüntü hazırlama

Analiz etmek için örnek bir görüntü seçin ve cihazınıza indirin.

Görüntü sınırlamaları için bkz . Giriş gereksinimleri . Biçiminiz animasyonluysa, hizmet analizi yapmak için ilk kareyi ayıklar.

Görüntünüzü iki yöntemden biriyle girebilirsiniz: yerel dosya akışı veya blob depolama URL'si.

  • Yerel dosya akışı (önerilir): Görüntünüzü base64 olarak kodlayın. Kodlamayı yapmak için codebeautify gibi bir web sitesi kullanabilirsiniz. Ardından kodlanmış dizeyi geçici bir konuma kaydedin.
  • Blob depolama URL'si: Görüntünüzü bir Azure Blob Depolama hesabına yükleyin. Bunun nasıl yapılacağını öğrenmek için blob depolama hızlı başlangıcını izleyin. Ardından Azure Depolama Gezgini açın ve görüntünüzün URL'sini alın. Geçici bir konuma kaydedin.

Resmi metinle analiz etme

Aşağıdaki komutu bir metin düzenleyicisine yapıştırın ve aşağıdaki değişiklikleri yapın.

  1. değerini kaynak uç noktası URL'nizle değiştirin <endpoint> .
  2. <your_subscription_key> yerine anahtarınızı yazın.
  3. Gövdedeki "image" alanı bir "content" alan veya "blobUrl" alanla doldurun. Örneğin: {"image": {"content": "<base_64_string>"} veya {"image": {"blobUrl": "<your_storage_url>"}.
  4. İsteğe bağlı olarak alanın değerini "text" analiz etmek istediğiniz kendi metninizle değiştirin.
curl --location '<endpoint>/contentsafety/imageWithText:analyze?api-version=2024-09-15-preview ' \
--header 'Ocp-Apim-Subscription-Key: <your_subscription_key>' \
--header 'Content-Type: application/json' \
--data '{
  "image": {
      "content": "<base_64_string>"
 },
  "categories": ["Hate","Sexual","Violence","SelfHarm"],
  "enableOcr": true,
  "text": "I want to kill you"
}'

Not

Blob depolama URL'si kullanıyorsanız istek gövdesi şu şekilde görünmelidir:

{
  "image": {
    "blobUrl": "<your_storage_url>"
  }
}

Aşağıdaki alanlar URL'ye eklenmelidir:

Veri Akışı Adı Gerekli mi? Açıklama Tür
API Sürümü Zorunlu Bu, denetlenecek API sürümüdür. Geçerli sürüm: api-version=2024-09-15. Örnek: <endpoint>/contentsafety/imageWithText:analyze?api-version=2024-09-15 String

İstek gövdesindeki parametreler şu tabloda tanımlanmıştır:

Veri Akışı Adı Açıklama Tür
içerik veya blobUrl (Gerekli) Görüntünün içeriği veya blob URL'si. Base64 ile kodlanmış bayt veya blob URL'si olabilirim. Her ikisi de verilirse istek reddedilir. Resmin izin verilen en büyük boyutu 7.200 x 7.200 piksel ve maksimum dosya boyutu 4 MB'tır. Resmin en küçük boyutu 50 piksel x 50 pikseldir. String
text (İsteğe bağlı) Resme eklenen metin. Bir metin isteğinde en fazla 1000 karakteri (unicode kod noktaları) destekliyoruz. String
enableOcr (Gerekli) True olarak ayarlandığında hizmetimiz OCR gerçekleştirir ve algılanan metni aynı anda giriş görüntüsüyle analiz eder. Giriş görüntüsünden en fazla 1000 karakter (unicode kod noktaları) tanıyacağız. Diğerleri kesilecek. Boolean
Kategori (İsteğe bağlı) Bunun bir kategori adları dizisi olduğu varsayılır. Kullanılabilir kategori adlarının listesi için Bkz. Harm kategorileri kılavuzu . Hiçbir kategori belirtilmezse, dört kategori de kullanılır. Tek bir istekte puan almak için birden çok kategori kullanırız. Sabit listesi

Bir komut istemi penceresi açın ve cURL komutunu çalıştırın.

Çıktı

Görüntü ve metin denetimi sonuçlarının konsolda JSON verileri olarak görüntülendiğini görmeniz gerekir. Örneğin:

{
  "categoriesAnalysis": [
    {
      "category": "Hate",
      "severity": 2
    },
    {
      "category": "SelfHarm",
      "severity": 0
    },
    {
      "category": "Sexual",
      "severity": 0
    },
    {
      "category": "Violence",
      "severity": 0
    }
  ]
}

Çıktıdaki JSON alanları burada tanımlanır:

Veri Akışı Adı Açıklama Tür
kategorilerAnalysis API'nin tahmin yaptığı her çıkış sınıfı. Sınıflandırma çok etiketli olabilir. Örneğin, görüntü denetim modeline bir görüntü yüklendiğinde, hem cinsel içerik hem de şiddet olarak sınıflandırılabilir. Zarar kategorileri String
Önem Derecesi Her zarar kategorisinde bayrağın önem düzeyi. Zarar kategorileri Tamsayı