Hızlı Başlangıç: Çok modüllü içeriği analiz etme (önizleme)

Makale
09/25/2024

Multimodal API, uygulamaları ve hizmetleri kullanıcı tarafından oluşturulan veya yapay zeka tarafından oluşturulan zararlı içeriklerden daha güvenli hale getirmek için hem görüntü içeriği hem de metin içeriği içeren malzemeleri analiz eder. Bir görüntüyü ve ilişkili metin içeriğini birlikte analiz etmek bağlamı koruyabilir ve içeriğin daha kapsamlı bir şekilde anlaşılmasını sağlayabilir.

İçeriğin filtrelenme şekli hakkında daha fazla bilgi için Bkz . Zarar kategorileri kavramı sayfası. API giriş sınırları için Genel Bakış'ın Giriş gereksinimleri bölümüne bakın.

Önemli

Bu özellik yalnızca belirli Azure bölgelerinde kullanılabilir. Bkz. Bölge kullanılabilirliği.

Önkoşullar

Azure aboneliği - Ücretsiz bir abonelik oluşturun
Azure aboneliğinizi aldıktan sonra anahtarınızı ve uç noktanızı almak için Azure portalında bir İçerik Güvenliği kaynağı oluşturun. Kaynağınız için benzersiz bir ad girin, aboneliğinizi seçin ve bir kaynak grubu, desteklenen bölge ve desteklenen fiyatlandırma katmanını seçin. Daha sonra, Oluştur'u seçin.
- Kaynağın dağıtılması birkaç dakika sürer. Tamamlandıktan sonra Kaynağa git'i seçin. Sol bölmedeki Kaynak Yönetimi'nin altında Abonelik Anahtarı ve Uç Nokta'yı seçin. Uç noktayı ve anahtar değerlerinden birini daha sonra kullanmak üzere geçici bir konuma kopyalayın.
Aşağıdakilerden biri yüklendi:
- REST API çağrıları için cURL .
- Python 3.x yüklü

Resmi metinle analiz etme

Aşağıdaki bölümde, cURL ile örnek bir çok modlu denetim isteğinde yol gösterilir.

Örnek görüntü hazırlama

Analiz etmek için örnek bir görüntü seçin ve cihazınıza indirin.

Görüntü sınırlamaları için bkz . Giriş gereksinimleri . Biçiminiz animasyonluysa, hizmet analizi yapmak için ilk kareyi ayıklar.

Görüntünüzü iki yöntemden biriyle girebilirsiniz: yerel dosya akışı veya blob depolama URL'si.

Yerel dosya akışı (önerilir): Görüntünüzü base64 olarak kodlayın. Kodlamayı yapmak için codebeautify gibi bir web sitesi kullanabilirsiniz. Ardından kodlanmış dizeyi geçici bir konuma kaydedin.
Blob depolama URL'si: Görüntünüzü bir Azure Blob Depolama hesabına yükleyin. Bunun nasıl yapılacağını öğrenmek için blob depolama hızlı başlangıcını izleyin. Ardından Azure Depolama Gezgini açın ve görüntünüzün URL'sini alın. Geçici bir konuma kaydedin.

Resmi metinle analiz etme

Aşağıdaki komutu bir metin düzenleyicisine yapıştırın ve aşağıdaki değişiklikleri yapın.

değerini kaynak uç noktası URL'nizle değiştirin <endpoint> .
<your_subscription_key> yerine anahtarınızı yazın.
Gövdedeki "image" alanı bir "content" alan veya "blobUrl" alanla doldurun. Örneğin: {"image": {"content": "<base_64_string>"} veya {"image": {"blobUrl": "<your_storage_url>"}.
İsteğe bağlı olarak alanın değerini "text" analiz etmek istediğiniz kendi metninizle değiştirin.

curl --location '<endpoint>/contentsafety/imageWithText:analyze?api-version=2024-09-15-preview ' \
--header 'Ocp-Apim-Subscription-Key: <your_subscription_key>' \
--header 'Content-Type: application/json' \
--data '{
  "image": {
      "content": "<base_64_string>"
 },
  "categories": ["Hate","Sexual","Violence","SelfHarm"],
  "enableOcr": true,
  "text": "I want to kill you"
}'

Not

Blob depolama URL'si kullanıyorsanız istek gövdesi şu şekilde görünmelidir:

{
  "image": {
    "blobUrl": "<your_storage_url>"
  }
}

Aşağıdaki alanlar URL'ye eklenmelidir:

Veri Akışı Adı	Gerekli mi?	Açıklama	Tür
API Sürümü	Zorunlu	Bu, denetlenecek API sürümüdür. Geçerli sürüm: `api-version=2024-09-15`. Örnek: `<endpoint>/contentsafety/imageWithText:analyze?api-version=2024-09-15`	String

İstek gövdesindeki parametreler şu tabloda tanımlanmıştır:

Veri Akışı Adı	Açıklama	Tür
içerik veya blobUrl	(Gerekli) Görüntünün içeriği veya blob URL'si. Base64 ile kodlanmış bayt veya blob URL'si olabilirim. Her ikisi de verilirse istek reddedilir. Resmin izin verilen en büyük boyutu 7.200 x 7.200 piksel ve maksimum dosya boyutu 4 MB'tır. Resmin en küçük boyutu 50 piksel x 50 pikseldir.	String
text	(İsteğe bağlı) Resme eklenen metin. Bir metin isteğinde en fazla 1000 karakteri (unicode kod noktaları) destekliyoruz.	String
enableOcr	(Gerekli) True olarak ayarlandığında hizmetimiz OCR gerçekleştirir ve algılanan metni aynı anda giriş görüntüsüyle analiz eder. Giriş görüntüsünden en fazla 1000 karakter (unicode kod noktaları) tanıyacağız. Diğerleri kesilecek.	Boolean
Kategori	(İsteğe bağlı) Bunun bir kategori adları dizisi olduğu varsayılır. Kullanılabilir kategori adlarının listesi için Bkz. Harm kategorileri kılavuzu . Hiçbir kategori belirtilmezse, dört kategori de kullanılır. Tek bir istekte puan almak için birden çok kategori kullanırız.	Sabit listesi

Bir komut istemi penceresi açın ve cURL komutunu çalıştırın.

Çıktı

Görüntü ve metin denetimi sonuçlarının konsolda JSON verileri olarak görüntülendiğini görmeniz gerekir. Örneğin:

{
  "categoriesAnalysis": [
    {
      "category": "Hate",
      "severity": 2
    },
    {
      "category": "SelfHarm",
      "severity": 0
    },
    {
      "category": "Sexual",
      "severity": 0
    },
    {
      "category": "Violence",
      "severity": 0
    }
  ]
}

Çıktıdaki JSON alanları burada tanımlanır:

Veri Akışı Adı	Açıklama	Tür
kategorilerAnalysis	API'nin tahmin yaptığı her çıkış sınıfı. Sınıflandırma çok etiketli olabilir. Örneğin, görüntü denetim modeline bir görüntü yüklendiğinde, hem cinsel içerik hem de şiddet olarak sınıflandırılabilir. Zarar kategorileri	String
Önem Derecesi	Her zarar kategorisinde bayrağın önem düzeyi. Zarar kategorileri	Tamsayı

Aracılığıyla paylaş

Hızlı Başlangıç: Çok modüllü içeriği analiz etme (önizleme)

Önkoşullar

Resmi metinle analiz etme

Örnek görüntü hazırlama

Resmi metinle analiz etme

Çıktı

Geri Bildirim

Ek kaynaklar