Konuşma hizmeti kotaları ve sınırları
Bu makale, Azure yapay zeka hizmetlerinde Konuşma hizmeti için kotaların ve sınırların ayrıntılı bir açıklamasını ve hızlı başvuruyu içerir. Bilgiler, hizmetin tüm fiyatlandırma katmanları için geçerlidir. Ayrıca istek azaltmayı önlemek için bazı en iyi yöntemleri içerir.
Ücretsiz (F0) fiyatlandırma katmanı için fiyatlandırma sayfasındaki aylık izinlere de bakın.
Kotalar ve limitler başvurusu
Aşağıdaki bölümlerde Konuşma hizmeti için geçerli olan kotalar ve sınırlar için hızlı bir kılavuz sağlanır.
Standart (S0) Konuşma kaynakları için ayarlanabilir kotalar hakkında bilgi için daha fazla açıklamaya, en iyi yöntemlere ve ayarlama yönergelerine bakın. Ücretsiz (F0) Konuşma kaynaklarının kotaları ve sınırları ayarlanamaz.
Önemli
Konuşma kaynağını Ücretsiz (F0) olan Standart (S0) fiyatlandırma katmanına değiştirirseniz, ilgili kotaların değiştirilmesi birkaç saate kadar sürebilir.
Kaynak başına metin kotalarına ve sınırlarına konuşma
Bu bölümde Konuşma kaynağı başına konuşmayı metne dönüştürme kotaları ve sınırları açıklanmaktadır. Aksi belirtilmediği sürece sınırlar ayarlanamaz.
Gerçek zamanlı konuşmayı metne dönüştürme ve konuşma çevirisi
Kısa ses için Konuşma SDK'sı veya Konuşmayı metne dönüştürme REST API'siyle metinde gerçek zamanlı konuşma kullanabilirsiniz.
Önemli
Bu sınırlar, metin isteklerine eş zamanlı gerçek zamanlı konuşma ve konuşma çevirisi isteklerinin birleştirilmesi için geçerlidir. Örneğin, metin isteklerine yönelik 60 eşzamanlı konuşma ve 40 eşzamanlı konuşma çevirisi isteğiniz varsa, 100 eşzamanlı istek sınırına ulaşırsınız.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Eşzamanlı istek sınırı - temel model uç noktası | 1 Bu sınır ayarlanamaz. |
100 (varsayılan değer) Oran Standart (S0) kaynakları için ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın. |
Eşzamanlı istek sınırı - özel uç nokta | 1 Bu sınır ayarlanamaz. |
100 (varsayılan değer) Oran Standart (S0) kaynakları için ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın. |
Gerçek zamanlı darizasyon için maksimum ses uzunluğu. | Yok | Dosya başına 240 dakika |
Hızlı transkripsiyon
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
En büyük ses giriş dosyası boyutu | Yok | 200 MB |
Maksimum ses uzunluğu | Yok | Dosya başına 120 dakika |
Dakika başına en fazla istek sayısı | Yok | 600 |
Toplu transkripsiyon
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Konuşmayı metne dönüştürme REST API sınırı | F0 için kullanılamaz | 10 saniyede 100 istek (dakikada 600 istek) |
Maksimum ses giriş dosyası boyutu | Yok | 1 GB |
Kapsayıcı başına en fazla blob sayısı | Yok | 10000 |
Transkripsiyon isteği başına en fazla dosya sayısı (giriş olarak birden çok içerik URL'sini kullandığınızda). | Yok | 1000 |
Darizasyon etkin transkripsiyonlar için maksimum ses uzunluğu. | Yok | Dosya başına 240 dakika |
Model özelleştirme
Bu tablodaki sınırlar, özel bir konuşma modeli oluşturduğunuzda Konuşma kaynağı başına uygulanır.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
REST API sınırı | 10 saniyede 100 istek (dakikada 600 istek) | 10 saniyede 100 istek (dakikada 600 istek) |
En fazla konuşma veri kümesi sayısı | 2 | 500 |
Veri içeri aktarma için maksimum akustik veri kümesi dosya boyutu | 2 GB | 2 GB |
Veri içeri aktarma için en fazla dil veri kümesi dosya boyutu | 200 MB | 1.5 GB |
Veri içeri aktarma için en fazla söyleniş veri kümesi dosya boyutu | 1 KB | 1 MB |
Models_Create API isteğinde parametresini text kullanırken en büyük metin boyutu |
200 KB | 500 KB |
Kaynak başına metin okuma kotaları ve sınırları
Bu bölümde Konuşma kaynağı başına metin okuma kotaları ve sınırları açıklanmaktadır.
Gerçek zamanlı metin okuma
Konuşma SDK'sı veya Metin okuma REST API'siyle gerçek zamanlı metin kullanarak konuşma yapabilirsiniz. Aksi belirtilmediği sürece sınırlar ayarlanamaz.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Önceden oluşturulmuş sinir sesleri ve özel nöral sesler için zaman aralığı başına işlem sayısı üst sınırı. | 60 saniyede 20 işlem Bu sınır ayarlanamaz. |
Saniyede 200 işlem (TPS) (varsayılan değer) Standart (S0) kaynaklar için hız 1000 TPS'ye kadar ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın. |
İstek başına üretilen maksimum ses uzunluğu | 10 dk | 10 dk |
SSML'de en fazla benzersiz <voice> ve <audio> etiket sayısı |
50 | 50 |
Websocket için dönüş başına en fazla SSML ileti boyutu | 64 KB | 64 KB |
Toplu sentez
Bu sınırlar ayarlanmıyor. Toplu sentez gecikme süresi hakkında daha fazla bilgi için bkz . toplu sentez gecikme süresi ve en iyi yöntemler.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
REST API sınırı | F0 için kullanılamaz | 10 saniyede 100 istek |
Sentez işi oluşturmak için maksimum JSON yükü boyutu | Yok | 2 megabayt |
Eşzamanlı etkin sentez işleri | Yok | Sınırsız |
Sentez işi başına en fazla metin girişi sayısı | Yok | 10000 |
Son durumunda olduğundan bir sentez işi için en fazla yaşam süresi | Yok | 31 güne kadar (özellikler kullanılarak belirtilir) |
Özel sinir sesi - profesyonel
Bu tablodaki sınırlar, profesyonel bir özel sinir sesi modeli oluşturduğunuzda Konuşma kaynağı başına uygulanır.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Saniye başına en fazla işlem sayısı (TPS) | F0 için kullanılamaz | Saniyede 200 işlem (TPS) (varsayılan değer) |
En fazla veri kümesi sayısı | Yok | 500 |
En fazla eşzamanlı veri kümesi yükleme sayısı | Yok | 5 |
Veri kümesi başına veri içeri aktarma için maksimum veri dosyası boyutu | Yok | 2 GB |
Betik olmadan uzun ses veya ses yükleme | YOK | Evet |
En fazla eşzamanlı model eğitimi sayısı | Yok | 4 |
En fazla özel uç nokta sayısı | Yok | 50 |
Özel sinir sesi - kişisel ses
Bu tablodaki sınırlar, kişisel bir ses oluşturduğunuzda Konuşma kaynağı başına uygulanır.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
REST API sınırı (konuşma sentezi dahil değildir) | F0 için kullanılamaz | 10 saniyede 50 istek |
Konuşma sentezi için saniye başına en fazla işlem sayısı (TPS) | F0 için kullanılamaz | Saniyede 200 işlem (TPS) (varsayılan değer) |
Toplu metin okuma avatarı
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
REST API sınırı | F0 için kullanılamaz | 1 dakikada 2 istek |
Gerçek zamanlı metin okuma avatarı
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Dakika başına yeni bağlantılar | F0 için kullanılamaz | Dakikada 2 yeni bağlantı |
Konuşma ile maksimum bağlantı süresi | F0 için kullanılamaz | 20 dakika1 |
Boşta durumuyla maksimum bağlantı süresi | F0 için kullanılamaz | 5 dakika |
1 Gerçek zamanlı avatarın 20 dakikadan uzun süre sürekli çalışmasını sağlamak için otomatik yeniden bağlanmayı etkinleştirebilirsiniz. Otomatik yeniden bağlanmayı ayarlama hakkında bilgi için bu örnek koda ("otomatik yeniden bağlanma" araması yapın) bakın.
Ses İçeriği Oluşturma aracı
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Dosya boyutu (SSML'de düz metin)1 | Dosya başına 3.000 karakter | Dosya başına 20.000 karakter |
Dosya boyutu (sözlük dosyası)2 | Dosya başına 30 KB | Dosya başına 100 KB |
SSML'de faturalanabilir karakterler | Dosya başına 15.000 karakter | Dosya başına 100.000 karakter |
Ses kitaplığına aktar | 1 eşzamanlı görev | Yok |
1 Sınır yalnızca SSML'deki düz metinler için geçerlidir ve etiket içermez.
2 Sözlük dosyasının karakterleri ücretlendirilmiyor. Yalnızca SSML'deki sözlük öğeleri faturalanabilir karakterler olarak sayılır. Daha fazla bilgi edinmek için faturalanabilir karakterlere bakın.
Kaynak başına konuşmacı tanıma kotaları ve sınırları
Konuşmacı tanıma, saniyede 20 işlemle (TPS) sınırlıdır.
Ayrıntılı açıklama, kota ayarlama ve en iyi yöntemler
Konuşma hizmeti kotalarından bazıları ayarlanabilir. Bu bölümde daha fazla açıklama, en iyi yöntem ve ayarlama yönergeleri sağlanmaktadır.
Standart (S0) kaynaklar için aşağıdaki kotalar ayarlanabilir. Ücretsiz (F0) istek sınırları ayarlanmıyor.
- Temel model uç noktası ve özel uç nokta için konuşmayı metne dönüştürme eşzamanlı istek sınırı
- Önceden oluşturulmuş sinir sesleri ve özel nöral sesler için metinden konuşmaya işlem sayısı üst sınırı
- Konuşma çevirisi eşzamanlı istek sınırı
Kota artışı istemeden önce (varsa), geçerli TPS'nizi (saniyedeki işlemler) denetleyin ve kotayı artırmanın gerekli olduğundan emin olun. Konuşma hizmeti, gerekli hesaplama kaynaklarını isteğe bağlı moda getirmek için otomatik ölçeklendirme teknolojilerini kullanır. Konuşma hizmeti aynı zamanda aşırı miktarda donanım kapasitesi korumayarak maliyetlerinizi düşük tutmaya çalışır.
Bir örneğe göz atalım. Uygulamanızın çok fazla istek olduğunu belirten 429 yanıt kodunu aldığını varsayalım. İş yükünüz Kotalar ve sınırlar başvurusu tarafından tanımlanan sınırlar içinde olsa bile uygulamanız bu yanıtı alır. En olası açıklama, Konuşma hizmetinin talebinize göre ölçeği artırması ve henüz gerekli ölçeğe ulaşmamış olmasıdır. Bu nedenle, hizmetin isteği sunmak için hemen yeterli kaynağı yoktur. Bu gibi durumlarda kotanın artırılması yararlı olmaz. Çoğu durumda Konuşma hizmeti yakında ölçeğini genişletecek ve yanıt kodu 429'a neden olan sorun çözülecektir.
Otomatik ölçeklendirme sırasında azaltmayı azaltmak için genel en iyi yöntemler
Azaltmayla ilgili sorunları en aza indirmek için aşağıdaki teknikleri kullanmak iyi bir fikirdir:
- Uygulamanıza yeniden deneme mantığı ekleyin.
- İş yükünde ani değişikliklerden kaçının. İş yükünü kademeli olarak artırın. Örneğin, uygulamanızın metin okuma özelliğini kullandığını ve geçerli iş yükünüzün 5 TPS olduğunu düşünelim. Sonraki saniye, yükü 20 TPS'ye (yani dört kat daha fazla) yükseltin. Konuşma hizmeti yeni yükü yerine getirmek için ölçeği hemen artırmaya başlar, ancak bir saniye içinde gerektiğinde ölçeklendirilemez. İsteklerden bazıları 429 yanıt kodunu (çok fazla istek) alır.
- Farklı yük artışı desenlerini test edin. Daha fazla bilgi için iş yükü deseni örneğine bakın.
- Farklı bölgelerde daha fazla Konuşma hizmeti kaynağı oluşturun ve iş yükünü bunlar arasında dağıtın. (Tüm kaynaklar aynı arka uç kümesi tarafından sunulduğundan, aynı bölgede birden çok Konuşma hizmeti kaynağı oluşturulması performansı etkilemez).
Sonraki bölümlerde kotaları ayarlamayla ilgili belirli durumlar açıklanmaktadır.
Konuşmayı metne dönüştürme: Gerçek zamanlı konuşmayı metne eş zamanlı istek sınırını artırma
Varsayılan olarak, birleştirilen metin ve konuşma çevirisi isteklerine eş zamanlı gerçek zamanlı konuşma sayısı, temel modeldeki kaynak başına 100 ve özel modelde özel uç nokta başına 100 ile sınırlıdır. Standart fiyatlandırma katmanı için bu miktarı artırabilirsiniz. İsteği göndermeden önce, azaltmayı azaltmak için en iyi yöntemler gibi bu makalenin önceki bölümlerinde açıklanan malzemeyi bildiğinizden emin olun.
Not
Temel ve özel modeller için eşzamanlı istek sınırlarının ayrı olarak ayarlanması gerekir. Birçok özel model dağıtımlarını barındıran birçok özel uç noktayla ilişkili bir Konuşma hizmeti kaynağınız olabilir. Gerektiğinde, özel uç nokta başına sınır ayarlamaları ayrı olarak istenmelidir.
Eşzamanlı istek sınırını artırmak maliyetlerinizi doğrudan etkilemez. Konuşma hizmeti, yalnızca kullandığınız kadar ödeme yapılmasını gerektiren bir ödeme modeli kullanır. Sınır, hizmetin isteklerinizi kısıtlamaya başlamadan önce ne kadar yüksek ölçeklendirilebileceğini tanımlar.
Azure portalında, komut satırı araçlarında veya API isteklerinde eşzamanlı istek sınırı parametresinin mevcut değerini göremezsiniz. Mevcut değeri doğrulamak için bir Azure desteği isteği oluşturun.
Not
Konuşma kapsayıcıları , yalnızca barındırıldıkları donanımın CPU'ları tarafından kısıtlandığından eşzamanlı istek sınırının artmasına gerek yoktur. Ancak konuşma kapsayıcılarının dikkate alınması gereken kendi kapasite sınırlamaları vardır. Daha fazla bilgi için bkz. Konuşma kapsayıcıları hakkında SSS.
Gerekli bilgileri hazır bulundurun
- Temel model için:
- Konuşma kaynağı kimliği
- Bölge
- Özel model için:
- Bölge
- Özel uç nokta kimliği
Temel model hakkında bilgi alma:
- Azure portala gidin.
- Eşzamanlılık isteği sınırını artırmak istediğiniz Konuşma hizmeti kaynağını seçin.
- Kaynak Yönetimi grubunda Özellikler'i seçin.
- Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
- Kaynak Kimliği
- Konum (uç nokta bölgeniz)
Özel modelle ilgili bilgi alma:
- Speech Studio portalına gidin.
- Gerekirse oturum açın ve Özel konuşma'ya gidin.
- Projenizi seçin ve Dağıtım'a gidin.
- Gerekli uç noktayı seçin.
- Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
- Hizmet Bölgesi (uç nokta bölgeniz)
- Uç Nokta Kimliği
Destek isteği oluşturma ve gönderme
Kaynağınız için eşzamanlı istekler için sınırın artırılmasını başlatın veya gerekirse bir destek isteği göndererek geçerli sınırı denetleyin. Şunu yapabilirsiniz:
- Önceki bölümde listelenen gerekli bilgilere sahip olduğunuzdan emin olun.
- Azure portala gidin.
- Eşzamanlılık isteği sınırını artırmak (veya denetlemek) istediğiniz Konuşma hizmeti kaynağını seçin.
- Destek + sorun giderme grubunda Yeni destek isteği'ni seçin. Azure aboneliğiniz ve Azure kaynağınızla ilgili otomatik olarak doldurulmuş bilgiler içeren yeni bir pencere görüntülenir.
- Özet'te ne istediğinizi açıklayın (örneğin, "Konuşmayı metin eşzamanlılığı istek sınırını artırma").
- Sorun türü'nde Kota veya Abonelik sorunları'yı seçin.
- Sorun alt türü'nde aşağıdakilerden birini seçin:
- Bir artış isteği için kota veya eşzamanlı istekler artar .
- Mevcut sınırı denetlemek için kota veya kullanım doğrulaması .
- İleri: Çözümler'i seçin. İstek oluşturma işlemine devam edin.
- Ayrıntılar sekmesindeki Açıklama alanına aşağıdakileri girin:
- İsteğin konuşmadan metne kotayla ilgili olduğunu belirten bir not.
- Temel veya özel modeli seçin.
- Daha önce topladığınız Azure kaynak bilgileri.
- Diğer gerekli bilgiler.
- Gözden Geçir + oluştur sekmesinde Oluştur'u seçin.
- Azure portal bildirimlerindeki destek isteği numarasını not alın. İsteğiniz hakkında kısa süre sonra sizinle iletişime geçilir.
İş yükü deseni en iyi uygulaması örneği
İşte iyi bir yaklaşımın genel bir örneği. Yalnızca kendi kullanımınız için gereken şekilde ayarlayabileceğiniz bir şablon olarak tasarlanabilir.
Konuşma hizmeti kaynağının eşzamanlı istek sınırının 300 olarak ayarlandığını varsayalım. İş yükünü 20 eşzamanlı bağlantıdan başlatın ve yükü her 90-120 saniyede bir 20 eşzamanlı bağlantı artırın. Hizmet yanıtlarını denetleyin ve çok fazla istek alırsanız (yanıt kodu 429) geri kalan mantığı uygulayın (yükü azaltır). Ardından yük artışını bir dakika içinde yeniden deneyin ve yine de işe yaramazsa iki dakika içinde yeniden deneyin. Aralıklar için 1-2-4-4 dakikalık bir desen kullanın.
Genel olarak, üretime geçmeden önce iş yükünü ve iş yükü desenlerini test etmek iyi bir fikirdir.
Metin okuma: eşzamanlı istek sınırını artırma
Standart fiyatlandırma katmanı için bu miktarı artırabilirsiniz. İsteği göndermeden önce, azaltmayı azaltmak için en iyi yöntemler gibi bu makalenin önceki bölümlerinde açıklanan malzemeyi bildiğinizden emin olun.
Eşzamanlı istek sınırını artırmak maliyetlerinizi doğrudan etkilemez. Konuşma hizmeti, yalnızca kullandığınız kadar ödeme yapılmasını gerektiren bir ödeme modeli kullanır. Sınır, hizmetin isteklerinizi kısıtlamaya başlamadan önce ne kadar yüksek ölçeklendirilebileceğini tanımlar.
Azure portalında, komut satırı araçlarında veya API isteklerinde eşzamanlı istek sınırı parametresinin mevcut değerini göremezsiniz. Mevcut değeri doğrulamak için bir Azure desteği isteği oluşturun.
Not
Konuşma kapsayıcıları , yalnızca barındırıldıkları donanımın CPU'ları tarafından kısıtlandığından eşzamanlı istek sınırının artmasına gerek yoktur.
Gerekli bilgileri hazırlama
Bir artış isteği oluşturmak için bilgilerinizi sağlamanız gerekir.
- Önceden oluşturulmuş ses için:
- Konuşma kaynağı kimliği
- Bölge
- Özel ses için:
- Dağıtım bölgesi
- Özel uç nokta kimliği
Önceden oluşturulmuş ses hakkında bilgi alma:
- Azure portala gidin.
- Eşzamanlılık isteği sınırını artırmak istediğiniz Konuşma hizmeti kaynağını seçin.
- Kaynak Yönetimi grubunda Özellikler'i seçin.
- Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
- Kaynak Kimliği
- Konum (uç nokta bölgeniz)
Özel ses hakkında bilgi alma:
- Speech Studio portalına gidin.
- Gerekirse oturum açın ve Özel ses'e gidin.
- Projenizi seçin ve Modeli dağıtma'ya gidin.
- Gerekli uç noktayı seçin.
- Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
- Hizmet Bölgesi (uç nokta bölgeniz)
- Uç Nokta Kimliği
Destek isteği oluşturma ve gönderme
Kaynağınız için eşzamanlı istekler için sınırın artırılmasını başlatın veya gerekirse bir destek isteği göndererek geçerli sınırı denetleyin. Şunu yapabilirsiniz:
- Önceki bölümde listelenen gerekli bilgilere sahip olduğunuzdan emin olun.
- Azure portala gidin.
- Eşzamanlılık isteği sınırını artırmak (veya denetlemek) istediğiniz Konuşma hizmeti kaynağını seçin.
- Destek + sorun giderme grubunda Yeni destek isteği'ni seçin. Azure aboneliğiniz ve Azure kaynağınızla ilgili otomatik olarak doldurulmuş bilgiler içeren yeni bir pencere görüntülenir.
- Özet bölümünde ne istediğinizi açıklayın (örneğin, "Metni konuşma eşzamanlılığı istek sınırını artırma").
- Sorun türü'nde Kota veya Abonelik sorunları'yı seçin.
- Sorun alt türü'nde aşağıdakilerden birini seçin:
- Bir artış isteği için kota veya eşzamanlı istekler artar .
- Mevcut sınırı denetlemek için kota veya kullanım doğrulaması .
- Önerilen çözüm sekmesinde İleri'yi seçin.
- Ek ayrıntılar sekmesinde tüm gerekli öğeleri doldurun. Ayrıntılar alanına aşağıdakileri girin:
- İsteğin metin okuma kotası ile ilgili olduğuna dikkat edin.
- Önceden oluşturulmuş sesi veya özel sesi seçin.
- Daha önce topladığınız Azure kaynak bilgileri.
- Diğer gerekli bilgiler.
- Gözden Geçir + oluştur sekmesinde Oluştur'u seçin.
- Azure portal bildirimlerindeki destek isteği numarasını not alın. İsteğiniz hakkında kısa süre sonra sizinle iletişime geçilir.
Metin okuma avatarı: yeni bağlantı sınırını artırma
Metin okuma avatarı için dakikada yeni bağlantı sınırını artırmak için satış temsilcinizle iletişime geçerek aşağıdaki bilgileri içeren bir bilet oluşturun:
- Konuşma kaynağı URI'si
- Yeni sınırlama istendi
- Artış için gerekçe
- Artışın başlangıç tarihi
- Artışın bitiş tarihi
- Önceden oluşturulmuş avatar veya özel avatar