你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
自定义命名实体识别服务限制
通过本文了解使用自定义 NER 时的数据和服务限制。
语言资源限制
你的语言资源必须在支持的区域之一中创建。
你的资源必须是受支持的定价层之一:
层 说明 限制 F0 免费层 每个订阅只允许使用一个 F0 层语言资源。 S 付费层 每个订阅可以使用无限个语言 S 层资源。 每个资源只能连接 1 个存储帐户。 此进程是不可逆的。 如果将存储帐户连接到资源,以后无法断开链接。 详细了解连接存储帐户
每个资源最多可以有 500 个项目。
在所有自定义功能中,项目名称在同一资源中必须是唯一的。
区域可用性
请参阅语言服务地区可用性。
API 限制
Item | 请求类型 | 最大限制 |
---|---|---|
创作 API | POST | 每分钟 10 个 |
创作 API | GET | 每分钟 100 个 |
预测 API | GET/POST | 每分钟 1,000 个 |
文档大小 | -- | 125,000 个字符。 只要文件不超过 125,000 个字符,最多可以发送 25 个文档 |
提示
如果需要发送的文件的大小超出允许的限制,可将文本拆分成较小的文本块,然后再将其发送到 API。 对于此过程,可以使用 CLUtils 中的区块命令。
配额限制
定价层 | 项 | 限制 |
---|---|---|
F | 定型时间 | 每月 1 小时 |
S | 定型时间 | 无限制,即用即付 |
F | 预测调用 | 每月 5,000 条文本记录 |
S | 预测调用 | 无限制,即用即付 |
文档限制
只能使用
.txt
。 文件。 如果数据采用其他格式,则可以使用 CLUtils 分析命令来打开文档和提取文本。容器中上载的所有文件都必须包含数据。 不允许对空文件进行训练。
所有文件都应在容器的根目录中可用。
数据限制
自定义命名实体识别具有以下限制。
Item | 下限 | 上限 |
---|---|---|
文档计数 | 10 | 100,000 |
文档长度(以字符为单位) | 1 | 128,000 个字符;大约 28,000 字或 56 页。 |
实体类型计数 | 1 | 200 |
实体长度(以字符为单位) | 1 | 500 |
每个项目的经训练模型数 | 0 | 10 |
每个项目的部署数(付费层) | 0 | 10 |
每个项目的部署数(免费层) | 0 | 1 |
命名限制
项 | 限制 |
---|---|
项目名称 | 只能使用字母 (a-z, A-Z) 、数字 (0-9) 和符号 _ . - ,不能有空格。 允许的最大长度是 50 个字符。 |
模型名称 | 只能使用字母 (a-z, A-Z) 、数字 (0-9) 和符号 _ . - 。 允许的最大长度是 50 个字符。 |
部署名称 | 只能使用字母 (a-z, A-Z) 、数字 (0-9) 和符号 _ . - 。 允许的最大长度是 50 个字符。 |
实体名称 | 只能使用字母 (a-z, A-Z) 、数字 (0-9) 以及除“:”以外的所有符号 $ & % * ( ) + ~ # / ? 。 允许的最大长度是 50 个字符。 |
文档名称 | 只能使用字母 (a-z, A-Z) 和数字 (0-9) ,不能有空格。 |