Поддержка языка для пользовательской аналитики текста для работоспособности
Используйте эту статью, чтобы узнать о языках, поддерживаемых в настоящее время пользовательский анализ текста для здоровья.
Параметр многоязычности
С помощью пользовательский анализ текста для здоровья вы можете обучить модель на одном языке и использовать ее для извлечения сущностей из документов других языков. Эта функция позволяет сэкономить на создании отдельных проектов для каждого языка и вместо объединения наборов данных в одном проекте, что упрощает масштабирование проектов на нескольких языках. Вы можете полностью обучить проект с помощью английских документов и запросить его в: французский, немецкий, итальянский и другие. Вы можете включить многоязычный параметр в процессе создания проекта или более поздней версии с помощью параметров проекта.
Вы не должны добавлять одинаковое количество документов для каждого языка. Вы должны создать большую часть проекта на одном языке и добавить лишь несколько документов на тех языках, которые работают не очень хорошо. Если вы создадите проект преимущественно на английском языке и начнете тестировать его на французском, немецком и испанском языках, вы можете заметить, что немецкий язык работает не так хорошо, как два других языка. В этом случае попробуйте добавить 5 % исходных английских документов на немецком языке, обучите новую модель и снова протестируйте на немецком языке. На странице Маркировка данных в Language Studio вы можете выбрать язык добавляемого документа. Вы должны получить лучшие результаты для запросов на немецком языке. Чем больше документов с метками вы добавите, тем больше вероятность того, что результаты станут лучше. Когда вы добавляете данные на другом языке, не стоит опасаться, что они негативно повлияют на остальные языки.
Иврит не поддерживается в многоязычных проектах. Если основной язык проекта является ивритом, вы не сможете добавлять обучающие данные на других языках или запрашивать модель с другими языками. Аналогичным образом, если основной язык проекта не является ивритом, вы не сможете добавлять обучающие данные на иврите или запрашивать модель на иврите.
Поддержка языков
Пользовательские Анализ текста для работоспособности поддерживают .txt
файлы на следующих языках:
Язык | Код языка |
---|---|
Английский | en |
французский | fr |
немецкий | de |
Испанский | es |
Итальянский | it |
Португальский (Португалия) | pt-pt |
Иврит | he |