Freigeben über


Sprachunterstützung für Stimmungsanalyse und Opinion Mining

In diesem Artikel erfahren Sie, welche natürlichen Sprachen von Stimmungsanalyse und Opinion Mining unterstützt werden. Sowohl die cloudbasierte API als auch Docker-Container unterstützen dieselben Sprachen.

Sprachunterstützung für Stimmungsanalyse

Gesamtzahl der unterstützten Sprachcodes: 94

Sprache Sprachcode Hinweise
Afrikaans af
Albanisch sq
Amharisch am
Arabisch ar
Armenisch hy
Assamesisch as
Aserbaidschanisch az
Baskisch eu
Belarussisch (neu) be
Bengali bn
Bosnisch bs
Bretonisch (neu) br
Bulgarisch bg
Birmanisch my
Katalanisch ca
Chinesisch (vereinfacht) zh-hans zh wird ebenfalls akzeptiert.
Chinesisch (traditionell) zh-hant
Kroatisch hr
Tschechisch cs
Dänisch da
Niederländisch nl
Englisch en
Esperanto (neu) eo
Estnisch et
Filipino fil
Finnisch fi
Französisch fr
Galizisch gl
Georgisch ka
Deutsch de
Griechisch el
Gujarati gu
Hausa (neu) ha
Hebräisch he
Hindi hi
Ungarisch hu
Indonesisch id
Irisch ga
Italienisch it
Japanisch ja
Javanisch (neu) jv
Kannada kn
Kasachisch kk
Khmer km
Koreanisch ko
Kurdisch (Kurmanji) ku
Kirgisisch ky
Laotisch lo
Lateinisch (neu) la
Lettisch lv
Litauisch lt
Mazedonisch mk
Madagassisch mg
Malaiisch ms
Malayalam ml
Marathi mr
Mongolisch mn
Nepalesisch ne
Norwegisch no
Odia or
Oromo (neu) om
Paschtu ps
Persisch fa
Polnisch pl
Portugiesisch (Portugal) pt-PT pt wird ebenfalls akzeptiert.
Portugiesisch (Brasilien) pt-BR
Pandschabi pa
Rumänisch ro
Russisch ru
Sanskrit (neu) sa
Schottisches Gälisch (neu) gd
Serbisch sr
Sindhi (neu) sd
Sinhala (neu) si
Slowakisch sk
Slowenisch sl
Somali so
Spanisch es
Sundanesisch (neu) su
Suaheli sw
Schwedisch sv
Tamilisch ta
Telugu te
Thailändisch th
Türkisch tr
Ukrainisch uk
Urdu ur
Uigurisch ug
Usbekisch uz
Vietnamesisch vi
Walisisch cy
Westfriesisch (neu) fy
Xhosa (neu) xh
Jiddisch (neu) yi

Sprachunterstützung für Opinion Mining

Gesamtzahl der unterstützten Sprachcodes: 94

Sprache Sprachcode Hinweise
Afrikaans (neu) af
Albanisch (neu) sq
Amharisch (neu) am
Arabisch ar
Armenisch (neu) hy
Assamesisch (neu) as
Aserbaidschanisch (neu) az
Baskisch (neu) eu
Belarussisch (neu) be
Bengali bn
Bosnisch (neu) bs
Bretonisch (neu) br
Bulgarisch (neu) bg
Birmanisch (neu) my
Katalanisch (neu) ca
Chinesisch (vereinfacht) zh-hans zh wird ebenfalls akzeptiert.
Chinesisch (traditionell) (neu) zh-hant
Kroatisch (neu) hr
Tschechisch (neu) cs
Dänisch da
Niederländisch nl
Englisch en
Esperanto (neu) eo
Estnisch (neu) et
Filipino (neu) fil
Finnisch fi
Französisch fr
Galizisch (neu) gl
Georgisch (neu) ka
Deutsch de
Griechisch el
Gujarati (neu) gu
Hausa (neu) ha
Hebräisch (neu) he
Hindi hi
Ungarisch hu
Indonesisch id
Irisch (neu) ga
Italienisch it
Japanisch ja
Javanisch (neu) jv
Kannada (neu) kn
Kasachisch (neu) kk
Khmer (neu) km
Koreanisch ko
Kurdisch (Kurmanji) ku
Kirgisisch (neu) ky
Lao (neu) lo
Lateinisch (neu) la
Lettisch (neu) lv
Litauisch (neu) lt
Mazedonisch (neu) mk
Madagassisch (neu) mg
Malaiisch (neu) ms
Malayalam (neu) ml
Marathi mr
Mongolisch (neu) mn
Nepalesisch (neu) ne
Norwegisch no
Odia (neu) or
Oromo (neu) om
Paschtu (neu) ps
Persisch (neu) fa
Polnisch pl
Portugiesisch (Portugal) pt-PT pt wird ebenfalls akzeptiert.
Portugiesisch (Brasilien) pt-BR
Punjabi (neu) pa
Rumänisch (neu) ro
Russisch ru
Sanskrit (neu) sa
Schottisches Gälisch (neu) gd
Serbisch (neu) sr
Sindhi (neu) sd
Sinhala (neu) si
Slowakisch (neu) sk
Slowenisch (neu) sl
Somali (neu) so
Spanisch es
Sundanesisch (neu) su
Suaheli (neu) sw
Schwedisch sv
Tamilisch ta
Telugu te
Thailändisch (neu) th
Türkisch tr
Ukrainisch (neu) uk
Urdu (neu) ur
Uigurisch (neu) ug
Usbekisch (neu) uz
Vietnamesisch (neu) vi
Walisisch (neu) cy
Westfriesisch (neu) fy
Xhosa (neu) xh
Jiddisch (neu) yi

Mehrsprachige Option (nur benutzerdefinierte Stimmungsanalyse)

Mit der benutzerdefinierten Stimmungsanalyse können Sie ein Modell in einer Sprache trainieren und Dokumente in einer anderen Sprache klassifizieren. Dieses Feature ist nützlich, da Sie damit Zeit und Aufwand sparen. Anstelle separate Projekte für jede Sprache erstellen zu müssen, können Sie ein mehrsprachiges Dataset in einem Projekt verwenden. Ihr Dataset muss nicht vollständig in einer Sprache sein, Sie sollten jedoch während der Erstellung die Option für mehrere Sprachen für Ihr Projekt aktivieren oder dies später in den Projekteinstellungen nachholen. Wenn Sie während des Auswertungsprozesses feststellen, dass Ihr Modell in bestimmten Sprachen eine schlechte Leistung aufweist, sollten Sie Ihrem Trainingssatz weitere Daten in den betreffenden Sprachen hinzufügen.

Sie können Ihr Projekt vollständig mit englischen Dokumenten trainieren und es dann in folgenden Sprachen abfragen: Französisch, Deutsch, Mandarin, Japanisch, Koreanisch und weiteren. Mithilfe der benutzerdefinierten Stimmungsanalyse können Sie Ihre Projekte auf einfache Weise auf mehrere Sprachen skalieren, indem Sie Mehrsprachentechnologie zum Trainieren Ihrer Modelle verwenden.

Wenn Sie feststellen, dass eine bestimmte Sprache nicht so gut funktioniert wie andere Sprachen, können Sie Ihrem Projekt weitere Dokumente für diese Sprache hinzufügen.

Sie müssen nicht für jede Sprache dieselbe Anzahl an Dokumenten hinzufügen. Sie sollten den Großteil Ihres Projekts in einer Sprache erstellen und nur wenige Dokumente in Sprachen hinzufügen, für die Sie eine nicht zufrieden stellende Leistung beobachten. Wenn Sie ein Projekt erstellen, das hauptsächlich englisch ist, und damit beginnen, es in Französisch, Deutsch und Spanisch zu testen, stellen Sie möglicherweise fest, dass Deutsch nicht so gut funktioniert wie die anderen beiden Sprachen. Ziehen Sie in diesem Fall in Betracht, 5 % Ihrer ursprünglichen englischen Dokumente auf Deutsch hinzuzufügen, ein neues Modell zu trainieren und es erneut auf Deutsch zu testen. Für deutsche Abfragen sollten dann bessere Ergebnisse erzielt werden. Je mehr beschriftete Dokumente Sie hinzufügen, desto größer ist die Wahrscheinlichkeit, dass die Ergebnisse besser werden.

Wenn Sie Daten in einer weiteren Sprache hinzufügen, brauchen Sie in der Regel nicht mit negativen Auswirkungen auf die anderen Sprachen zu rechnen.

Nächste Schritte