Analisi del testo
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Questo articolo descrive i moduli di analisi del testo inclusi in Machine Learning Studio (versione classica). Questi moduli forniscono strumenti di calcolo specializzati per l'uso di testo strutturato e non strutturato, tra cui:
- Più opzioni per la pre-elaborazione del testo.
- Rilevamento della lingua.
- Creazione di funzionalità dal testo usando dizionari n grammi personalizzabili.
- Hash delle funzionalità, per analizzare in modo efficiente il testo senza pre-elaborazione o analisi linguistica avanzata.
- Vowpal Wabbit, per machine learning molto veloce sul testo. Vowpal Wabbit supporta l'hashing delle funzionalità, la modellazione di argomenti (LDA) e la classificazione.
- Riconoscimento di entità denominate, per estrarre i nomi di persone, luoghi e organizzazioni da testo non strutturato.
Nota
Si applica a: Machine Learning Studio (versione classica)
Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.
Esempio
Per esempi di analisi del testo Machine Learning, vedere la Azure AI Gallery:
Categorizzazione delle notizie: usa l'hashing delle funzionalità per classificare gli articoli in un elenco predefinito di categorie.
Trovare aziende simili: usa il testo degli articoli di Wikipedia per classificare le aziende.
Classificazione del testo: illustra il processo end-to-end dell'uso del testo dei messaggi di Twitter nell'analisi del sentiment (esempio in cinque parti).
Elenco di moduli
La Analisi del testo in Machine Learning Studio (versione classica) include i moduli seguenti:
- Rileva lingue: rileva la lingua di ogni riga nel file di input.
- Estrai frasi chiave da testo: estrae le frasi chiave dal testo specificato.
- Estrai funzionalità N-Gram da testo: crea le funzionalità del dizionario N-Gram e ne esegue la selezione.
- Hash delle funzionalità: converte i dati di testo in funzionalità con codifica integer usando la libreria Vowpal Wabbit.
- Allocazione latente di Dirichlet: esegue la modellazione di argomenti usando la libreria Vowpal Wabbit per LDA.
- Riconoscimento entità denominata: riconosce le entità denominate in una colonna di testo.
- Pre-elabora testo: esegue operazioni di pulizia sul testo.
- Punteggio vowpal wabbit 7-4 modello: punteggi input da Azure usando la versione 7-4 del sistema di Machine Learning Vowpal Wabbit.
- Punteggio vowpal wabbit 7-10 modello: punteggi input da Azure usando la versione 7-10 del sistema di Machine Learning Vowpal Wabbit.
- Punteggio vowpal Wabbit 8 Model: punteggi input da Azure usando la versione 8 del sistema di Machine Learning Vowpal Wabbit.
- Training del modello Vowpal Wabbit 7-4: consente di training di un modello usando la versione 7-4 del sistema di Machine Learning Vowpal Wabbit.
- Train Vowpal Wabbit 7-10 Model (Train Vowpal Wabbit 7-10 Model): training di un modello usando la versione 7-10 del sistema di Machine Learning Vowpal Wabbit.
- Train Vowpal Wabbit 8 Model (Train Vowpal Wabbit 8 Model): training di un modello usando la versione 8 del sistema di Machine Learning Vowpal Wabbit.