Configurare HTTP in un'attività di copia
Questo articolo illustra come usare l'attività di copia in Azure Data Factory per copiare dati da e in HDFS.
Formato supportato
HTTP supporta i formati di file seguenti. Per impostazioni basate sui formati, fare riferimento ai singoli articoli.
- Formato Avro
- Formato binario
- Formato di testo delimitato
- Formato Excel
- Formato JSON
- Formato ORC
- Formato Parquet
- Formato XML
Configurazione supportata
Per la configurazione di ogni scheda nell'attività di copia, passare rispettivamente alle sezioni seguenti.
Nota
La destinazione non è supportata nel connettore HTTP.
Generali
Fare riferimento alla guida alle impostazioni Generali per configurare la scheda impostazioni Generali.
Origine
Le proprietà seguenti sono supportate per HTTP nella scheda Origine di un'attività di copia.
Le seguenti proprietà sono obbligatorie:
- Tipo di archivio dati: selezionare Esterno.
- Connessione: selezionare una connessione HTTP dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione HTTP selezionando Nuovo.
- Tipo di connessione: selezionare HTTP.
- URL relativo: un URL relativo della risorsa che contiene i dati. Quando questa proprietà non è specificata, viene usato solo l'URL indicato nella definizione del servizio collegato. Il connettore HTTP copia dati dall'URL combinato:
/[relative URL specified]
. - Impostazioni file: selezionare Impostazioni file per configurare il formato di file. Per le impostazioni di formati di file diversi, vedere articoli in Formato supportato per informazioni dettagliate.
Sotto Avanzate, è possibile specificare i campi seguenti:
Metodo richiesta: Metodo della richiesta HTTP. I valori consentiti sono Get (predefinito) e Post.
Intestazioni aggiuntive: intestazioni di richiesta HTTP aggiuntive.
Corpo della richiesta: corpo della richiesta HTTP.
Timeout richiesto: Timeout (valore di TimeSpan) durante il quale la richiesta HTTP attende una risposta. Si tratta del timeout per ottenere una risposta, non per leggere i dati della risposta. Il valore predefinito è 00:01:40.
Connessioni massime simultanee: il limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.
Numero di righe da ignorare: indica il numero di righe non vuote da ignorare durante la lettura dei dati dai file di input.
Colonne aggiuntive: aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima.
Mapping
Per la configurazione della scheda Mapping, passare a Configurare i mapping nella scheda Mapping. Se si sceglie Binary come formato di file, il mapping non sarà supportato.
Impostazione
Per la configurazione della scheda Impostazioni, vedere Configurare le altre impostazioni nella scheda Impostazioni.
Tabella di riepilogo
Nella tabella seguente sono disponibili ulteriori informazioni sull’attività di copia in HTTP.
Origine
Nome | Descrizione | valore | Richiesto | Proprietà script JSON |
---|---|---|---|---|
Tipo di archivio dati | Tipo di archivio dati. | Esterno | Sì | / |
Connessione | Connessione all'archivio dei dati di origine. | <Connessione personale> | Sì | connection |
Tipo di connessione | Origine dati della connessione. | <connessione dell'origine> | Sì | / |
URL relativo | URL relativo della risorsa che contiene i dati. Quando questa proprietà non è specificata, viene usato solo l'URL indicato nella definizione del servizio collegato. Il connettore HTTP copia dati dall'URL combinato: /[relative URL specified] . |
<URL relativo> | No | relativeUrl |
Metodo di richiesta | Metodo HTTP. I valori consentiti sono Get (predefinito) e Post. | •GET •POST |
No | requestMethod |
Intestazioni aggiuntive | Intestazioni richiesta HTTP aggiuntive. | <le tue intestazioni aggiuntive> | No | additionalHeaders |
Testo della richiesta | Corpo della richiesta per la richiesta HTTP. | <Il corpo per la richiesta POST HTTP> | No | requestBody |
Timeout richiesta | Timeout (valore di TimeSpan) durante il quale la richiesta HTTP attende una risposta. Si tratta del timeout per ottenere una risposta, non per leggere i dati della risposta. Il valore predefinito è 00:01:40. | timespan | No | requestTimeout |
Numero massimo di connessioni simultanee | Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. | <Numero massimo di connessioni simultanee> | No | maxConcurrentConnections |
Numero di righe da ignorare | Indica il numero di righe non vuote da ignorare durante la lettura di dati da file di input. | <il tuo numero di righe da ignorare> | No | skipLineCount |
Colonne aggiuntive | Aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima. | • Nome • Valore |
No | additionalColumns: • Nome • Valore |