Condividi tramite


Configurare HTTP in un'attività di copia

Questo articolo illustra come usare l'attività di copia in Azure Data Factory per copiare dati da e in HDFS.

Formato supportato

HTTP supporta i formati di file seguenti. Per impostazioni basate sui formati, fare riferimento ai singoli articoli.

Configurazione supportata

Per la configurazione di ogni scheda nell'attività di copia, passare rispettivamente alle sezioni seguenti.

Nota

La destinazione non è supportata nel connettore HTTP.

Generali

Fare riferimento alla guida alle impostazioni Generali per configurare la scheda impostazioni Generali.

Origine

Le proprietà seguenti sono supportate per HTTP nella scheda Origine di un'attività di copia.

Screenshot che mostra la scheda origine e l'elenco delle proprietà.

Le seguenti proprietà sono obbligatorie:

  • Tipo di archivio dati: selezionare Esterno.
  • Connessione: selezionare una connessione HTTP dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione HTTP selezionando Nuovo.
  • Tipo di connessione: selezionare HTTP.
  • URL relativo: un URL relativo della risorsa che contiene i dati. Quando questa proprietà non è specificata, viene usato solo l'URL indicato nella definizione del servizio collegato. Il connettore HTTP copia dati dall'URL combinato: /[relative URL specified].
  • Impostazioni file: selezionare Impostazioni file per configurare il formato di file. Per le impostazioni di formati di file diversi, vedere articoli in Formato supportato per informazioni dettagliate.

Sotto Avanzate, è possibile specificare i campi seguenti:

  • Metodo richiesta: Metodo della richiesta HTTP. I valori consentiti sono Get (predefinito) e Post.

  • Intestazioni aggiuntive: intestazioni di richiesta HTTP aggiuntive.

  • Corpo della richiesta: corpo della richiesta HTTP.

  • Timeout richiesto: Timeout (valore di TimeSpan) durante il quale la richiesta HTTP attende una risposta. Si tratta del timeout per ottenere una risposta, non per leggere i dati della risposta. Il valore predefinito è 00:01:40.

  • Connessioni massime simultanee: il limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.

  • Numero di righe da ignorare: indica il numero di righe non vuote da ignorare durante la lettura dei dati dai file di input.

  • Colonne aggiuntive: aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima.

    Screenshot che mostra colonne aggiuntive.

Mapping

Per la configurazione della scheda Mapping, passare a Configurare i mapping nella scheda Mapping. Se si sceglie Binary come formato di file, il mapping non sarà supportato.

Impostazione

Per la configurazione della scheda Impostazioni, vedere Configurare le altre impostazioni nella scheda Impostazioni.

Tabella di riepilogo

Nella tabella seguente sono disponibili ulteriori informazioni sull’attività di copia in HTTP.

Origine

Nome Descrizione valore Richiesto Proprietà script JSON
Tipo di archivio dati Tipo di archivio dati. Esterno /
Connessione Connessione all'archivio dei dati di origine. <Connessione personale> connection
Tipo di connessione Origine dati della connessione. <connessione dell'origine> /
URL relativo URL relativo della risorsa che contiene i dati. Quando questa proprietà non è specificata, viene usato solo l'URL indicato nella definizione del servizio collegato. Il connettore HTTP copia dati dall'URL combinato: /[relative URL specified]. <URL relativo> No relativeUrl
Metodo di richiesta Metodo HTTP. I valori consentiti sono Get (predefinito) e Post. GET
POST
No requestMethod
Intestazioni aggiuntive Intestazioni richiesta HTTP aggiuntive. <le tue intestazioni aggiuntive> No additionalHeaders
Testo della richiesta Corpo della richiesta per la richiesta HTTP. <Il corpo per la richiesta POST HTTP> No requestBody
Timeout richiesta Timeout (valore di TimeSpan) durante il quale la richiesta HTTP attende una risposta. Si tratta del timeout per ottenere una risposta, non per leggere i dati della risposta. Il valore predefinito è 00:01:40. timespan No requestTimeout
Numero massimo di connessioni simultanee Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. <Numero massimo di connessioni simultanee> No maxConcurrentConnections
Numero di righe da ignorare Indica il numero di righe non vuote da ignorare durante la lettura di dati da file di input. <il tuo numero di righe da ignorare> No skipLineCount
Colonne aggiuntive Aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima. • Nome
• Valore
No additionalColumns:
• Nome
• Valore