Desarrollo local con Visual Studio Code

Completado

Para asegurarse de que un modelo sigue siendo relevante, es posible que tenga que editar cualquiera de los recursos de un proyecto de aprendizaje automático.

Por ejemplo, es posible que tenga que volver a entrenar un modelo con un conjunto de datos de entrenamiento mejorado. O puede que tenga que mejorar el modelo eligiendo otros valores de hiperparámetros mientras se entrena.

Como científico de datos, siempre que quiera volver a desarrollar y mejorar el modelo, deberá asegurarse de que el modelo en producción permanece intacto. Por lo tanto, al almacenar todo el código relevante para el proyecto de aprendizaje automático en un repositorio de Git, es conveniente crear una rama para el desarrollo que aísle el trabajo.

Para trabajar en la rama, puede clonar la rama en el IDE que prefiera. Aprenderá a clonar el código y desarrollar localmente con Visual Studio Code.

Visual Studio Code

Tanto si trabaja con Azure Repos como con GitHub, trabajará con repositorios basados en Git. Puede editar código dentro de Azure Repos o GitHub, pero se recomienda clonar el repositorio y trabajar en un IDE. Un IDE que se usa normalmente es Visual Studio Code.

Una de las ventajas de usar Visual Studio Code es que tiene una extensión para Azure Machine Learning, lo que le permite ejecutar el código en instancias de proceso de Azure Machine Learning y clústeres de Visual Studio Code. También puede optar por ejecutar el código con el dispositivo local. Sin embargo, algunas cargas de trabajo de aprendizaje automático, como los modelos de Computer Vision, requerirán más capacidad de proceso.

Cuando quiera desarrollar el código localmente, seguirá un proceso de desarrollo típico al trabajar con repositorios de Git. El repositorio completo se almacena en línea, en una herramienta como Azure Repos o GitHub.

Sugerencia

Para trabajar en repositorios de Git localmente, descargue Git para Windows, Linux o macOS.

Proceso de desarrollo

Después de instalar Visual Studio Code y Git, puede trabajar en una rama del repositorio localmente. Para trabajar con un repositorio de Git, tendrá que usar algunos comandos comunes de Git.

Diagrama del proceso de desarrollo de Git con clonación e inserción.

Supongamos que el repositorio completo se almacena en Azure DevOps o GitHub y ha creado una rama del repositorio principal en una de las dos herramientas.

Para obtener la dirección URL del repositorio, vaya al nivel superior del repositorio y seleccione Clonar en Azure Repos o Código en GitHub. Copie la dirección URL HTTPS.

Captura de pantalla del repositorio de Git con el botón para clonar código.

Después de abrir Visual Studio Code, hay dos maneras de trabajar con Git:

  • Usar la paleta de comandos (CTRL+MAYÚS+P) para un enfoque más fácil de usar.
  • Usar comandos git en el terminal integrado (CTRL+MAYÚS+`) para una experiencia de línea de comandos.

Nota

Para trabajar con un repositorio de Git almacenado en Azure DevOps, inicie sesión con una cuenta de Azure que tenga acceso al repositorio. Para trabajar con GitHub, deberá proporcionar el nombre de usuario y el correo electrónico con el comando git config.

Clonar

Para obtener una copia local, tendrá que clonar el repositorio en el dispositivo mediante la dirección URL del repositorio.

Captura de pantalla del clon de Git en la paleta de comandos de Visual Studio Code.

También puede usar el comando git clone en el terminal integrado.

Captura de pantalla del clon de Git en el terminal de Visual Studio Code.

Se almacenará una copia local del código en el dispositivo. Elija dónde desea almacenar el clon y espere hasta que se hayan copiado todos los archivos. Cuando esté listo, se le pedirá que vaya directamente al repositorio recién copiado. Como alternativa, puede abrir la carpeta local en Visual Studio Code para abrir la copia local.

Nota

Si ha creado una rama, compruebe que está trabajando actualmente en la rama y no en el repositorio principal. Puede cambiar entre las ramas con el comando git checkout.

Commit

Una vez que haya clonado el repositorio para Visual Studio Code, puede editar el código. Después de modificar un archivo y guardarlo, deberá confirmar el cambio.

En Visual Studio Code, puede abrir la pestaña Control de código fuente para ver todos los cambios realizados hasta ahora.

Captura de pantalla de la información general del control de código fuente de los cambios en Visual Studio Code.

Puede confirmar un cambio realizado en un archivo, como un script de Python, mediante la opción Git: Confirmar en la paleta de comandos o mediante el comando git commit.

Para cada confirmación, agregará un mensaje para aclarar lo que ha cambiado. En general, es mejor confirmar pequeños cambios y hacerlo con frecuencia. Al escribir mensajes claros de confirmación, le resultará más fácil que el equipo comprenda su trabajo.

Inserción

Una vez realizados todos los cambios y confirmados. Puede insertar todas las confirmaciones. Al insertar todas las confirmaciones, actualizará el repositorio almacenado en Azure Repos o GitHub para que sea idéntico a la copia local.

Puede insertar todas las confirmaciones con la opción Git: Inserción en la paleta de comandos o el comando git push en el terminal.

Como alternativa, también puede insertar cambios mediante el panel Control de código fuente. En Control de código fuente, también obtendrá información general sobre cuántas confirmaciones se insertarán en el repositorio.

Captura de pantalla del envío de cambios en el panel de control de código fuente en Visual Studio Code.

Lo ideal es comprobar el código antes de insertarlo en el repositorio. Para comprobar las cargas de trabajo de aprendizaje automático, se recomienda realizar pruebas unitarias y linting localmente.

Nota

Si otra persona ha realizado un cambio en el repositorio mientras ha estado trabajando en línea, puede extraer esos cambios en la copia local sin perder sus cambios y confirmaciones. Git comprobará si hay conflictos por usted.