¿Por qué es tan importante entender los MLOps?

Resumen

Describe tu problema

El dolor de Lorem Lipsum lo dice todo. Las uñas se encuentran en diferentes lugares del Egeo. Lorem admite que Enim Mauris quam curriculum tempor purus adipiscing.

Concertar una cita

¿Ha estado trabajando en una prueba de concepto utilizando una canalización de aprendizaje automático que se está ampliando? Enhorabuena, has hecho un trabajo maravilloso: ¡solo 13% Del proyecto de ciencia de datos ¡realmente llegue a la producción!

Ahora se le hacen muchas preguntas, como: ¿cómo piensa poner el modelo en producción? ¿Cómo se asegura su equipo de que el modelo siga siendo lo suficientemente preciso? ¿Cómo pueden las operaciones explicar las predicciones del modelo? ¿Qué pasa con el cumplimiento y la gobernanza de los modelos?

Las operaciones de aprendizaje automático (también llamadas MLOps) son la respuesta a todo eso. Intentemos entender cómo estos llamados MLOP pueden ayudarnos a ejecutar con éxito la IA.

Por Jamila REJEB, científico de datos en LittleBigCode

¿Los MLOP son una nueva tendencia?

Probablemente hayas oído hablar de DevOps, que es un movimiento que tiene como objetivo conciliar dos profesiones: el desarrollador de software (dev), por un lado, y el administrador de sistemas y arquitectura (ops), por otro. Sin embargo, mLOps es un concepto mucho más nuevo. De hecho, si buscas MLOps en Google Trends, verás que se trata de una disciplina relativamente nueva.

A medida que más y más empresas recurren a los modelos de aprendizaje automático para obtener información, las organizaciones intentan integrar los sistemas de aprendizaje automático en sus productos y plataformas.

Por lo tanto, el proceso de operación del aprendizaje automático debe ser tan limitado como la tarea de ejecutar los sistemas de TI.

¿Qué es MLOps?

MLOps significa Operaciones de aprendizaje automático. Al igual que DevOps, mLOps nace para optimice, acelere y asegure el ciclo de vida de la producción.

mLOps no es un perfil de trabajo, pero Una metodología o un conjunto de mejores prácticas Que apunta a Implemente y mantenga Modelos de aprendizaje automático en producción Eficaz y eficientemente. ¿Cómo? Trabajando a través de la lente del interés organizacional con una dirección clara y puntos de referencia mensurables.

Al igual que DevOps acorta los ciclos de vida de la producción al mejorar los productos con cada iteración, MLOps genera información en la que puede confiar y actuar con mayor rapidez.

MLOps, DevOps, DataOps: ¿cuál es la diferencia?

Tanto DevOps como MLOps tienen como objetivo colocar una pieza de software en un flujo de trabajo repetible y tolerante a errores, mientras que mLOps agrega un componente de aprendizaje automático a ese software.

Sin embargo, MLOps en última instancia tiene Unos cuantos matices más para cada componente del flujo de trabajo que difiera del DevOps tradicional, como el etiquetado de datos, la transformación de datos, la ingeniería de funciones y el proceso de selección de algoritmos.

Fuente: mLOps vs DevOps: ¿Cuál es la diferencia? PHDATA.IO

DataOps Es una práctica colaborativa de gestión de datos centrada en mejorar la comunicación, la integración y la automatización de Flujos de datos entre empresas de datos (ingenieros de datos) y consumidores de datos (científicos de datos, analistas de negocios).

La promesa de DataOps es Mejore y optimice el ciclo de vida de los proyectos de datos y análisis En términos de velocidad y calidad. Al igual que DevOps, DataOps vuelve a centrar sus proyectos en la colaboración.

¿Por qué necesitamos MLOps?

Motocicleta Moops: Optimizar, Acelera Y Segura El ciclo de vida de un proyecto de aprendizaje automático.

Este conjunto de mejores prácticas le ayudará a Control de versiones: código, datos, modelos... Pruebas y validación En caso de una desviación de datos, o para establecer el valor de la solución (pruebas A/B) y garantizar la estabilidad de la solución mediante pruebas unitarias, por ejemplo. También nos ayudará con Monitorización Y Alertar mediante la comprensión de los modelos mediante la interpretabilidad y la visualización de métricas en tiempo real. Además, MLOps se usa ampliamente para Automatización y orquestación Propósitos gracias a las canalizaciones de CI/CD y a la orquestación de DAG. Incluso podríamos añadir cosas como Seguridad de datos y privacidad y control presupuestario.

De hecho, dentro de nuestro equipo de ciencia de datos, las herramientas y prácticas de MLOps nos ayudan en cada paso de un proyecto de aprendizaje automático. Empezar por registrar todos los experimentos en un panel completo facilita la comparación y la elección del mejor modelo para un conjunto de métricas que definimos para automatizar su implementación en producción y garantizar que se realicen las pruebas necesarias. Pero, ¿qué sucede si necesitamos versionar este modelo o los datos con los que se ha entrenado? Los MLOps también pueden ayudar con eso. Además, hemos podido realizar un seguimiento sencillo del rendimiento del modelo y recibir alertas en caso de que se produzca una desviación. En pocas palabras, el uso de este conjunto de prácticas nos ayuda a organizar mejor nuestro proyecto de aprendizaje automático y a comunicarnos más fácilmente.

Como una imagen es más que mil palabras, aquí hay un gráfico que intenta resumir mejor los conceptos abordados anteriormente.

De una manera más práctica, MLOps te ayudará a responder las siguientes preguntas:

¿Cómo puedo recibir una notificación lo antes posible cada vez que cambien mis distribuciones de datos? Las cosas evolucionan con el tiempo, y sus datos también. Por poner solo un ejemplo, si clasifica el texto mediante un modelo supervisado y comienza a recibir datos en un idioma nuevo a menos que detecte este cambio en la distribución de los datos, no podrá tener en cuenta esta nueva necesidad y actualizar el modelo en consecuencia.
¿Cómo puedo hacer un seguimiento de mis experimentos? El ciclo de vida de un proyecto de aprendizaje automático implica varias fases de experimentación e iteraciones, como probar varios modelos, seleccionar varias funciones, ajustar los hiperparámetros... Almacenar los resultados en archivos simples de hojas de Excel se convertirá rápidamente en algo tedioso. Afortunadamente, hoy en día existen numerosas soluciones para rastrear y visualizar estos experimentos.
¿Cómo puedo implementar fácilmente mi modelo en producción? Una vez que su proyecto de aprendizaje automático esté aprobado para ser utilizado por la empresa que debe elegir, ¿cómo utilizarán las operaciones sus predicciones? Una solución común sería exponer estas predicciones mediante una API. Algunas soluciones que analizaremos en la siguiente sección tienen como objetivo facilitar la implementación y reducir los retrasos.
¿Cómo puedo asegurarme de que mis modelos siguen siendo precisos? Un deterioro del rendimiento de los modelos puede socavar la confianza de los consumidores e introducir riesgos para la empresa. Por lo tanto, necesitamos monitorear continuamente el comportamiento del modelo y probar sus predicciones. Cuanto más rápido detecte un posible problema, más rápido podrá solucionarlo.
¿Cómo puedo gestionar el ciclo de vida de todos los modelos de producción? Es probable que los modelos cambien con el tiempo. Necesitamos poder volver a entrenar fácilmente un modelo y actualizarlo durante la producción o incluso planificar un readiestramiento automático con un mínimo esfuerzo. También deberíamos poder gestionar fácilmente varias versiones de modelos en producción.
¿Cómo podemos explicar las predicciones? En algunos casos, las operaciones deben explicar las predicciones del modelo. Según el modelo que se utilice, una serie de herramientas pueden ayudar a aclarar su comportamiento a fin de aumentar la confianza en la IA.

¿Qué herramienta se puede utilizar?

Se han desarrollado numerosos métodos en un intento de abarcar todo lo descrito anteriormente. De hecho, al realizar la búsqueda había demasiados como para incluirlos, por lo que decidimos enumerar los más comunes. Cada herramienta tiene sus funcionalidades. Nuestro objetivo es obtener un punto de referencia general de lo que logra cada herramienta. En el próximo artículo profundizaremos en una comparación más exhaustiva.

Conclusión

El MLOps es, sin duda, un concepto novedoso, pero está bien justificado. Proporciona a las organizaciones un marco claro para implementar y supervisar de manera más eficaz los proyectos de aprendizaje automático, a fin de volver a poner el interés empresarial en el primer plano de sus operaciones de aprendizaje automático. Con estos conjuntos de herramientas y prácticas recomendadas, resulta más fácil para los científicos de datos, los ingenieros de datos, los ingenieros de software y las operaciones trabajar y comunicarse de manera eficiente.