IA entrenando IA

Este es el siguiente paso, un paso más allá de lo que podemos desarrollar

Introducción

Las tareas repetitivas, las grandes masas de datos disponibles en aumento, son algunas de las cosas que hicieron posible la adopción ML como una herramienta que construye modelos utilizando datos como experiencia. Sin embargo, para desarrollar modelos predictivos utilizando ML se requieren expertos en el área cuyo salario medio en EEUU es de $141,909 por año[1] y para los que Forbes indica que hay escasez de talento [2], es aquí donde llega AutoML, que le permite crear modelos de ML a no expertos por un tercio del precio. En este artículo exploraremos el verdadero valor comercial del ML, AutoML y las soluciones que cubre.

ML y su valor comercial

En 2016 el ingreso del mercado mundial para Machine learning as a service (MLaaS) fue de $1.07 mil millones, con una duración promedio de proyecto de 12 meses [3]. Además, se proyecto que para el 2025 los ingresos crecerán hasta $20 mil millones[3]

Estas últimas parecen buenas noticias, pero una predicción hecha en 2019 [4] apuntó a que para 2020 el 80% de los proyectos de Inteligencia Artificial (IA) seguirían siendo alquimia, a cargo de magos, cuyos talentos no escalarían en la organización, para 2022, se agrega que solo el 20% de los insights analíticos generarán resultados comerciales. 

AutoML

Automated Machine Learning (AutoML), pone a disposición de no expertos algunos de los métodos y procesos de ML que incluyen las siguientes tareas [5]:

  • Preprocesado y limpieza los datos.

  • Selección y construcción de las características adecuadas.

  • Selección de una familia de modelos adecuada.

  • Optimización de los hiper-parámetros del modelo.

  • Diseño la topología de las redes neuronales (si se utiliza el aprendizaje profundo).

  • Modelos de aprendizaje automático con posprocesamiento.

  • Analizar críticamente los resultados obtenidos.

Para probar la eficiencia de AutoML contra la de un modelo de ML hecho a mano [6] utilizó el popular conjunto de datos de precios de vivienda de Ames disponible en Kaggle. Comparó sus modelos hechos cien por ciento en Python contra los de Microsoft Power Platform - AI Builder, los resultados en la Figura 1.

igura 1. Comparación de ML hecho a mano frente a AI Builder [6].

Sin duda resultados muy similares, aunque en una prueba de generalización el autor observó que el ML hecho a mano era mejor generalizando. 

¿Qué hay de la adopción de AutoML? Bueno, alrededor de 70% a 80% de organizaciones han adoptado AutoML de forma parcial o total [7]. Un estudio hecho en 2020 [7] nos muestra la adopción de esta novedosa forma de hacer ML por tipo de organización y experiencia del equipo de desarrollo, véase en la Figura 2.

Figura 2. Adopción de AutoML por tipo de organización y experiencia del equipo de desarrollo [7]

Soluciones que cubre AutoML

AutoML aparece sobre todo por la falta de expertos en el campo de ML y hoy ya es de cierta manera un amenaza para los mismos expertos. La mayoría de las soluciones de AutoML dependen de un data set listo, se dedican en su mayoría a escoger el mejor modelo. Pero, en realidad la automatización para hoy en día cubre la mayoría de los procesos de aprendizaje supervisado y no supervisado. Estas son las partes que cubre [8]

  • Preparación de datos: limpieza, transformación, normalización de datos.

  • Ingeniería de características: obtención de nuevas características a partir de las existentes cuando tienen sentido, selección de características para incluir en el modelo.

  • Selección de algoritmo: seleccionar el modelo que mejor funciona con los datos disponibles.

  • Optimización de hiper parámetros: ajuste de los hiper parámetros más importantes para cada modelo.

  • Despliegue del modelo: poner en marcha el modelo de mejor rendimiento.

La investigación en aprendizaje automático automatizado es muy diversa y ofrece paquetes y métodos dirigidos tanto a investigadores como a usuarios finales, en la Tabla 1 algunas de las librerías más usadas [9]

Tabla 1. Algunas de las librerías más usadas para AutoML. 

Esto podría parecer todo, pero hay algunas cosas muy importantes que tomarán un poco más de tiempo hasta que se puedan automatizar: entendimiento del problema, planteamiento del caso, path analysis, optimización estocástica/programación lineal, análisis de redes sociales/relaciones, etc. [10]

Así que, aún hay espacio para la automatización y para los expertos más capaces, que las herramientas que ofrece AutoML, herramientas que en sí mismas pueden contener modelos desarrollados con ML. 

Conclusiones 

Peligro a la vista para Machine Learning Engineers junior, pero un futuro prometedor para ML y su adopción en general, con una proyección de crecimiento en ingresos para las organizaciones de 20X para 2025. AutoML se continúa desarrollando para mejorar la automatización de ML a la vez que ofrece servicios cada vez más asequibles, ya hoy es más asequible que un experto en ML en varios campos de desarrollo, aunque quizá no igual de eficiente, pero muy cercano. La adopción se hace cada vez más evidente y hoy un aproximado del 50% de las organizaciones que usan ML han adoptado de forma parcial AutoML.

Referencias

Reply

or to participate.