www.revista-fabricacion.com
Mouser News

Entender la IA: entrenamiento

Inteligencia artificial (IA) y aprendizaje automático son términos que se emplean de manera informal para para hacer referencia a la capacidad de una máquina de imitar funciones cognitivas humanas, como la percepción, el razonamiento y la resolución de problemas. Con habilidades similares a las del ser humano para «pensar», la IA asume actualmente diversas tareas en numerosos sectores. Su capacidad de reconocimiento de imágenes facilita el diagnóstico médico y las actividades de vigilancia.

Entender la IA: entrenamiento

El reconocimiento del habla, la traducción, el descubrimiento y el desarrollo de fármacos, y la detección de fraudes financieros también se incluyen entre las competencias de la IA, por citar solo algunos ejemplos de una lista que no deja de aumentar. El crecimiento exponencial del Internet de las cosas (IdC) convertirá a la IA en un elemento fundamental para el funcionamiento de los dispositivos del IdC, incluidos los vehículos autónomos, los robots quirúrgicos y los drones militares.

Inspirado en el cerebro, el aprendizaje profundo es un tipo de aprendizaje automático que transforma las imágenes, la voz o el texto en números, tras lo cual los analiza con varias capas de operaciones matemáticas (de ahí el adjetivo «profundo»). En el proceso, las capas de análisis forman una jerarquía de conceptos o un sistema de «pensamiento» capaz de deconstruir una entrada e identificar las tendencias o los patrones subyacentes. El aprendizaje profundo también difiere del cerebro en muchos aspectos. Por ejemplo, el cerebro tiene diferentes tipos de neuronas y zonas funcionales, mientras que el aprendizaje automático se centra actualmente en categorizar la información con el máximo nivel de precisión.

El proceso de aprendizaje
Al igual que los seres humanos, la IA necesita aprender una tarea para poder realizarla. El cerebro humano aprende de las señales externas para establecer sistemas de pensamiento aplicables a la resolución de problemas con los que todavía no se ha topado. En el ámbito del aprendizaje automático, se trata de un algoritmo, es decir, un proceso para la resolución de problemas o un conjunto de reglas que aprende de los datos y, a continuación, genera modelos (o un conjunto de parámetros, como pesos y sesgos) para permitir que la resolución de futuros problemas sea lo más eficiente y precisa posible. En este artículo, se aborda cómo entrenar a las máquinas para que aprendan automáticamente.
Los diversos tipos de aprendizaje automático se dividen en seis categorías principales:

  •  Supervisado
  •  Por transferencia
  •  No supervisado
  •  Semisupervisado
  •  Por agrupación
  •  Por refuerzo

Aprendizaje supervisado
Cuando un alumno aprende bajo supervisión, el profesor debe asegurarse de que lo hace correctamente y de que su razonamiento es acertado. De igual modo, en el aprendizaje supervisado, un conjunto completo de datos etiquetados con respuestas sirve de base para el aprendizaje del algoritmo, con información continua sobre la exactitud de sus soluciones. El aprendizaje supervisado es útil para tareas que categorizan o estiman las relaciones entre variables (regresión). Entre sus aplicaciones, se incluyen la identificación de actividades sospechosas en los sistemas financieros y el reconocimiento de caras, objetos, voz, gestos o caligrafía.

Las redes neuronales —cada una de las cuales consta de una capa de entrada, una o varias capas intermedias (u «ocultas») y una capa de salida— son un ejemplo de aprendizaje supervisado. Las señales, como las imágenes, los sonidos o los textos, se transforman en números en la capa de entrada y, a continuación, se procesan en las capas intermedias y de salida.

Las redes neuronales convolucionales y recurrentes son las más comunes. Una red neuronal convolucional (CNN, por sus siglas en inglés) extrae características de una señal de entrada, ya sean imágenes o archivos de voz, y conserva la relación espacial entre las características para su análisis ulterior. Las CNN son especialmente eficaces en trabajos de visión artificial, como el reconocimiento facial y del habla. También resultan muy adecuadas para conducir coches autónomos, pues la capacidad de reconocimiento de imágenes de la CNN es fundamental para identificar en su entorno otros vehículos, peatones u obstáculos viales, y para alertar al vehículo autónomo de cualquier posible peligro.

En una red neuronal recurrente (RNN, por sus siglas en inglés), la salida de una capa de procesamiento se devuelve a la misma capa de la que procede, pero como entrada para la corrección. Si la previsión es errónea, el sistema aprenderá por sí mismo y mejorará la predicción la próxima vez. Este tipo de red neuronal es muy eficaz para la conversión de texto en voz. Las RNN se utilizan principalmente para entradas largas con mucho contexto, como oraciones que contengan palabras con doble significado (por ejemplo, «bate» podría referirse a un palo grueso o al presente del verbo batir, dependiendo del contexto) o archivos de audio que contengan diferentes palabras con una misma pronunciación (como «vaca» y «baca»).

Por último, las tareas complejas y a gran escala pueden requerir una red neuronal modular (MNN, por sus siglas en inglés), que consiste en diferentes redes que actúan de forma autónoma para realizar subtareas. Estas redes funcionan de forma independiente, por lo que no se obstaculizan entre sí y permiten aumentar la velocidad de computación total.

Aprendizaje por transferencia
El aprendizaje supervisado requiere un gran conjunto de datos completamente etiquetados. Sin embargo, reunir grandes conjuntos de datos completos para cada aplicación específica plantea un reto y, a menudo, resulta poco práctico. El aprendizaje por transferencia resuelve la escasez de conjuntos de datos completos y específicos mediante la reutilización de las capas de entrada e intermedias de un modelo entrenado con un conjunto de datos (el modelo entrenado previamente), de manera que, en la nueva tarea, solo sea necesario volver a entrenar las capas finales. Los parámetros del modelo entrenado previamente se utilizarán al principio y se ajustarán durante el entrenamiento para lograr la máxima precisión. Además, el hecho de no tener que entrenar todas las capas desde cero permite al aprendizaje por transferencia reducir considerablemente el tiempo total de entrenamiento para cada aplicación específica.

Entender la IA: entrenamiento
Hay muchos modelos entrenados previamente y, entre los más populares, se incluyen el conjunto de datos Mask R-CNN para la segmentación de instancias de objetos, YOLOv2 para la detección de objetos, el modelo VGG-Face para el reconocimiento facial, el modelo Keras VGG-16 para clasificar tomates según su madurez y el conjunto de datos Stanford Car para la clasificación de coches. Aunque el aprendizaje por transferencia resuelve la falta de conjuntos de datos completos y únicos, también presenta algunos inconvenientes, como la necesidad de realizarse lentamente para evitar distorsiones y la limitación de los parámetros preexistentes del conjunto de datos entrenado previamente.

Aprendizaje no supervisado
En el aprendizaje no supervisado, el algoritmo intenta extraer características de un conjunto de datos no etiquetados —que pueden ser ejemplos o señales con varios atributos— para encontrar los patrones subyacentes sin ninguna instrucción explícita. En este sentido, el aprendizaje no supervisado es útil para aquellas tareas que determinan la asociación entre características o atributos mediante la agrupación (clustering). Por ejemplo, comprender las asociaciones puede ayudar a prever qué otros productos podrían gustarle a un cliente sobre la base de sus compras anteriores. El aprendizaje no supervisado puede organizar los datos de forma diferente dependiendo de la pregunta que se formule. Por lo tanto, en el aprendizaje no supervisado, hacer la pregunta correcta o hacerla de la manera correcta es más importante que en otros tipos de aprendizaje.

Entender la IA: entrenamiento
Aprendizaje semisupervisado

En el aprendizaje semisupervisado, el algoritmo se entrena con conjuntos de datos parcialmente etiquetados. Tomemos el caso de la identificación de tumores en tomografías computerizadas o resonancias magnéticas. En este caso, el etiquetado de un pequeño subconjunto de tumores por parte de un radiólogo cualificado mejorará en gran medida la precisión del algoritmo con respecto al trabajo no supervisado, lo que, a su vez, mejorará el diagnóstico.

Aprendizaje por agrupación
En este tipo de aprendizaje, se combinan varios algoritmos para lograr previsiones más precisas que las que se pueden obtener empleando cualquier algoritmo en solitario. Una célebre aplicación de este método tuvo lugar durante el Premio Netflix de 2006, cuando los equipos que participaban recibieron información sobre el modo en que la mitad de los usuarios de un conjunto de datos calificaba un gran número de películas y se les pidió que averiguaran cómo calificaría esas mismas películas la otra mitad de los usuarios. El equipo ganador utilizó el método por agrupación para superar al algoritmo de Netflix.

Aprendizaje por refuerzo
El aprendizaje por refuerzo analiza continuamente las señales de su entorno para calcular cómo lograr que el siguiente paso sea el mejor. Sus aplicaciones son, sobre todo, problemas de control o juegos, como el ajedrez o el go. Por ejemplo, a finales de los años90, el ordenador DeepBlue de IBM utilizó el aprendizaje por refuerzo para enfrentarse al campeón mundial de ajedrez Garri Kaspárov. En2018, AlphaGo utilizó el mismo método para vencer a Lee Sedol, uno de los mejores jugadores de ajedrez.

Aprendizaje automático en la nube en comparación con el del perímetro
Tradicionalmente, el aprendizaje automático para aplicaciones industriales se ha realizado en centros de datos físicos o en la nube virtual, respaldado por capacidad de procesamiento y electricidad suficientes. Sin embargo, con la llegada del IdC, este modelo se enfrenta a una serie de desafíos. Los dispositivos del IdC ubicados en lugares diferentes de la nube central (por lo tanto, en el perímetro o «edge») recopilan continuamente una gran cantidad de datos. Transferir estos datos a la nube central para fines de aprendizaje y, a continuación, volver a desplegarlos en el perímetro no solo resulta caro, sino que, además, requiere mucho tiempo.

El desfase temporal asociado hará imposibles las operaciones que requieran la toma de decisiones (o la inferencia) en tiempo real, como en los vehículos autónomos o los drones militares. Además, la transferencia de datos puede suponer una amenaza para la seguridad y la integridad de dichos datos.

Una forma de resolver este problema es realizar el aprendizaje automático en el perímetro. Sin embargo, este modelo también presenta inconvenientes. Por ejemplo, los dispositivos del IdC suelen alimentarse con pequeñas baterías e instalarse en lugares en los que puede resultar difícil (e incluso imposible) la recarga, por lo que el suministro de energía plantea un problema. Además, la potencia de procesamiento que ofrecen los dispositivos del IdC puede ser insuficiente para llevar a cabo el aprendizaje automático. Por ello, se debe mejorar el hardware para lograr que el aprendizaje automático tenga lugar en el perímetro. En la segunda parte de esta serie abordaremos los requisitos de hardware para el aprendizaje automático industrial y en el perímetro del IdC.

www.mouser.es




Entender la IA: entrenamiento

Mark Patrick ~

Technical Marketing Manager
EMEA Marketing


As Mouser Electronics’ Technical Marketing Manager for EMEA, Mark Patrick is responsible for the creation and circulation of technical content within the region — content that is key to Mouser’s strategy to support, inform and inspire its engineering audience.

Prior to leading the Technical Marketing team, Patrick was part of the EMEA Supplier Marketing team and played a vital role in establishing and developing relationships with key manufacturing partners.
In addition to a variety of technical and marketing positions, Patrick’s previous roles include eight years at Texas Instruments in Applications Support and Technical Sales.

A “hands-on” engineer at heart, with a passion for vintage synthesizers and motorcycles, he thinks nothing of carrying out repairs on either. Patrick holds a first class Honours Degree in Electronics Engineering from Coventry University.

  Solicite más información…

LinkedIn
Pinterest

Únete a los más de 155,000 seguidores de IMP