Los sistemas de visión por ordenador permiten a una máquina «ver» los objetos y su entorno, de forma muy parecida a como lo hace un humano. Las máquinas imitan la percepción visual humana y las habilidades de razonamiento.
La visión por computador es un análisis de imagen o video; crea una inferencia de conocimiento a partir de imágenes digitales o videos. Sin embargo, lo que es trivial para los humanos puede ser extremadamente complicado para las máquinas.
Por ejemplo, identificar un objeto como un coche y otro como una bicicleta es una tarea trivial para un humano que puede extraer de años (literalmente una vida entera) de información de fondo.
Una máquina comienza como una pizarra en blanco y debe ser entrenada para hacer estas distinciones. El entrenamiento hace uso de técnicas de aprendizaje profundo, como se discutió en la sección anterior.
¿Cómo funciona la visión artificial o por computador?
Tres pasos básicos en el proceso de visión por ordenador
Todos los proyectos de CV siguen tres pasos necesarios:
- Adquirir los datos de la imagen
- Las imágenes, incluso los grandes conjuntos, pueden adquirirse en tiempo real a través de vídeo, fotos o tecnología 3D para su análisis.
- Vectorizar la imagen
- Los modelos de aprendizaje profundo automatizan gran parte de este proceso, pero los modelos a menudo son entrenados al ser alimentados primero con miles de imágenes etiquetadas o pre-identificadas.
- Comprender la imagen
- El paso final es el paso interpretativo para identificar o clasificar el objeto.
- Los tipos de visión por ordenador
Todos los casos de uso de los sistemas de visión por computadora pueden desglosarse en subutilidades más pequeñas que se describen a continuación. Muchos proyectos de CV pueden emplear más de uno de estos sub usos:
- La detección de bordes es una técnica utilizada para determinar el borde exterior de un objeto o paisaje para distinguir mejor lo que está en la imagen.
- La segmentación de la imagen divide una imagen en múltiples regiones o piezas que deben ser examinadas por separado.
- La detección de objetos identifica un objeto específico en una imagen. La detección avanzada de objetos reconoce muchos objetos en una sola imagen: un campo de fútbol, un jugador ofensivo, un jugador defensivo, un balón, etc. Estos modelos utilizan una coordenada X, Y para crear un cuadro delimitador e identificar todo lo que está dentro del cuadro.
- La detección de patrones es un proceso de reconocimiento de formas repetidas, colores y otros indicadores visuales en imágenes.
- La clasificación de imágenes agrupa las imágenes en diferentes categorías.
- La coincidencia de características es un tipo de detección de patrones que coincide con las similitudes en las imágenes para ayudar a clasificarlas.
- El reconocimiento facial es un tipo avanzado de detección de objetos que no sólo reconoce un rostro humano en una imagen, sino que identifica a un individuo específico.
Esperamos que esta información sobre los sistemas de visión artificial haya sido de ayuda, para conocer mejor cómo funcionan y en que se pueden utilizar. Recordamos que su aplicación está cada día más arraigada en la creación e inspección de las industrias, y muchos otros sectores de comercio.