Visión por computador básico

Es fascinante como nosotros los humanos podemos interpretar imágenes y cómo las computadoras pueden hacer lo mismo a través de la matemática, hasta lograr cosas maravillosas como detección de peatones, contar, identificar objetos, detecciones faciales, aplicaciones médicas, en la agricultura, procesos de manufactura, calidad, etc.

Iniciemos con Visión por Computador

Un concepto básico que debes aprender cuando realizas visión por computador, es el píxel. A partir de ahí se puede entender cómo se forman las matrices, los canales, las imágenes a color o blanco y negro. También, usando openCV veremos funciones y los modelos matemáticos que esta biblioteca ofrece, como: detección de bordes, umbalización, dibujar contornos, medir objetos, etc.

Iniciemos este viaje revisando el concepto de Píxel y cómo una computadora interpreta las imágenes digitales, a continuación en los siguientes dos posts describo estos temas, usando Python y la biblioteca OpenCV:

Píxeles Un píxel es la unidad más pequeña de una imagen digital. En la siguiente imagen se muestra una porción ...
En este post veremos como funcionan los píxeles, matrices e imágenes con python y openCV. Escribo este post porque inicialmente ...

Podemos obtener información desde una cámara usando openCV y Python, esto es útil para que podamos realizar aplicaciones en tiempo real.

En este post explico como acceder a la webCam, reproducir y guardar un video usando la biblioteca openCV. También puedes ...

Una de las aplicaciones más sencillas que podemos realizar con la biblioteca openCV y que servirá para que te familiarices con Python, es agregar texto a una imagen. Revisa los siguientes posts en donde describo estas funciones:

Añadir texto a una imagen putText En este post añadiremos texto a una imagen con python y openCV. Comprender esto ...
En este post describimos el código para no sobreescribir texto en una imagen. Usaremos el post anterior añadir texto a ...

Podemos unir varias imágenes secuencialmente para crear un video o un GIF, a continuación describo cómo podemos usar Python, openCV e imageio para unir fotogramas:

A veces he querido unir frames como un video para visualizar bases de datos de imágenes o simplemente para hacer ...
Un GIF es un formato de imagen sin sonido y de poca duración que se repite cíclicamente ...

A veces queremos mostrar varios resultados en un solo gráfico, para esto es útil la biblioteca Matplotlib, como se describe en el siguiente post.

En este post revisaremos cómo mostrar imágenes con Matplotlib, openCV y Python. Matplotlib Matplotlib es una biblioteca para crear varios ...

Cuando creamos aplicaciones es importante guardar los resultados, en los siguientes post describo cómo guardar los fotogramas de un video y cómo guardar los fotogramas cada cierto tiempo:

En este post describimos como extraer frames de un video usando python y la biblioteca openCV. El video gato.mp4 tiene ...
En este post detallaré como guardar frames de un video cada cierto tiempo, los almacenaré con el formato de fecha ...

En esta parte veremos aplicaciones propias de visión por computador. Cuando trabajamos con imágenes, una de las primeras cosas que debemos hacer usar imágenes binarias, para eso usamos la umbralización, y para obtener información de las imágenes como su forma usamos el detector de bordes Canny.

La umbralización o thresholding consiste en obtener una representación binaria de una imagen, por medio de la modificación de los ...
Detector de bordes Canny Canny es un reconocido algoritmo de visión por computador para detección de bordes, lleva su nombre ...