Aprende los conceptos de visión por computador. Usaremos Python y varias bibliotecas como: openCV, MatplotLib, imageio, tensorflow, etc.
Revisa conmigo los tutoriales en el blog, Youtube, accede a los códigos en GitHub y comenta tus dudas y sugerencias.
Es fascinante como nosotros los humanos podemos interpretar imágenes y cómo las computadoras pueden hacer lo mismo a través de la matemática, hasta lograr cosas maravillosas como detección de peatones, contar, identificar objetos, detecciones faciales, aplicaciones médicas, en la agricultura, procesos de manufactura, calidad, etc.
Iniciemos con Visión por Computador
Un concepto básico que debes aprender cuando realizas visión por computador, es el píxel. A partir de ahí se puede entender cómo se forman las matrices, los canales, las imágenes a color o blanco y negro. También, usando openCV veremos funciones y los modelos matemáticos que esta biblioteca ofrece, como: detección de bordes, umbalización, dibujar contornos, medir objetos, etc.
Iniciemos este viaje revisando el concepto de Píxel y cómo una computadora interpreta las imágenes digitales, a continuación en los siguientes dos posts describo estos temas, usando Python y la biblioteca OpenCV:
Podemos obtener información desde una cámara usando openCV y Python, esto es útil para que podamos realizar aplicaciones en tiempo real.
Una de las aplicaciones más sencillas que podemos realizar con la biblioteca openCV y que servirá para que te familiarices con Python, es agregar texto a una imagen. Revisa los siguientes posts en donde describo estas funciones:
Podemos unir varias imágenes secuencialmente para crear un video o un GIF, a continuación describo cómo podemos usar Python, openCV e imageio para unir fotogramas:
A veces queremos mostrar varios resultados en un solo gráfico, para esto es útil la biblioteca Matplotlib, como se describe en el siguiente post.
Cuando creamos aplicaciones es importante guardar los resultados, en los siguientes post describo cómo guardar los fotogramas de un video y cómo guardar los fotogramas cada cierto tiempo:
En esta parte veremos aplicaciones propias de visión por computador. Cuando trabajamos con imágenes, una de las primeras cosas que debemos hacer usar imágenes binarias, para eso usamos la umbralización, y para obtener información de las imágenes como su forma usamos el detector de bordes Canny.