Header Ads Widget

Ticker

6/recent/ticker-posts

8 API para detectar objetos de video

 Mejore su inteligencia de video con estos sólidos servicios impulsados ​​por IA

El aprendizaje automático ha dado grandes pasos en los últimos años, ofreciendo nuevas capacidades como IA empresarial , reconocimiento de emociones , detección de imágenes y más. Junto con la IA, las API se están volviendo más inteligentes: ahora pueden realizar tareas increíblemente difíciles y que requieren muchos recursos.

Uno de estos dominios recientemente acelerados del poder de la IA es la detección de objetos . Una amplia gama de API y bibliotecas, algunas de código abierto, algunas comerciales, prometen detectar objetos tanto de video como de imágenes con una precisión increíble. Estas API de reconocimiento de objetos de video utilizan conjuntos de datos previamente entrenados, entrenamiento de datos personalizados y esfuerzos de flujo de datos en tiempo real para crear inteligencia de video precisa para una variedad de aplicaciones.

Hoy, veremos ocho ofertas en este espacio. No están clasificados en ningún orden en particular, ni son "una talla para todos". Dicho esto, todas estas soluciones presentan ofertas impresionantes y representan una frontera prometedora para la industria de API.

¿Qué es el aprendizaje automático de todos modos?

Antes de discutir los servicios específicos, repasemos qué es el aprendizaje automático . Las soluciones de Inteligencia Artificial (IA) realizan ciertas tareas con inteligencia similar a la humana. Pero, ¿qué impulsa estas ofrendas?

En pocas palabras, aprendizaje automático . El aprendizaje automático es el proceso de tomar conjuntos de datos y "probar" cientos, miles, a veces millones de permutaciones. El servicio se entrena contra entidades conocidas y se le indica que busque cualidades que puedan replicarse en otros lugares. Al aprender probando muchos objetos, se puede generar una solución para detectar objetos.

Estos sistemas son tan buenos como sus conjuntos de datos. Por esta razón, las soluciones de conjuntos de datos grandes a menudo se ven favorecidas, con gigantes como Amazon y Google que casi dominan el espacio. Aquí es donde entra en juego el entrenamiento de conjuntos de datos personalizados. Soluciones como Amazon y Google son necesariamente de amplio espectro. Otras soluciones, especialmente aquellas que se enfocan en la capacitación de aprendizaje automático en conjuntos de datos personalizados con etiquetas personalizadas, a menudo pueden funcionar en esfuerzos muy específicos y de alcance limitado tan bien, si no mejor, que los competidores más grandes.

Todo esto es para decir: al considerar la siguiente lista, considere tanto la confianza que está depositando en el sistema (después de todo, estos sistemas tocarán una cantidad increíble de contenido donde sea que lo implemente) como su confianza en la eficacia de los algoritmos siendo utilizado.

8 Servicios de detección

API de inteligencia de video

La API de inteligencia de video utiliza una API REST para generar un conjunto diverso de metadatos y anotaciones para videos e imágenes utilizando la IA de Google y los sistemas de aprendizaje automático. Hay una amplia gama de cosas que la API puede hacer, incluida la detección de logotipos, descifrar texto dentro del video, analizar objetos dentro del video y más.

Si bien la API de Video Intelligence puede, en teoría, usarse para entrenar en conjuntos de datos personalizados, es probable que la mayoría de sus usuarios utilicen los modelos de aprendizaje automático previamente entrenados, ya que están diseñados para ser bastante completos. Esta API se utiliza en muchos productos principales de Google y, como tal, se itera constantemente; por esta razón, puede ser una opción sólida para el uso a largo plazo y con bajo costo de recursos, ya que el algoritmo solo mejorará con el tiempo .

Rekognition

Rekognition es una oferta poderosa de Amazon que aprovecha sus esfuerzos de aprendizaje automático en los últimos años para ofrecer una oferta ampliable y escalable. Entre sus usuarios actuales se encuentran NFL, National Geographic, CBS y otros, lo que demuestra que se puede implementar un conjunto diverso de casos de uso a través del sistema AWS.

Rekognition utiliza dos sistemas distintos a partir de 2020. Los algoritmos previamente entrenados incluyen la detección de celebridades en las fotos, la generación de rutas para las personas en las fotos y otros contenidos previamente entrenados. El otro sistema se basa en la formación de los sistemas de verificación de usuarios SearchFaces y Face en conjuntos de datos personalizados, que pueden funcionar bien para aplicaciones de seguridad, como la verificación para acceder a una sala de servidores.

API de detección de objetos de TensorFlow

La API de detección de objetos de TensorFlow es un excelente marco de trabajo de código abierto diseñado para sistemas de detección de objetos. Curiosamente, esta implementación se centra más en permitir la creación de modelos de detección de objetos que en proporcionar el modelo perfecto "listo para usar". Por esta razón, es quizás uno de los competidores más fuertes para soluciones personalizadas en esta lista.

No todas las implementaciones utilizarán los mismos conjuntos de datos o pedirán las mismas cosas, y por esta razón, las implementaciones de alcance personalizado, construidas a medida y entrenadas a medida pueden, en ocasiones, ser la mejor opción. Por ejemplo, ¿qué pasaría si quisiéramos crear una API de detección que busque tanto a los escaladores como a las cuerdas que están usando para rastrear durante un evento deportivo? Este es un caso de uso muy particular. Si bien una solución general puede no ser la mejor en este caso, un marco como la API de detección de objetos de TensorFlow podría ser la implementación perfecta.

Lea también: Cómo entrenar un algoritmo de aprendizaje automático con TensorFlow

Automatización visual Ximilar

Ximilar Visual Automation es una oferta interesante, ya que se ha dirigido a un nicho específico de contenido utilizando una oferta más general. Si bien la oferta de Ximilar puede crear soluciones personalizadas, está bastante claro que su enfoque está en detectar cualidades sobre objetos en el ámbito empresarial. Por ejemplo, su marketing se apoya en gran medida en la idea de detectar atuendos específicos, diferentes tipos de atributos arquitectónicos (como encontrar muchas casas que sean todas del mismo estilo), etc.

Por supuesto, como con cualquier sistema de aprendizaje automático, una implementación personalizada no es imposible. Dicho esto, con un nicho tan específico, Ximilar parece ser una gran oferta para desarrolladores dentro de una industria con elementos muy específicos que necesitan procesamiento (como fabricación, envío, etc.).

API de reconocimiento de video

La oferta de API de reconocimiento de video de Valossa, si bien se puede utilizar para una gama más amplia de propósitos de aprendizaje automático, se desarrolló principalmente para su uso en sistemas de cámaras en la nube, locales y en vivo. Estos enfoques tienden a basarse en la producción de videos en vivo, el marketing, el conocimiento de la marca, etc. La oferta principal parece estar muy extendida dentro de ese espacio, cubriendo tanto terreno como sea posible.

Valossa también ofrece soluciones personalizadas. Teniendo esto en cuenta, los desarrolladores deben decidir entre una función construida muy específicamente o un enfoque generalista. Si su caso de uso de datos está muy relacionado con lo que Valossa ha sido diseñado, puede ser una excelente oferta; si no lo es, otras ofertas de esta lista pueden resultar más útiles desde el primer momento.

Reconocimiento visual de Watson

Watson es más famoso por su actuación en Jeopardy! El algoritmo de aprendizaje automático que impulsó esas actuaciones también se puede aprovechar para el reconocimiento visual. Watson recibió formación en modelos muy detallados y ha añadido soporte para el modelado personalizado. A grandes rasgos, agrupa los datos de su modelo en tres dominios: "modelo general", que permite una clasificación general, "modelo explícito", que determina si una imagen es apropiada, y "modelo de alimentos", que detecta alimentos.

Watson está muy enfocado en la generación de modelos adicionales y, como tal, esta es quizás una oferta más sólida para aquellos que ingresan a esto con conjuntos de datos únicos. Desde el punto de vista de la seguridad, IBM es una entidad de confianza; confiarle sus datos a IBM puede resultarle mejor que a otros socios.

ImageAI

ImageAI es una biblioteca de aprendizaje automático para Python que tiene un panorama de desarrollo muy activo en GitHub . Está compuesto por miles de colaboradores y usuarios. ImageAI fue diseñado para ser simple y, debido a esto, sigue siendo una implementación algo específica a partir de 2020. Actualmente, ofrece predicción de imágenes, detección y seguimiento de objetos y detección de video mediante el uso de varios conjuntos de datos (en particular, ImageNet –1000 y COCO).

Sin embargo, ImageAI tiene planes limitados de expansión. Si bien actualmente ofrecen una opción de conjunto de datos personalizados, tienen la intención de desarrollar un entrenamiento de datos más general y conjuntos de entrenamiento de datos más especializados para capturar una variedad más amplia de casos de uso y usuarios.

TorchVision

TorchVision es parte de PyTorch, un sistema de aprendizaje automático de código abierto. Ofrece una variedad de conjuntos de datos, incluidos paisajes urbanos, imágenes de Flickr y más. PyTorch es altamente escalable, con un backend distribuido que utiliza múltiples sistemas de entrenamiento concurrentes para optimizar los resultados del entrenamiento y generar un modelo más preciso.

Sin embargo, al igual que con cualquier marco, la implementación de PyTorch conlleva un cierto costo en comparación con otras ofertas. Además, una gama tan amplia de opciones puede resultar inadecuada para casos de uso específicos. Posiblemente sea una mejor opción ser más específico en tales situaciones y elegir una oferta de aprendizaje automático que se haya entrenado de manera más sólida en un tipo distinto de contenido. PyTorch es, sin embargo, una opción muy poderosa.

Sus conjuntos de datos deben determinar las soluciones de IA

Con el aprendizaje automático, su implementación solo será tan buena como sea apropiada para su solución y la calidad de los datos que le proporcione. Por esta razón, esta lista se presenta simplemente como una colección de ofertas sin mucha declaración en cuanto a la calidad relativa. Todas estas opciones son buenas en sus propios casos de uso y deben considerarse dentro del contexto de sus ofertas de datos específicas.

¿Qué opinas de nuestras selecciones? ¡Háganos saber en los comentarios a continuación!

Publicar un comentario

0 Comentarios