Header Ads Widget

Ticker

6/recent/ticker-posts

DALL-E y el futuro de la IA y las API

 

Tres API extremadamente populares en el mercado en 2021 (Alexa Skill Management API, Google Assistant API e IBM Watson Discovery API) se relacionan con la Inteligencia Artificial (IA). También parece que el futuro del espacio de la IA estará estrechamente relacionado con el de las API.

OpenAI ‘s DALL-E , estilizado como DALL · E, es un ejemplo de esto. Los observadores no técnicos han descrito el programa como algo mágico e, incluso sabiendo que el aprendizaje automático está detrás de DALL-E, es difícil no estar de acuerdo. El acceso a DALL-E, al igual que con algunas de las otras ofertas de OpenAI, probablemente seguirá estando disponible a través del acceso a la API.

Pero, por más fascinante que sea la herramienta, DALL-E ofrece una visión inquietante de un futuro potencial de la IA y las API. A continuación, analizaremos más de cerca DALL-E, su relación con las API y cómo podría representar un modelo problemático para el desarrollo de API.

Presentamos DALL-E
Llamado así por Salvador Dali y WALL-E de Disney Pixar (lo cual es irónico dado que WALL-E, aunque adorable, está oxidado y desactualizado), DALL-E se introdujo a principios de 2021.

Para citar a OpenAI, “DALL-E es una versión de 12 mil millones de parámetros de GPT-3 entrenada para generar imágenes a partir de descripciones de texto, utilizando un conjunto de datos de pares texto-imagen. Hemos descubierto que tiene un conjunto diverso de capacidades, incluida la creación de versiones antropomorfizadas de animales y objetos, la combinación de conceptos no relacionados de manera plausible, la representación de texto y la aplicación de transformaciones a imágenes existentes ".

¿En otras palabras? DALL-E crea una imagen generada por computadora a partir de texto ingresado al azar.

Algunos de los casos de uso demostrados en el sitio web de OpenAI incluyen de todo, desde dibujos técnicos hasta un emoji de alta calidad de un té de boba enamorado. En otras palabras, esta es una herramienta increíblemente poderosa con innumerables aplicaciones potenciales.

Desafortunadamente, es posible que tengamos que esperar un poco para ver cuáles son realmente algunas de esas aplicaciones. La propia OpenAI todavía se encuentra en fase beta privada, con un botón "Únase a la lista de espera" en su sitio desde su lanzamiento, y sus API también están en la lista de espera únicamente. La documentación actual de OpenI no contiene nada sobre DALL-E.

OpenAI y API
DALL-E funciona con GPT-3, alrededor del cual gira gran parte del trabajo de OpenAI. Hasta la fecha, GPT-3 se ha lanzado solo en formato SaaS (Software-as-a-service). Aparentemente, eso es para limitar el uso indebido de la tecnología y porque GPT-3 requiere una enorme cantidad de potencia informática *.

* ZDNet explica que esta es la razón por la que el acceso a GPT-3 se realiza a través de un punto final API basado en la nube; Lambda Computing estima que una sola GPU podría tardar cientos de años en completar tareas como lo hace GPT-3.

También es, como admite OpenAPI , ganar dinero. No es una gran cantidad de dinero, fíjate, ya que 750 palabras generadas por el modelo Davinci solo te costarán 6 centavos. ¿Cómo se ve la salida de la API? Bueno, podría parecer todo tipo de cosas.

Mientras que DALL-E genera imágenes a partir de la entrada de texto aleatoria, GPT-3 genera una salida de texto contextualmente relevante. Vea este ejemplo del portal de desarrolladores de OpenAI :

"Tema: Desayuno

Historia de terror de dos frases: Siempre deja de llorar cuando le echo leche a su cereal. Solo tengo que recordar no dejarle ver su cara en la caja ".

Parte del contenido generado por las API de OpenAI es, perdona el juego de palabras, terriblemente bueno. Lo que es aún más aterrador es que, con gran parte de la información que los rodea redactada, es posible que nunca sepamos si algo ha sido creado por un humano o por una API.

¿Un futuro sombrío para la IA?
Ahora, volvamos a DALL-E. No hay duda de que es una herramienta muy elegante, pero la medida en que los visitantes pueden usar la aplicación es limitada. En lugar de poder ingresar su propio texto, los usuarios de DALL-E actualmente están limitados a una variedad de menús desplegables proporcionados por OpenAI. Difícilmente una verdadera caja de arena.

Hay varias razones por las que ese podría ser el caso, desde minimizar la carga de trabajo hasta preocupaciones sobre actividades ilícitas como falsificaciones profundas. Pero probablemente también tenga algo que ver con el hecho de que Microsoft autorizó el uso exclusivo de GPT-3 en 2020. Aún se puede usar una API pública para recibir resultados, pero Microsoft posee actualmente los derechos del código subyacente de GPT-3.

OpenAI se posicionó inicialmente como una organización sin fines de lucro con el objetivo de "democratizar la inteligencia artificial", pero luego cambió a un modelo de ganancias limitadas . Es (muy) fácil argumentar que limitar el acceso a GPT-3 y herramientas como DALL-E no encaja con el objetivo de la democratización de la IA.

Sin mencionar que, debido a que DALL-E aplica "transformaciones a imágenes existentes", existen algunas implicaciones profundas cuando se trata de infracciones de derechos de autor y violaciones de marcas registradas.

Aún así, como dice Mark Riedl , quizás la mayor preocupación aquí es que “si creemos que el camino hacia una mejor IA de hecho es una función de modelos más grandes, entonces OpenAI se convierte en un guardián de quién puede tener una buena IA y quién no. Estarán en condiciones de ejercer influencia (explícita o implícitamente) en amplias franjas de la economía ".

El peligro de la IA cerrada (y las API)
También hay implicaciones de lo anterior para las API. Existen API sin fines de lucro y la mayoría de las API ofrecen un número limitado de llamadas mensuales de forma gratuita, pero ahí es donde termina la organización benéfica.

Afortunadamente, las llamadas API ridículamente caras (el tema de un divertido hilo de Twitter que encontramos) son la excepción más que la norma. Pero no hay garantía de que siga siendo así para siempre.

Cuanto más profundamente incrustada se vuelve una API en los procesos de una organización, más difícil es encontrar una alternativa para reemplazarla si el costo asociado aumenta. Muchos mercados están intentando estandarizar la monetización de las API, pero hacerlo es complicado y, por lo general, hay variaciones. Si un proveedor no quiere cumplir con las pautas, podría abandonar el mercado.

Las API se han asociado durante mucho tiempo con el intercambio de información gratuito, que es gratis en espíritu, no necesariamente de costo, y mejores servicios para que funcionen juntos. En el caso reciente de Google contra Oracle , se descubrió que la copia de Google de la API de Java SE para construir un "programa nuevo y transformador" calificó legalmente como un "uso justo de ese material como una cuestión de derecho".

Las API han llegado a representar un gran negocio en el espacio tecnológico, y eso significa mucho dinero cambiando de manos. También podría significar que los proveedores de API bloquean a los usuarios potenciales que consideran demasiado riesgosos o que no pueden mantenerse al día con las aspiraciones financieras de la empresa.

Si bien la API de OpenAI ciertamente no es la primera API privada, su naturaleza prohibitiva, junto con la naturaleza controvertida de la IA como tema, podría llegar a sentar un precedente preocupante (aunque DALL-E es mucho más divertido y sin lujos que Skynet). fue).

Publicar un comentario

0 Comentarios