Durante el último, desbancar a OpenAI de su puesto en la cima de la industria tecnológica parecía casi imposible. La empresa se había montado en un tumulto de entusiasmo y expectación generado por un programa notable, locuaz y ocasionalmente desquiciado llamado ChatGPT.

Desde hace poco, Demis Hassabis, CEO de Google DeepMind, le ha hecho una sana competencia a Sam Altman, liderando el desarrollo y despliegue de un modelo de inteligencia artificial que parece tan capaz e innovador como el que impulsa el robot de OpenAI.

Desde que Alphabet creó DeepMind, mediante la fusión de dos de sus divisiones centradas en la IA el pasado mes de abril, Hassabis se ha encargado de acorralar a sus científicos e ingenieros para contrarrestar tanto el notable ascenso de OpenAI como su colaboración con Microsoft, considerada una amenaza potencial para el negocio de búsqueda de Google.

A los investigadores de Google se les ocurrieron varias de las ideas que se utilizaron en la creación de ChatGPT, pero la empresa decidió no comercializarlas por recelos sobre su posible mal comportamiento o uso indebido. En los últimos meses, Hassabis ha supervisado un cambio radical en el ritmo de la investigación y los lanzamientos con el rápido desarrollo de Gemini, un modelo de IA “multimodal” que ya impulsa la respuesta de Google a ChatGPT y un número creciente de productos. La semana pasada, apenas dos meses después de la presentación de Gemini, Google anunció Gemini Pro 1.5, una rápida actualización de la versión base del modelo, más potente para su tamaño y capaz de analizar grandes cantidades de texto, video y audio a la vez.


Cabeza humana hecha de piezas de rompecabezas 3D rojas, azules, amarillas y verdes sobre un fondo verde

Apenas dos meses después de que Alphabet hiciera público su modelo de IA Gemini, lanza una nueva versión que puede manejar varias veces más entradas de audio, video y texto que GPT-4.


Una mejora similar del modelo más potente de Alphabet, Gemini Ultra, ayudaría a dar un nuevo empujón a OpenAI en la carrera de las empresas por desarrollar y ofrecer sistemas de IA cada vez más potentes y útiles.

Hassabis habló con Will Knight, redactor jefe de la edición estadounidense de WIRED, a través de Zoom desde su casa en Londres. Esta entrevista ha sido ligeramente editada para mayor claridad.

La importancia de Gemini Pro

WIRED: Gemini Pro 1.5 puede procesar muchos más datos que su predecesor. También es más potente, para su tamaño, gracias a una arquitectura llamada mezcla de expertos. ¿Qué importancia tienen estas cosas?

Demis Hassabis: Ahora se puede procesar un cortometraje de tamaño razonable. Me lo imagino súper útil si estás aprendiendo sobre un tema y hay una conferencia de una hora, y quieres encontrar un dato concreto o cuándo hicieron algo. Creo que va a haber un montón de casos de uso realmente interesantes para eso.

Inventamos la mezcla de expertos [Jeff Dean, jefe científico de Google DeepMind lo hizo] y desarrollamos una nueva versión. Esta nueva versión Pro de Gemini no se ha probado exhaustivamente, pero tiene aproximadamente el mismo rendimiento que la mayor de la generación anterior de arquitectura. Nada nos impide crear un modelo de tamaño Ultra con estas innovaciones y, obviamente, es algo en lo que estamos trabajando.


Sundar Pichai frente a un fondo rosa

El CEO de Google Sundar Pichai revela a WIRED que el nuevo y más potente Gemini es un experimento para ofrecer a los usuarios una forma de encontrar información por chatbot y sin buscadores.


El camino a la IA general necesita más que chips

WIRED: En los últimos años, el aumento de la potencia informática y de los datos utilizados en el entrenamiento de un modelo de IA es lo que ha impulsado avances asombrosos. Se dice que Sam Altman pretende recaudar hasta 7 billones de dólares para más chips de IA. ¿Es una potencia informática mucho mayor lo que se necesita para desbloquear la inteligencia artificial general?

Demis Hassabis: ¿Fue una cita errónea? Escuché a alguien decir que tal vez eran yenes o algo así. Bueno, mira, necesitas escala: por eso Nvidia vale lo que vale hoy. Es por eso que Sam está tratando de aumentar cualquiera que sea el número real. Pero creo que somos un poco diferentes a muchas de estas otras organizaciones en que siempre hemos sido la punta de lanza de la investigación fundamental en primer lugar. En Google Research, Brain y DeepMind, hemos inventado la mayoría de las técnicas de aprendizaje automático que hemos usado en los últimos 10 años de trabajo pionero. Así que eso siempre ha estado en nuestro ADN, y tenemos un montón de científicos de investigación de alto nivel que tal vez otras organizaciones no tienen. Estas otras nuevas empresas, e incluso las grandes empresas, tienen una alta proporción de ingeniería para la investigación de la ciencia.

Por Agencias

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *