Gemini

Gemini

La semana pasada Google presentó Gemini, un nuevo modelo de IA que, si hace lo que promete, podría empezar a dar un poco de miedo.

Y ojo, porque hablamos de un modelo de lenguaje de IA, es decir, lo que hay debajo de las Inteligencias Artificiales que vemos. Te lo cuento un poco más despacio.

GPT no es ChatGPT

Empecemos por aquí, que será lo más sencillo. GPT es un modelo de lenguaje largo (traducción personal y libre de LLM: Large Language Model). Es el motor, o mejor dicho el cerebro, de las inteligencias artificiales. ChatGPT es un programa que utiliza ese motor para hablar con nosotros. Entender lo que le decimos y darnos una respuesta coherente en base a lo que sabe.

Estos modelos se pueden entrenar y personalizar. De hecho, OpenAI, los creadores de GPT, anunciaron hace poco una tienda de Inteligencias Artificiales a las que cualquiera podrá subir sus propias personalizaciones. Yo podría comprar un modelo básico y empezar a pasarle libros de legislación españoles, coger a varios abogados y jueces para que le vayan haciendo preguntas, analicen sus respuestas y la vayan entrenando. Luego subo ese modelo especialmente entrenado a la tienda y cobro por ello a cualquier abogado que quiera una IA que entienda su lenguaje para ayudarle a redactar escritos, analizar sentencias, etc.

O tengo una empresa que se dedica a reparar productos electrónicos. La empiezo a documentar con manuales y averías que voy resolviendo y ella, una vez entrenada, será capaz de proponerme soluciones a cualquier avería que puede que a mi no se me ocurrieran.

Por poner un ejemplo sencillo: GPT es una masa de pizza. Dependiendo de los ingredientes que le pongas encima, o incluso de si agregas alguno a la propia masa por dentro, obtendrás pizzas totalmente diferentes pero siempre partiendo de la misma base, lo cual te da sus limitaciones.

Montemos una pizzería

En la recién empezada carrera por las Inteligencias Artificiales, GPT (OpenAI) lleva toda la delantera. Fueron los primeros en sacar un ejemplo útil y que hemos podido palpar con nuestras manos. Charlar con ella, decirle que nos haga resúmenes de texto, que responda un correo electrónico por nosotros… Está detrás de muchas opciones de IA que han aparecido en el mercado, como las de Notion, Spark o, el más llamativo, el copiloto de Windows. Ellos no desarrollan en si el modelo, compran la base de la pizza y empiezan a ponerle jamón, queso, tomate, peperoni o lo que ellos necesitan.

A día de hoy ya te digo que GPT era casi la única en la que se basaban todas estas experiencias de IA. Google tenía sus modelos (Palm) y saco Bard para demostrar de lo que eran capaces sus «bases de pizza» pero parece que nadie apostó por comprar esa masa para montar sus pizzerías.

Hasta ahora. Google ha reformulado su motor, dicen que prácticamente desde cero, y ha presentado su nueva y deslumbrante masa de pizza, con ingredientes de primera y con un sabor nunca visto: Gemini

Gemini

Este es el nombre que ha dado Google a su nuevo modelo y la semana pasada, poco más de un año después de que GPT pegara el bombazo con ChatGPT, ha visto la luz. O algo así, porque parece que poca gente ha podido probarla de verdad por ahora, sólo se han visto videos que francamente maravillan, pero no dejan de ser videos que pueden estar acortados, modificados, editados… En fin.

En el video de presentación, se ve como alguien conversa con ella y a través de una cámara le enseña objetos y dibujos que la propia Inteligencia Artificial va asociando y utilizando para dar sus respuestas. Desde un simple dibujo de dos coches en una cuesta y te dice cual será más rápido bajando hasta deducir que los patos azules existen. Todo un portento sobre todo teniendo en cuenta velocidad y deducciones en continuidad, como sigue el hilo de la conversación y las imágenes. Te dejo el video. Son 6 minutos en inglés.

Ahí queda eso. Gemini se presenta además en tres sabores, como si fueran tres masas de pizza.

  • Nano, pensada para implementarse en dispositivos como los móviles.
  • Pro, que busca ser la de uso más generalizado, como lo que te comentaba de entrenarla para pequeños casos concretos
  • Ultra, la que promete ser rival directa de GPT y que es la que nos han mostrado en video.

Dos cosas a destacar sobre esto: Nano parece que podría funcionar en local en tu dispositivo móvil. Sin necesidad de enviar datos a nadie, sin conexión a la nube. Privacidad máxima, con lo que ello puede suponer en algunos entornos.

Ultra es la que podría acabar con el ser humano.

Gemini Ultra

A ver, tampoco debería ser para tanto pero ellos mismos aseguran que están poniendo mucho empeño en controlarla. Y a mi esta frase me recuerda mucho a John Hammond en Parque Jurásico con eso de «no hemos reparado en gastos» y en todas las medidas que pusieron para controlar a los dinosaurios. El resultado ya lo sabes.

Total, vuelvo a Gemini Ultra. Es capaz de entender no sólo texto, también imágenes, videos, voz… todo. Y seguramente sensores que se le coloquen podrá ser capaz de interpretarlos mucho mejor que los humanos, o eso empiezan a decir los primeros test.

Hablamos de sensores médicos y la capacidad de una Inteligencia Artificial de analizar los datos en su conjunto con mucha mayor rapidez y acierto que todo un equipo médico. O de analizar los problemas de una construcción, predecir el clima con más exactitud que nunca. Todo un mundo de posibilidades mucho más allá de crear un trailer de Heidi surrealista o quitar a tu pareja de la foto que tienes en la Toscana.

¿Qué daño puede hacernos? No lo sé. Siempre quiero pensar que no dejan de estar encerradas en ordenadores pero luego pienso que todos esos ordenadores están conectados a todo. Desde mi móvil a, posiblemente en breve, a un marcapasos. Los semáforos, los aeropuertos… ¿Que daño pueden hacernos si no son más que programas de ordenador.

No sé, pero me preocupa que sean ellos mismos los que están tan preocupados. ¿Tú qué crees?

PD: Google, Microsoft… ¿Apple? Ni está ni se la espera. Ellos a su rollo con sus gafas.

0 comentarios en «Gemini»

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.