Las novedades en el campo de la IA no se detienen y a pesar de la cercanía de las Navidades, las grandes empresas no paran de presentar nuevos productos.

Gemini 2.0

Google acaba de presentar Gemini 2.0, su modelo de IA más avanzado hasta la fecha que como novedad, es nativo en la entrada y salida de audio. Hasta ahora, cuando hablábamos a Gemini, este lo traducía a texto, lo procesaba y la salida de texto la volvía a convertir a voz. Ahora, no se produce ese paso intermedio de pasarlo a texto, lo que aumenta notablemente sus capacidades.

Otra de las novedades es que ahora es capaz de «ver», procesando el video en tiempo real ya sea a través de la cámara de nuestro dispositivo o de lo que estamos viendo en la pantalla de nuestro ordenador o móvil. Esta funcionalidad abre un inmenso campo de posibilidades para que Gemini nos ayude mientras trabajamos en cualquier proyecto o nos permita saber más de lo que hay a nuestro alrededor, como identificar un monumento o cuadro o quizás, incluso ayudarnos a cocinar.

Gemini 2.0 Flash Experimental se puede probar desde la web de Gemini y en las aplicaciones móviles tanto en Android como en iPhone y iPad.

Gemini 2.0 Flash Thinking Experimental

Hasta ahora, Google no tenía ningún modelo que razonara antes de contestar, pero acaba de presentar Gemini 2.0 Flash Thinking Experimental, que hará competencia a los modelos de OpenAI y a los chinos como DeepSeek.

Como OpenAI o1 o Copilot Think Deeper, Gemini 2.0 Flash Thinking Experimental, no nos responderá de inmediato a nuestras preguntas, sino que dedicará un tiempo a razonar y analizar la pregunta para darnos una mejor respuesta.

Por ahora, solo está disponible (gratis) en Google AI Studio donde lo puedes probar, pero seguro que en breve está accesible desde la web de Gemini.

Proyecto Mariner

Pero lo más interesante que ha presentado Google es su Proyecto Mariner, un primer paso en el mundo de los agentes, es decir, modelos de IA que son capaces de ejecutar acciones y de manejar el ordenador por nosotros.

Lo han demostrado en un video donde una persona crea una hoja de cálculo con el nombre de varias empresas y le pide a Gemini que busque en internet las direcciones de correo de contacto de dichas compañías y las incluya en el Google Sheets.

A partir de ese momento, la IA de Google toma el control del ordenador y va abriendo las webs de las empresas, buscando dónde está el correo de contacto y añadiéndolo a la hoja de cálculo.

Aún estamos en los primeros días de esta tecnología, pero todo apunta a que en 2025 veremos grandes avances en este terreno y nuestra forma de trabajar va a cambiar mucho.

Deja un comentario

Comentarios

Aún no hay comentarios. ¿Por qué no comienzas el debate?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *