100 novedades de IA de Google

En su evento para desarrolladores, Google I/O, la compañía presentó 100 novedades relacionadas con la inteligencia artificial. No las vamos a listar todas, pero sí algunas de las más interesantes.

Tras el evento en el que OpenAI presentaba GPT-4o, Google abría las puertas de su evento anual enfocado a desarrolladores: Google I/O. Sin embargo, este año, la mayoría de novedades parecía que iban enfocadas al público en general, más en particular, a explicar los avances de Google en el campo de la IA.

La cercanía de ambos eventos hacía obvia su comparación y muchos han nombrado ganador a OpenAI que, en una presentación más corta, de solo 25 minutos, sorprendió mucho más que en las casi 2 horas que duró en evento de Google.

Google parece que tomó la decisión de abrumar con la cantidad de novedades y prueba de ello es que ha publicado una lista con las 100 novedades que presentó. Hemos seleccionado algunas de las que consideramos más interesantes:

Han presentado Gemini 1.5 Flash: un modelo más ligero diseñado para ser más rápido y eficiente.
Han mejorado notablemente Gemini 1.5 Pro, su modelo más polivalente.
La ventana de contexto de Gemini 1.5 Pro y Flash ahora permite hasta 1 millón de tokens
Presentaron Project Astra: su visión del futuro de los asistentes de IA
Anunciaron Trillium, la sexta generación de sus TPUs (Tensor Processing Unit) que es la más potente hasta la fecha: 4.7 veces más rendimiento que el microprocesador anterior y un 67% más eficiente en cuanto al consumo de energía.
Presentaron Imagen 3, su modelo de generación de imágenes de mayor calidad.
Veo es su nuevo modelo de generación de video que es capaz de generar videos a resolución 1080p y de más de un minuto de duración.
Los suscriptores de Gemini Advanced pronto podrán crear Gems, versiones personalizadas de Gemini (vamos, como los GPTs de OpenAI)
AI Overviews in Search. El buscador de Google te dará directamente resultados generados por IA. Disponible en EEUU y pronto en otros países.
Gemini 1.5 Pro estará disponible en paneles laterales en Gmail, Docs, Drive, Slides and Sheets a través de Workspace Labs.
En pocas semanas, la opción «Ayúdame a escribir» de Gmail y Docs estará disponible en español y portugués.
A finales de este año, Gemini Nano, el modelo básico integrado en dispositivos Android, tendrá capacidades multimodales. Además de procesar la entrada de texto, los móviles Píxel de Google también podrá entender más información de contexto, como las imágenes, los sonidos y el lenguaje hablado.
Talkback, una función de accesibilidad para dispositivos Android que ayuda a las personas ciegas y con baja visión a utilizar la retroalimentación táctil y hablada para interactuar mejor con sus dispositivos, se está mejorando gracias a Gemini Nano multimodal.
Los estudiantes ahora pueden usar «Circle to Search» para obtener ayuda con sus deberes directamente desde algunos teléfonos y tabletas Android. Esta función utiliza LearnLM, nuestra nueva familia de modelos basados en Gemini, afinados para el aprendizaje.
A finales de este año, «Circle to Search» podrá resolver problemas aún más complejos que incluyan fórmulas, diagramas y gráficos.