Google lo apuesta todo a la inteligencia artificial (IA) con Gemini, su familia de modelos de lenguaje grande que abre el camino hacia el asistente inteligente universal que la compañía ha anticipado con Project Astra. Pero también con los agentes que realizan tareas por los usuarios y las nuevas capacidades que ofrece una mayor ventana de contexto en su modelo estrella, Gemini 1.5 Pro.
Google celebró este martes una nueva edición de su evento anual de desarrolladores Google I/O. Allí, aseguró que Gemini es su camino hacia la inteligencia artificial general, esto es, una IA responsable que sea útil para las personas en su día a día.
Actualmente, la familia de modelos Gemini impulsa las principales funciones de IA de los servicios de la compañía. Gemini 1.5 Pro, con su ventana de contexto de hasta un millón de tokens, ofrece un razonamiento, planificación y comprensión más avanzados.
Gemini 1.5 Pro está disponible desde este martes para todos los desarrolladores a nivel global. Además, dentro de la suscripción Gemini Advanced, ampliará su ventana de contexto a 2 millones de tokens a finales de año, estando primero disponible para desarrolladores con una vista previa privada.
IA para todos con Google
De la mano de Google DeepMind, la familia de modelos crece con una nueva incorporación: Gemini 1.5 Flash. Esta es una versión más ligera que Pro optimizada para tareas comunes como resumen o traducción. Asimismo, puede probarse en Google AI studio y Vertex AI con un millón de tokens.
Gemini también impulsa los agentes, unos sistemas inteligentes que muestran capacidad de razonamiento, planificación y memoria. De esta manera, ayuda al usuario en una amplia variedad de tareas, con el apoyo de servicios de Google como Gmail o Chrome.
Asimismo, actualizó las herramientas de IA generativa que se enmarcan bajo Generative Media, dedicadas a la creación de imágenes, música y videos. En ellas se ha venido trabajado en los últimos meses.
Imagen 3, en pruebas en Labs, ofrece ahora un resultado más fotorrealista. Es decir, crea imágenes con gran detalle y calidad a partir de descripciones que el usuario puede completar con todo los matices que quiera añadir.
Music AI Sandbox, por su parte, ofrece un conjunto de herramientas de IA para la creación de canciones de calidad profesional, mientras que Veo genera vídeo en alta calidad (1080p) a partir de texto, imágenes y propuestas de video, e incorporar efectos con la función experimental VideoFx.
Google DeepMind también anticipó Project Astra, lo que la compañía espera que en un futuro sea un verdadero asistente universal. En la demostración que se compartió, la compañía apuntó que es un asistente multimodal construido a partir de Gemini que ve el mundo a través de la cámara del smartphone para que el usuario pueda preguntar sobre él.
ComputerHoy