Ver proyecto

Escrito por

Publicado el

Compartir noticia en

Consultoría, Desarrollo
Tiempo de lectura: 4 mins.

GEMINI: el nuevo y más capaz modelo de IA de Google.

“Welcome to the Gemini era” es la frase con la que comienza su presentación en Google DeepMind. 

La “Gemini era” hace referencia a una nueva etapa de investigación e innovación que abre Google luego de casi 8 años apostando y estudiando a la IA generativa. 

Sundar Pichai, director ejecutivo de Google y Alphabet, en una nota oficial de la compañía declaró: “Casi ocho años después de nuestro viaje como una empresa que da prioridad a la IA, el ritmo del progreso no hace más que acelerarse: millones de personas están utilizando la IA generativa en todos nuestros productos para hacer cosas que no podían ni siquiera hace un año (…). Al mismo tiempo, los desarrolladores están utilizando nuestros modelos e infraestructura para crear nuevas aplicaciones de IA generativa, y las empresas de todo el mundo están creciendo con nuestras herramientas de IA.”

Gemini da un nuevo paso en materia de Inteligencia Artificial, siendo el modelo más capaz y general, con tecnología de última generación. Su primera versión, la 1.0, está optimizada para tres tamaños distintos:

  1. Gemini Ultra:  modelo de mayor tamaño y capacidad para tareas muy complejas.
  2. Gemini Pro: modelo ideal para escalar en una amplia gama de tareas.
  3. Gemini Nano: modelo más eficiente para tareas en dispositivos móviles.

Amplia capacidad de comprensión.

Gemini 1.0 fue diseñado y entrenado para reconocer y comprender texto, imágenes, audio y más al mismo tiempo, por lo que entiende mejor la información matizada y puede responder preguntas relacionadas con temas complicados. Esto lo hace especialmente bueno para explicar el razonamiento en materias complejas como matemáticas y física.

Rendimiento nunca antes visto.

Gemini se sometió a diversas evaluaciones para medir su rendimiento en una gran variedad de tareas: desde la comprensión de imágenes naturales, audio y video, hasta el razonamiento matemático. Es así como Gemini Ultra supera los resultados actuales de lo último en tecnología en 30 de los 32 puntos de referencia académicos utilizados en la investigación y el desarrollo de los grandes modelos de lenguaje (LLM: Large Language Models).

Por otro lado, con una puntuación del 90%, este nuevo modelo de lenguaje se posiciona como el primero en superar a los expertos humanos en MMLU (comprensión masiva de lenguajes multitarea), que utiliza como punto de referencia una combinación de 57 materias en CTIM (o STEM por sus siglas en inglés). Esto le permite a Gemini poder responder con mayor precisión preguntas complejas.

Comparación del rendimiento de Gemini frente a ChatGPT. Fuente: Google

La multimodalidad como rasgo distintivo.

Antes, para crear modelos multimodales, era necesario entrenar componentes por separado, cada uno destinado a diferentes modalidades, para luego unirlos e intentar imitar lo más posible cada funcionalidad. 

Gemini irrumpe esta regla, siendo un modelo de lenguaje diseñado para ser nativamente multimodal, entrenado íntegramente así desde sus orígenes. Esto le permite ser mucho más veloz y más preciso frente a cualquier otro modelo de características similares. Además, posteriormente, se perfeccionó con otros elementos multimodales adicionales a fin de poder comprender y razonar en todo tipo de entradas desde cero.

Fuente: https://deepmind.google/technologies/gemini/#hands-on 

Gemini Ultra también logra una puntuación récord del 59,4 % en MMMU (Massive Multi-discipline Multimodal Understanding), un nuevo punto de referencia diseñado para evaluar modelos multimodales en tareas multidisciplinarias masivas que exigen conocimientos temáticos de nivel universitario y razonamiento deliberado.

¿Cuando estará abierto al público?

A partir del 13 de diciembre, los desarrolladores y clientes empresariales ya pueden acceder a Gemini Pro a través de la API de Gemini en Google AI Studio o Google Cloud Vertex AI.

A principios del año entrante, ya estará abierta al público en general. Mientras tanto, a esperar😅

Si esta info te gustó, te invitamos a seguirnos en nuestras redes sociales para no perderte de las últimas novedades: Instagram, Facebook, TikTok  y LinkedIn.

Lab9 – Digital Agency.