Gemini 1.5 de Google, la última generación de inteligencia artificial que rompe récords
En una columna de opinión compartida por Sundar Pichai, CEO de Google y Alphabet, reveló al mundo la llegada de Gemini 1.5, la más reciente innovación en el campo de la inteligencia artificial de Google.
Esta nueva generación de modelos de IA, según Pichai, “representa un cambio radical en nuestro enfoque” al combinar avances tanto en investigación como en la ingeniería detrás del desarrollo de modelos de fundación. Sundar Pichai constata: “Hemos sido capaces de aumentar significativamente la cantidad de información que nuestros modelos pueden procesar, llegando a ejecutar hasta un millón de tokens de manera consistente”.
Este avance no solamente simboliza un progreso técnico, sino que también, marca un hito en la capacidad de comprensión de contextos largos por parte de los modelos de IA, lo cual, según el CEO de Google, abrirá capítulos completamente nuevos en términos de posibilidades para desarrolladores y clientes empresariales.
La adopción de una arquitectura de Mezcla de Expertos (MoE) es central en este desarrollo, permitiendo a los modelos de Gemini 1.5 ser más eficientes tanto en su entrenamiento como en su funcionamiento.
Este modelo dividido en “redes neuronales expertas menores” mejora significativamente la eficiencia al activar solo las vías expertas más relevantes según el tipo de entrada que reciban.
El modelo Gemini 1.5 Pro, como se da a conocer, es una versión multimodal de tamaño medio que ha sido optimizado para escalar a través de una amplia gama de tareas, manteniendo un rendimiento comparable al de Gemini 1.0 Ultra, el modelo más grande hasta la fecha.
Esta versión, además, incorpora una característica experimental revolucionaria en la comprensión de contextos extensos, capaz de procesar vastas cantidades de información en una única acción —incluyendo hasta una hora de vídeo, once horas de audio, bases de código con más de 30,000 líneas de código, o más de 700,000 palabras.
Sundar Pichai resalta la importancia de esta capacidad al ofrecer ejemplos concretos, como el análisis y resumen de transcripciones de 402 páginas de la misión Apollo 11 a la Luna, o la identificación de detalles en películas mudas de 44 minutos, demostrando no solo un profundo entendimiento sino también la capacidad de razonamiento avanzado sobre diversos tipos de contenido.
La efectividad mejorada de Gemini 1.5 Pro también se refleja en su desempeño superior al de sus predecesores en el 87% de las pruebas de evaluación. Importa destacar que este modelo mantiene altos niveles de rendimiento incluso al aumentar el tamaño de su ventana de contexto, encontrando textos específicos incrustados en bloques de hasta un millón de tokens con una precisión del 99%.
Este “aprendizaje en contexto” de Gemini 1.5 Pro, según Pichai, sugiere una notable capacidad de la IA para adquirir nuevas habilidades a partir de la información proporcionada en un extenso prompt, sin necesidad de ajustes adicionales.
¿Qué pasa con la ética de la IA?
Sobre las pruebas de seguridad y ética, Sundar Pichai asegura que Gemini 1.5 y sus modelos han sido objeto de rigurosas evaluaciones para garantizar su alineación con los principios de IA de Google y las políticas de seguridad. Expresa el compromiso de la compañía con el despliegue responsable de sus modelos de IA avanzados, prometiendo extender estas innovaciones a miles de millones de personas, desarrolladores y empresas de manera responsable.
En este contexto de constante innovación y desarrollo, Google se encuentra en la vanguardia, no solo por ofrecer avances tecnológicos sino también por establecer estándares en la implementación ética y segura de la inteligencia artificial. Sundar Pichai, a través de su columna de opinión, no solo comparte con el mundo estos avances sino que también reafirma el compromiso de Google con un futuro donde la tecnología sirve al bienestar colectivo con responsabilidad y cuidado.