¿Qué es y cómo funciona la IA Gemini que acaba de presentar Google? |

Por si no se han enterado, apenas se presentó oficialmente la IA Gemini, con la cual se espera que quede en el pasado ChatGPT. Sí, se trata del último gran modelo de lenguaje creado por Google y que ya está disponible para el público general.

¿Qué es la IA Gemini de Google?

Fue este miércoles 6 de diciembre de 2023 que Sundar Pichai, director ejecutivo de Google, presentó oficialmente la IA Gemini, con lo que se espera se inicie una nueva era, ya que se trata de su último gran modelo de lenguaje.

Según Pichai y el director ejecutivo de Google DeepMind, Demis Hassabis, esta inteligencia artificial tendrá efectos en todos los productos de Google.

Foto: Getty Images

De hecho, esta IA tendrá otras versiones, pues habrá una más ligera llamada Gemini Nano, creada para ejecutarse de manera nativa y sin conexión en dispositivos Android.

O también la versión Gemini Pro, que a diferencia de la anterior, será más robusta e impulsará varios servicios de Google. Y además Gemini Ultra, el modelo de lenguaje de gran tamaño más poderoso que Google ha creado hasta este momento, y que parece estar diseñado para trabajar en centros de datos y aplicaciones empresariales.

¡Atentos! Google eliminará cuentas inactivas a finales de este 2023 — Foto ilustrativa: Pexels

¿Dónde encontrar Gemini?

Bard, la competencia directa de Chat GPT, trabajará con Gemini Pro; mientras que los usuarios del celular Pixel 8 Pro tendrán algunas funciones nuevas con Gemini Nano. Y no coman ansias, pues Gemini Ultra llegará hasta 2024.

De mientras, los desarrolladores y clientes empresariales podrán probar Gemini Pro por medio de Google Generative AI Studio o Vertex AI en Google Cloud a partir del miércoles 13 de diciembre de 2023.

¡Ojo! Por ahora la IA Gemini de Google sólo está disponible en inglés, pero se espera que con el paso de las semanas se agreguen más idiomas.

Además, el CEO de Google señaló que el plan es que esta nueva inteligencia artificial se integre a su motor de búsqueda, a sus productor publicitarios, al navegador de Chrome y a otros productos de la compañía.

Por ejemplo, en Bard, los usuarios mexicanos que sepan inglés, ya pueden probar algunas funciones de Gemini Pro, la cual está enfocada en “comprender y resumir, razonar, generar ideas, escribir y planificar”, y, hasta ahora, es la mayor actualización que tiene desde su lanzamiento, de acuerdo con Google.

¿Cómo funcionará Gemini?

Y seguro se preguntarán: ¿cuáles son las diferencias con GPT-4 de OpenAI? De acuerdo con The Verge, Google comparó Gemini con ChatGPT en 32 puntos, incluyendo pruebas generales como la comprensión del lenguaje multitarea, hasta una para medir la capacidad de generar código Python.

“Creo que estamos sustancialmente por delante en 30 de 32” de esos puntos de referencia, señaló Hassabis… ¿Será cierto?

Pues según los creadores y algunos expertos en inteligencias artificiales, Gemini destaca por su capacidad para comprender e interactuar con video y audio, gracias a su diseño.

Sí, los desarrolladores de Google construyeron un modelo multisensorial desde cero, pues estaban muy interesados en combinar modelos; recopilar la mayor cantidad de datos posible a partir de cualquier número de entradas y sentidos y luego dar respuestas con la misma variedad.

Por ahora, las versionas más básicas de Gemini aceptan entrada y salida de texto; mientras que Gemini Ultra puede funcionar con imágenes, video y audio.

En fin… Aunque los creadores de Google realizaron varias pruebas a su nuevo “bebé”, deberán esperar a las reacciones de sus usuarios, quienes buscarán información, generarán ideas, escribirán código y más cosas, gracias también a su nuevo sistema de generación de código llamado AlphaCode 2.

2,012