Google lanzó el jueves una versión «reimaginada» de su agente de investigación Gemini Deep Research, que se basa en su muy publicitado modelo de plataforma de vanguardia Gemini 3 Pro.
Este nuevo agente no fue diseñado sólo para crear informes de investigación. Sin embargo, todavía es posible crear uno. Esto permite a los desarrolladores incorporar las capacidades de investigación del modelo SATA de Google en sus propias aplicaciones. Esta función está habilitada por la nueva API de Interacciones de Google y está diseñada para brindar a los desarrolladores más control en la próxima era de la IA de los agentes.
La nueva herramienta Gemini Deep Research es un agente capaz de sintetizar montañas de información y procesar grandes volcados de contexto en indicaciones. Google dice que sus clientes lo utilizan para todo, desde diligencia debida hasta estudios de seguridad de toxicidad de medicamentos.
Google también anunció que el nuevo agente de investigación profunda pronto se integrará en servicios como Google Search, Google Finance, la aplicación Gemini y el popular NotebookLM. Este es otro paso en la preparación para un mundo donde los humanos no harán nada de Google y los agentes de inteligencia artificial sí lo harán.
El gigante tecnológico dice que Deep Research se beneficia del estatus de Gemini 3 Pro como el modelo «más basado en hechos», entrenado para minimizar las alucinaciones durante tareas complejas.
Las ilusiones de IA (que los LLM apenas están inventando) son un problema particularmente importante para las tareas de agentes de razonamiento profundo de larga duración, donde muchas decisiones autónomas se toman en minutos, horas o más. Cuantas más elecciones tenga que tomar el LLM, más probable será que una elección ilusoria invalide todo el resultado.
Para demostrar sus afirmaciones de progreso, Google también creó otro punto de referencia (como si el mundo de la IA necesitara otro punto de referencia). El nuevo punto de referencia, llamado de manera poco imaginativa DeepSearchQA, tiene como objetivo probar agentes en tareas complejas de exploración de información de varios pasos. Google ha abierto este punto de referencia.
evento de crisis tecnológica
san francisco
|
13-15 de octubre de 2026
También probamos una investigación profunda sobre la última prueba de la humanidad. Es un punto de referencia independiente de conocimiento general lleno de tareas increíblemente específicas con nombres mucho más interesantes. BrowserComp es un punto de referencia para tareas de agentes basados en navegador.
Como era de esperar, el nuevo agente de Google venció a la competencia tanto en sus propios puntos de referencia como en los de la Humanidad. Sin embargo, ChatGPT 5 Pro de OpenAI quedó en un segundo lugar sorprendentemente cercano, superando por poco a Google en BrowserComp.
Sin embargo, estas comparaciones de referencia se suspendieron en el momento en que Google las publicó. Porque el mismo día, OpenAI anunció el tan esperado GPT 5.2 (nombre en código Garlic). OpenAI dice que su último modelo supera a sus rivales, especialmente a Google, en una variedad de puntos de referencia típicos, incluidos los que desarrolló internamente.
Quizás uno de los aspectos más interesantes de este anuncio fue el momento. Sabiendo que el mundo estaba esperando el lanzamiento de Garlic, Google anunció algunas novedades sobre IA.
Source link
