Google lanza el agente de investigación de IA más profundo hasta la fecha; el mismo día OpenAI elimina GPT-5.2

Google lanzó el jueves una versión «reimaginada» de su agente de investigación Gemini Deep Research, que se basa en su muy publicitado modelo de plataforma de vanguardia Gemini 3 Pro.

Este nuevo agente no fue diseñado sólo para crear informes de investigación. Sin embargo, todavía es posible crear uno. Esto permite a los desarrolladores incorporar las capacidades de investigación del modelo SATA de Google en sus propias aplicaciones. Esta función está habilitada por la nueva API de Interacciones de Google y está diseñada para brindar a los desarrolladores más control en la próxima era de la IA de los agentes.

La nueva herramienta Gemini Deep Research es un agente capaz de sintetizar montañas de información y procesar grandes volcados de contexto en indicaciones. Google dice que sus clientes lo utilizan para todo, desde diligencia debida hasta estudios de seguridad de toxicidad de medicamentos.

Google también anunció que el nuevo agente de investigación profunda pronto se integrará en servicios como Google Search, Google Finance, la aplicación Gemini y el popular NotebookLM. Este es otro paso en la preparación para un mundo donde los humanos no harán nada de Google y los agentes de inteligencia artificial sí lo harán.

El gigante tecnológico dice que Deep Research se beneficia del estatus de Gemini 3 Pro como el modelo «más basado en hechos», entrenado para minimizar las alucinaciones durante tareas complejas.

Las ilusiones de IA (que los LLM apenas están inventando) son un problema particularmente importante para las tareas de agentes de razonamiento profundo de larga duración, donde muchas decisiones autónomas se toman en minutos, horas o más. Cuantas más elecciones tenga que tomar el LLM, más probable será que una elección ilusoria invalide todo el resultado.

Para demostrar sus afirmaciones de progreso, Google también creó otro punto de referencia (como si el mundo de la IA necesitara otro punto de referencia). El nuevo punto de referencia, llamado de manera poco imaginativa DeepSearchQA, tiene como objetivo probar agentes en tareas complejas de exploración de información de varios pasos. Google ha abierto este punto de referencia.

evento de crisis tecnológica

san francisco
|
13-15 de octubre de 2026

También probamos una investigación profunda sobre la última prueba de la humanidad. Es un punto de referencia independiente de conocimiento general lleno de tareas increíblemente específicas con nombres mucho más interesantes. BrowserComp es un punto de referencia para tareas de agentes basados en navegador.

Como era de esperar, el nuevo agente de Google venció a la competencia tanto en sus propios puntos de referencia como en los de la Humanidad. Sin embargo, ChatGPT 5 Pro de OpenAI quedó en un segundo lugar sorprendentemente cercano, superando por poco a Google en BrowserComp.

Sin embargo, estas comparaciones de referencia se suspendieron en el momento en que Google las publicó. Porque el mismo día, OpenAI anunció el tan esperado GPT 5.2 (nombre en código Garlic). OpenAI dice que su último modelo supera a sus rivales, especialmente a Google, en una variedad de puntos de referencia típicos, incluidos los que desarrolló internamente.

Quizás uno de los aspectos más interesantes de este anuncio fue el momento. Sabiendo que el mundo estaba esperando el lanzamiento de Garlic, Google anunció algunas novedades sobre IA.

Source link

What's Hot

Convertir la biomasa lignocelulósica en combustible sostenible para el transporte

SolarWinds Web Help Desk explotado por RCE en un ataque de varias etapas contra servidores públicos

Ya se aceptan nominaciones para Startup Battlefield 200 de 2026 | Crisis tecnológica

Google lanza el agente de investigación de IA más profundo hasta la fecha; el mismo día OpenAI elimina GPT-5.2

Ya se aceptan nominaciones para Startup Battlefield 200 de 2026 | Crisis tecnológica

Gather AI, fabricante de ‘curiosos’ drones de almacén, gana 40 millones de dólares liderados por la empresa de Keith Block

Bueno, estoy un poco menos enojado por el proyecto de IA «Magnificent Ambersons»

Convertir la biomasa lignocelulósica en combustible sostenible para el transporte

SolarWinds Web Help Desk explotado por RCE en un ataque de varias etapas contra servidores públicos

Ya se aceptan nominaciones para Startup Battlefield 200 de 2026 | Crisis tecnológica

Gather AI, fabricante de ‘curiosos’ drones de almacén, gana 40 millones de dólares liderados por la empresa de Keith Block

el último

TwinH Presenta una Tecnología Revolucionaria para Cocinas Inteligentes

¡Conoce a tu gemelo digital! La IA de vanguardia de Europa que está personalizando la medicina

TwinH: El cambio de juego de la IA para servicios legales más rápidos y accesibles

What's Hot

Google lanza el agente de investigación de IA más profundo hasta la fecha; el mismo día OpenAI elimina GPT-5.2

Related Posts