Las inundaciones repentinas son uno de los fenómenos meteorológicos más mortíferos del mundo y matan a más de 5.000 personas cada año. También son algunos de los más difíciles de predecir. Pero Google cree haber resuelto ese problema de una forma inesperada: leyendo las noticias.
Los seres humanos recopilan una gran cantidad de datos meteorológicos, pero las inundaciones repentinas son demasiado breves y localizadas para medirse de manera integral utilizando métodos de monitoreo a largo plazo de las temperaturas o incluso del caudal de los ríos. Esta brecha de datos significa que los modelos de aprendizaje profundo, que son cada vez más capaces de predecir el clima, no pueden predecir inundaciones repentinas.
Para resolver este problema, los investigadores de Google utilizaron Gemini (el modelo de lenguaje a gran escala de Google) para clasificar 5 millones de artículos de noticias de todo el mundo, aislar 2,6 millones de informes de inundaciones diferentes y convertirlos en series temporales geoetiquetadas llamadas «Groundsource». Gila Loike, gerente de producto de Google Research, dijo que esta es la primera vez que la empresa utiliza modelos de lenguaje para este tipo de trabajo. El estudio y el conjunto de datos se publicaron el jueves por la mañana.
Utilizando Groundsource como base de referencia del mundo real, los investigadores entrenaron un modelo construido sobre una red neuronal de memoria a corto plazo (LSTM) para ingerir pronósticos meteorológicos globales y generar probabilidades de inundaciones repentinas para regiones específicas.
Los modelos de predicción de inundaciones repentinas de Google actualmente revelan riesgos para áreas urbanas en 150 países en su plataforma Flood Hub, y la compañía comparte esos datos con agencias de respuesta a emergencias de todo el mundo. Antonio José Beleza, oficial de respuesta a emergencias de la Comunidad de Desarrollo de África Austral que probó el modelo predictivo con Google, dijo que el modelo ayudó a la organización a responder más rápidamente a las inundaciones.
El modelo todavía tiene limitaciones. En primer lugar, la resolución es bastante baja y permite identificar riesgos en un área de 20 kilómetros cuadrados. Los modelos de Google tampoco incorporan datos de radar locales que permitirían el seguimiento de las precipitaciones en tiempo real, lo que los hace menos precisos que el sistema de alerta de inundaciones del Servicio Meteorológico Nacional.
Sin embargo, un punto importante es que el proyecto fue diseñado para funcionar en lugares donde los gobiernos locales no pueden permitirse invertir en costosas infraestructuras de detección del clima o no cuentan con registros extensos de datos meteorológicos.
evento de crisis tecnológica
San Francisco, California
|
13-15 de octubre de 2026
Juliet Rosenberg, directora de programas del equipo de Resiliencia de Google, dijo a los periodistas esta semana que «los conjuntos de datos de Groundsource realmente nos ayudan a reequilibrar el mapa porque agregamos millones de informes». «Esto nos permite extrapolar a otras regiones donde no tenemos mucha información».
Rosenberg dijo que el equipo espera que el uso de LLM para desarrollar conjuntos de datos cuantitativos a partir de fuentes cualitativas escritas pueda aplicarse a los esfuerzos por crear conjuntos de datos para otros fenómenos temporales pero importantes para predecir, como olas de calor y flujos de escombros.
Marshall Mouteno, director ejecutivo de Upstream Tech, una empresa que utiliza modelos de aprendizaje profundo similares para predecir los caudales de los ríos para clientes como las empresas hidroeléctricas, dijo que la contribución de Google es parte de un esfuerzo creciente para recopilar datos para modelos de predicción meteorológica basados en el aprendizaje profundo. Moutenot cofundó Dynamical.org, un grupo que mantiene una colección de datos meteorológicos basados en aprendizaje automático para investigadores y empresas emergentes.
«La escasez de datos es uno de los desafíos más difíciles en geofísica», dijo Mutono. «Al mismo tiempo, tenemos demasiados datos sobre la Tierra y no suficientes cuando queremos compararlos con la verdad. Este fue un enfoque muy creativo para obtener esos datos».
Source link
