banner

Noticias

Sep 06, 2023

Predecir el rendimiento de la mitigación del cambio climático de las ciudades europeas mediante el aprendizaje automático

Nature Communications volumen 13, Número de artículo: 7487 (2022) Citar este artículo

4466 Accesos

31 Altmetric

Detalles de métricas

Si bien las ciudades han cobrado prominencia como actores climáticos, la escasez de datos de emisiones ha sido el principal desafío para evaluar su desempeño. Aquí desarrollamos un enfoque de aprendizaje automático replicable y escalable para evaluar el desempeño de la mitigación en casi todas las áreas administrativas locales de Europa entre 2001 y 2018. Al combinar datos ambientales y socioeconómicos espacialmente explícitos disponibles públicamente con datos de emisiones autoinformados de ciudades europeas, predecimos las emisiones anuales de dióxido de carbono para explorar las tendencias en el desempeño de la mitigación a escala de la ciudad. Encontramos que las ciudades europeas que participan en iniciativas climáticas transnacionales probablemente han reducido las emisiones desde 2001, y es probable que un poco más de la mitad haya alcanzado su objetivo de reducción de emisiones para 2020. Es más probable que las ciudades que reportan datos de emisiones hayan logrado mayores reducciones que aquellas que no reportan ningún dato. A pesar de sus limitaciones, nuestro modelo proporciona un punto de partida replicable y escalable para comprender el desempeño de mitigación de emisiones climáticas a nivel de ciudad.

En los últimos años, las ciudades han cobrado protagonismo en la agenda de políticas de sostenibilidad global, ya que los investigadores y los formuladores de políticas se han centrado cada vez más en las jurisdicciones urbanas como poderosos actores políticos por derecho propio. Más de 10 000 de las ciudades del mundo están prometiendo diversas formas de mitigación climática, adaptación y acciones de financiación, y en muchos casos estos municipios participan en múltiples iniciativas climáticas transnacionales voluntarias1. Como parte de los requerimientos de estas iniciativas, de acuerdo con las directivas del gobierno nacional2, o por voluntad propia, las ciudades articulan estrategias y políticas para abordar la mitigación del cambio climático y, con menor frecuencia, la adaptación. Las ciudades presentan predominantemente estrategias de mitigación centradas en objetivos de reducción de emisiones de gases de efecto invernadero, a menudo logrados a través de políticas enfocadas en aumentar el uso de transporte sostenible, mejorar la eficiencia de la iluminación en edificios públicos y municipales, adoptar estándares de eficiencia energética, promover la conciencia climática para alentar la acción ciudadana. , y otras áreas3,4.

Hay miles de estrategias y políticas actuales que detallan los esfuerzos de mitigación urbana, sin embargo, como señalan Milojevic-Dupont & Creutzig5, hay poca comprensión de los efectos de estas acciones. Estas brechas de conocimiento hacen que los formuladores de políticas estén "desorientados sobre qué medidas son adecuadas e impactantes" en las áreas urbanas e inseguros sobre qué "decisiones cotidianas" con respecto a la planificación o las inversiones en infraestructura deben tomarse para lograr los objetivos de mitigación. Poco se sabe sobre las reducciones de emisiones de las políticas y estrategias climáticas urbanas comunes, un bloque faltante de información vital reconocido en el Capítulo 12 sobre Asentamientos Humanos en el Quinto Informe de Evaluación (AR5) del Panel Intergubernamental sobre Cambio Climático (IPCC)5,6.

Los académicos han argumentado que la participación de las ciudades en la gobernanza climática transnacional "puede acelerar sus acciones para frenar las emisiones de GEI bajo ciertas condiciones"7. La evidencia que respalda esta afirmación es escasa, lo que dificulta predecir con precisión qué condiciones tendrían este efecto. Las iniciativas climáticas transnacionales generalmente requieren informes de planes de acción climática y monitoreo regular en forma de inventarios de emisiones para evaluar si se cumplen los objetivos de mitigación; sin embargo, en la práctica, solo una pequeña fracción de los actores subnacionales cumple con estos requisitos8,9. Hsu et al.10 descubrieron que de más de 9000 ciudades signatarias de la iniciativa del Pacto de los Alcaldes por el Clima y la Energía (EUCoM) de la UE, solo ~15 % había informado datos de emisiones, y aún menos (alrededor del 11 %) informó tanto un inventario de emisiones de referencia como un año adicional de datos de emisiones de inventario necesarios para seguir el progreso hacia los objetivos de reducción voluntaria. Cuando los datos de emisiones están disponibles, con frecuencia son incomparables debido a la disponibilidad limitada de puntos de datos, una falta general de transparencia con respecto a las metodologías subyacentes y la falta de enfoques contables estandarizados. Ibrahim et al.11 evaluaron siete protocolos y metodologías distintos de inventario de emisiones de gases de efecto invernadero a escala de ciudad y concluyeron que se necesita un estándar o enfoque de informes común para las ciudades. Las diferencias en las definiciones de los diversos estándares, por ejemplo, para los alcances de las emisiones, particularmente en las emisiones de la cadena de suministro del Alcance 3, deben abordarse para que los datos de las emisiones de los participantes puedan compararse adecuadamente.

Los avances recientes en el aprendizaje automático (ML), una clase general de enfoques de modelado estadístico no lineal y no paramétrico y algoritmos computacionales generalmente aplicados a conjuntos de datos a gran escala para simular el aprendizaje humano, podrían ayudarnos a superar estos complicados desafíos de datos de emisiones12. En este estudio, empleamos un enfoque basado en ML para estimar y evaluar el desempeño de mitigación de casi todos los actores locales y municipales en la Unión Europea y el Reino Unido desde 2001 hasta 2018. Nuestro método desarrolla un proceso para identificar límites espaciales y predictores geoespaciales. para cada gobierno local y municipal que participa en el EUCoM, una de las mayores iniciativas transnacionales voluntarias de gobernanza climática, y luego utiliza los datos del inventario de emisiones de carbono autoinformados de ~6000 ciudades del EUCoM como datos de entrenamiento en un modelo de aumento de gradiente extremo. Hasta donde sabemos, nuestro conjunto de datos resultante es el conjunto de datos de series temporales más completo utilizado para evaluar las emisiones de carbono a nivel de ciudad y el desempeño de la mitigación. Aplicamos estos datos para evaluar el desempeño de tres grupos de ciudades europeas: ciudades "informantes" que han informado al menos un año de datos de emisiones; ciudades "participantes" que han prometido acción climática voluntaria pero no han informado ningún dato de emisiones; y por último, ciudades "externas" que representan unidades administrativas locales (LAU) que no son participantes.

La Figura 1a muestra la correlación entre las variables dependientes a nivel de ciudad (es decir, "emisiones" autoinformadas) e independientes (es decir, grados día de calefacción, CO2 de combustibles fósiles, PIB per cápita, etc.). Encontramos una fuerte correlación positiva entre los datos del inventario de emisiones informados y las emisiones estacionarias de CO2 de combustibles fósiles del Inventario de datos abiertos para el dióxido de carbono antropogénico (ODIAC)13 (r2 = 0,81), así como entre las emisiones y la población (r2 = 0,89) . Las emisiones de CO2 de la población y de combustibles fósiles estacionarios también estuvieron altamente correlacionadas (r2 = 0,79), lo que confirma estudios previos que demuestran mediante el uso de la intensidad de las luces nocturnas las relaciones entre estos datos y el consumo de energía, la actividad económica y las emisiones de combustibles fósiles14. Nuestro análisis no mostró relaciones sólidas entre los datos de emisiones autoinformados y el PIB per cápita (r2 = 0,03) o con la contaminación del aire por partículas finas (PM2,5; r2 = 0). Determinamos que las emisiones de CO2 de combustibles fósiles estacionarios y la población eran los principales predictores de los datos de emisiones autoinformados de las ciudades con la mayor contribución o importancia para nuestro modelo de emisiones (Fig. 1b). La Figura 1b muestra el valor de ganancia de la importancia de cada una de las seis características principales que consideramos. Los valores de ganancia están determinados por la cantidad en que cada atributo dividido mejora el rendimiento del modelo, ponderado por el número de observaciones para el nodo. Consulte Métodos para obtener más información sobre el proceso de búsqueda de cuadrículas y el ajuste de parámetros para determinar el modelo final.

a Matrices de correlación que muestran la relación entre varios predictores de emisiones climáticas urbanas. b Importancia de varias variables predictoras para el modelo de predicción de emisiones. Cuanto más se utilice un atributo para tomar decisiones en el modelo XGBoost, mayor será la importancia de su función determinada.

Predijimos emisiones para alrededor de 92,636 ciudades o unidades administrativas locales (LAU) donde teníamos datos espaciales subyacentes (Tabla complementaria 2). La Figura 2 presenta diagramas de dispersión de los datos de emisiones autoinformados de las ciudades en comparación con los datos de emisiones previstos de nuestro modelo. El r2 = 0.91 resultante indica que nuestro modelo es fuertemente predictivo en general de los inventarios de emisiones autoinformados de las ciudades. Además, validamos nuestras emisiones pronosticadas con otros estudios que informan datos de emisiones para ciudades europeas, incluidos Moran et al.15, que estiman las emisiones directas (alcance 1) de 2018 para más de 100 000 ciudades europeas y Nangini et al.16, que combinan auto- informó inventarios con otros datos para 343 ciudades globales. Encontramos una correlación justa (r2 = 0,57 con Moran et al.15; r2 = 0,62 con Nangini et al.16) entre nuestros datos predichos y estos otros estudios (Figura complementaria 7). La Figura 2b también muestra los datos de emisiones autoinformados frente a los datos de emisiones pronosticados por país, lo que permite un examen más detallado de las posibles excentricidades en nuestro modelo o los datos pronosticados. Para algunos países, como Ucrania, nuestro modelo funciona peor (r2 = 0,02) y, para algunas ciudades en particular, las emisiones previstas son más altas que las que han informado las propias ciudades. Por ejemplo, nuestro modelo predice emisiones anuales casi tres veces más altas que las emisiones autoinformadas de Lyon. Una inspección más detallada de uno de estos valores atípicos, Lyon, una ciudad de 445 000 habitantes en Francia, informa un inventario de emisiones de alrededor de 22 000 toneladas, lo que se traduce en emisiones per cápita de <0,05 toneladas, muy por debajo del promedio nacional de 5,4 toneladas por persona17.

Diagrama de dispersión de emisiones autoinformadas (n = 6961 puntos de datos de emisiones autoinformadas de ciudades que informan al EUCoM utilizadas en la capacitación del modelo) en comparación con las emisiones medianas previstas para cada actor del modelo en una escala logarítmica. a Todos los inventarios de emisiones autoinformados (en toneladas logarítmicas de CO2) de todos los actores frente a los datos de emisiones previstas (en toneladas logarítmicas de CO2); b Facetas de país por país de las emisiones autoinformadas frente a las previstas donde había más de 1 punto de datos. El número de ciudades enumeradas en los paneles de países varía ligeramente de la Tabla complementaria 3, ya que la Tabla complementaria 3 incluye tanto las ciudades que informan datos de emisiones como las que no.

Utilizando datos de series de tiempo disponibles de predictores subyacentes, generamos rangos de emisiones anuales probables para todas las ciudades y unidades administrativas locales donde los datos estaban disponibles desde 2001 hasta 2018. Ilustrando el resultado de nuestro modelo, la Fig. 3 muestra series de tiempo para tres ciudades seleccionadas de diferentes tamaños de población: Waimes en Bélgica (población: 8932), Tolosa en España (población: 17.575) y Londres en el Reino Unido (población: 8,9 millones). Luego, estos datos se analizaron en busca de tendencias en la reducción anual de emisiones per cápita durante el período de 2001 a 2018 para las ciudades que participan en el EUCoM que informan datos de emisiones (ciudades que informan), aquellas que no informan (ciudades participantes) y para todas las LAU. en Europa (ciudades exteriores).

Se seleccionaron Waimes en Bélgica, Tolosa en España y Londres en el Reino Unido para representar ciudades con diferentes tamaños de población.

En general, encontramos que las ciudades EUCoM han reducido en promedio, probablemente, las emisiones anuales per cápita de 2001 a 2018 (−0,96 ± 1,88 %) y de 2005 a 2018 (−0,53 ± 3,3 %), en comparación con las ciudades externas que, en promedio, son probablemente no haya experimentado muchos cambios en las emisiones (0,18 ± 2,5 % de 2001 a 2018 y 0,18 ± 3,2 de 2005 a 2018; Tabla 1). Si bien es probable que el 74 % de las ciudades del EUCoM hayan reducido sus emisiones, es probable que solo el 53 % de las ciudades externas hayan experimentado una tendencia negativa en la reducción de emisiones. Sin embargo, interpretamos estas diferencias de tendencias de emisión entre las ciudades EUCoM y las LAU externas con cautela, observando las diferencias más notables en la población entre EUCoM (32 720 ± 181 348 habitantes para las ciudades informantes; 35 318 ± 171 para las ciudades participantes) y las LAU externas, que tienden a ser en promedio mucho más pequeño (4433 ± 16,870 habitantes) (Tabla complementaria 2; Figura complementaria 6). Las estadísticas descriptivas (Tabla complementaria 2) y las distribuciones (Figura complementaria 6) que describen los tres grupos de ciudades en nuestro análisis ilustran que las ciudades de EUCoM tienden a tener emisiones estacionarias de dióxido de carbono de combustibles fósiles más considerables y tienen una población y una densidad de población más grandes que las externas. ciudades, lo que podría explicar las diferencias en sus tendencias de emisiones, ya que se ha demostrado que las ciudades más grandes con niveles más altos de PIB per cápita tienen planes climáticos más ambiciosos2,18.

Dentro de las ciudades de EUCoM, encontramos que es probable que las ciudades con datos de inventario de emisiones autoinformadas (75% de las ciudades de EUCoM) hayan logrado mayores reducciones promedio de emisiones en comparación con las ciudades participantes que no han informado una línea de base o un inventario de emisiones de monitoreo (−1.3 ± 1.7 vs. 0,2 ± 1,9 reducciones anuales de emisiones per cápita entre 2001 y 2018 (Tabla 1). Estos resultados sugieren que es probable que las ciudades participantes de EUCoM hayan logrado el mismo desempeño de mitigación que las ciudades externas. Es probable que las ciudades del EUCoM que se han comprometido a objetivos de mitigación relativamente más ambiciosos, superando el objetivo de mitigación de la UE para 2020 de una reducción del 20 % con respecto a los niveles de 1990, hayan logrado mayores reducciones de emisiones per cápita anualizadas en comparación con las ciudades con un objetivo de mitigación relativamente menos ambicioso (−1,4 ± 1,7 vs −0,6 ± 0,20 de 2001 a 2018 (tabla 1). Por último, es probable que las ciudades de la EUCoM estén en camino (p. ej., reduciendo suficientemente las emisiones de acuerdo con las emisiones requeridas para alcanzar su objetivo de reducción de emisiones declarado para 2020, consulte Métodos para obtener más detalles) para lograr sus objetivos de reducción de emisiones para 2020 (52 % de las ciudades de la EUCoM) probablemente hayan experimentado las mayores reducciones de emisiones (−1,8 ± 2,5 vs. 0,5 ± 1,6 de 2001 a 2018; Tabla 1). Las ciudades EUCoM que no van por buen camino (48 % de las ciudades EUCoM) probablemente hayan experimentado un ligero crecimiento en las emisiones anuales per cápita.

Si bien carecemos de controles y datos suficientes para aislar causalmente si la participación en el EUCoM condujo a estas tendencias de mitigación de emisiones, un análisis de series de tiempo interrumpido (ITS), que modela si una intervención o programa de política puede haber resultado en un cambio medible en una variable de resultado después de su implementación19,20, puede arrojar algo de luz sobre si las reducciones de emisiones de las ciudades de EUCoM ocurrieron principalmente después de que se unieron a la iniciativa, lo que explica las diferencias en la densidad de población, el PIB per cápita, etc. (consulte Métodos para obtener más detalles). Encontramos que cada año posterior a la adhesión de una ciudad a la iniciativa EUCoM se asocia con un ligero cambio porcentual anual de −0,164 (error estándar, o se: 0,039) en las emisiones per cápita (Fig. 4). Al confirmar nuestra comparación entre grupos de ciudades (Tabla 1), la regresión ITS demuestra aún más la importancia de un inventario de emisiones (p < 0,01), donde las ciudades informantes probablemente hayan logrado un cambio porcentual anual de −1,24 (se: 0,396) en las emisiones per cápita ( Tabla 2). El nivel del objetivo de reducción de emisiones para 2020, aunque levemente significativo (p < 0,05), no parece tener mucho efecto adicional en el cambio porcentual anual de las emisiones per cápita (Cuadro 2).

Cambio porcentual anual per cápita en las emisiones para las ciudades de EUCoM (puntos trazados) con cambio porcentual anual per cápita previsto en las emisiones determinado por análisis de series de tiempo interrumpido (línea azul). Los paneles incluyen datos de las ciudades que se unieron al EUCoM solo en ese año específico, indicado por las líneas verticales rojas.

Observamos diferencias en el desempeño por país. Las figuras 5 y 6 comparan el desempeño de las ciudades participantes de EUCoM frente a todas las demás LAU por país. En algunos países, las ciudades EUCoM, como las de Suecia y Dinamarca, en promedio han tenido tendencias de reducción per cápita anuales más altas que sus contrapartes de ciudades externas. En otros, como los Países Bajos y el Reino Unido, las ciudades EUCoM parecen tener un desempeño inferior al de otras ciudades (Fig. 4), como se evidencia al comparar las distribuciones de reducciones anuales de emisiones per cápita para ambos grupos de ciudades. Este resultado puede reflejar el hecho de que los gobiernos nacionales de Dinamarca y el Reino Unido requieren planes de acción climática locales de los municipios2, lo que sugiere que las ciudades externas en estos países pueden estar reduciendo las emisiones para cumplir con las regulaciones y requisitos nacionales. Italia y España, donde se encuentran la mayoría de las ciudades de EUCoM, parecen tener un rendimiento relativamente comparable para ambos grupos (Italia = 64 %; España = 50 %; Cuadro complementario 3). Los países escandinavos lideran en términos de países con la mayor proporción de ciudades en camino (80% en Dinamarca, 53% en Finlandia y 70% en Noruega). España también cuenta con una gran proporción de ciudades encaminadas, con un 68%. Los países donde las ciudades se desempeñan de manera similar están más cerca de la línea diagonal en la figura complementaria 8, lo que sugiere que las tendencias de reducción de emisiones per cápita anuales promedio son similares entre EUCoM y ciudades externas. Los países por encima de la diagonal son aquellos en los que las ciudades de EUCoM han logrado mayores reducciones anuales de emisiones per cápita que sus contrapartes que no pertenecen a EUCoM e incluyen países como Finlandia, Eslovaquia, Francia, Alemania, Italia, entre otros.

Tendencia anual de reducción de emisiones per cápita de 2001 a 2018 para las ciudades que participan en el EUCoM (izquierda) y todas las demás ciudades externas (derecha).

Distribuciones de reducciones anuales de emisiones per cápita entre ciudades de la EUCoM y ciudades externas. Los números negativos indican reducciones de emisiones y las tendencias medias anuales de emisiones per cápita para cada grupo se designan con líneas verticales en cada panel.

A pesar de un aumento medible en la erudición sobre la gobernanza climática urbana durante la última década, han persistido las brechas en la comprensión de los resultados de las iniciativas climáticas transnacionales, particularmente para las ciudades más pequeñas y de manera sistemática21. Parte de esta brecha se debe a la disponibilidad y comparabilidad de los datos, que limitan la capacidad de los investigadores para rastrear los impactos causales o los vínculos entre los procesos y las instituciones de las iniciativas transnacionales de gobernanza climática urbana y los resultados21,22. Para abordar esta deficiencia, este estudio ha desarrollado un marco basado en el aprendizaje automático (ML) para predecir las emisiones de más de 90 000 ciudades europeas anualmente desde 2001 hasta 2018 para examinar las posibles tendencias de desempeño de mitigación. Mediante el uso de variables predictoras espacialmente explícitas y cuadriculadas a nivel mundial que se miden de manera consistente y regular y los inventarios de emisiones autoinformados disponibles, nuestro modelo basado en ML puede explicar el 90% de la variación (r2 = 0.90) entre los datos de inventario de emisiones autoinformados de registrar ciudades EUCoM y valores de emisiones previstos, validados a través de comparaciones con otros estudios que han producido estimaciones de emisiones de carbono a nivel de ciudad para un solo año. No sin sus limitaciones (ver Limitaciones), nuestro modelo proporciona un punto de partida replicable y escalable para comprender el desempeño de mitigación de emisiones climáticas a nivel de ciudad. También proporciona un método para evaluar y validar las emisiones autoinformadas de las ciudades. Dado que algunas ciudades pueden informar inventarios erróneamente o elegir informar de forma selectiva las fuentes de emisiones, nuestro enfoque puede ayudar a detectar valores atípicos o posibles problemas de informes.

A partir de los datos de emisiones previstas de nuestro modelo, examinamos las tendencias anuales de emisiones per cápita que revelaron información que justifica una mayor exploración. En primer lugar, de las aproximadamente 8000 ciudades europeas que participan en una de las iniciativas climáticas transnacionales voluntarias más grandes, el Pacto de los Alcaldes por el Clima y la Energía de la UE (EUCoM), es probable que la mayoría (74 %) haya reducido las emisiones entre 2001 y 2018, con poco más de la mitad de probabilidades de haber alcanzado su objetivo de reducción de emisiones para 2020. Es probable que las ciudades que autoinforman datos de emisiones hayan reducido más que las ciudades que no han informado datos de emisiones, un hallazgo que podría deberse al hecho de que, como encontró Rivas et al.23, los municipios de EUCoM que monitorean las emisiones tienden a tener también comenzaron a implementar planes antes y, por lo general, son los "principales" con más experiencia en acción climática23. Es probable que las ciudades con metas de mitigación más ambiciosas y las que están en camino de lograr sus metas de mitigación para 2020 hayan logrado las mayores reducciones anuales de emisiones per cápita en comparación con sus contrapartes. Nuestros hallazgos aquí se hacen eco de los resultados de estudios previos de ciudades EUCoM10,23,24. Kona et al.24, por ejemplo, analizaron 315 ciudades informantes y encontraron que habían reducido las emisiones en un 23% en promedio, mientras que nuestros resultados son comparables (~1% de emisiones per cápita anualizadas de 2001 a 2018). En nuestro estudio de 2020 de 1066 ciudades de EUCoM que informaron al menos dos inventarios de emisiones, encontramos que el 60 % está en camino de alcanzar sus objetivos de reducción de emisiones, mientras que este estudio encontró resultados similares con el 52 % de las ciudades de EUCoM que probablemente hayan alcanzado sus objetivos de mitigación de 2020. Rivas et al.23 sugieren que la ambición y el monitoreo pueden estar vinculados: los municipios que tienden a ser más ambiciosos en sus objetivos tienden a no haber informado inventarios de monitoreo, haciéndose eco de Hsu et al.10 al encontrar una desconexión entre la ambición y el desempeño.

Si bien nuestro estudio no habla de los mecanismos causales de las tendencias de emisión pronosticadas, ni si existen condiciones endógenas que puedan explicar por qué las ciudades de EUCoM han experimentado en promedio reducciones anuales per cápita ligeramente mayores que sus contrapartes externas fuera de EUCoM, sí sugiere algunas ideas. relevante para la gobernanza climática urbana y las iniciativas climáticas transnacionales. Primero, dado que los inventarios de emisiones y los protocolos de monitoreo se consideran sellos distintivos de los planes efectivos de mitigación climática de los gobiernos locales25, la capacidad de monitorear y reportar las emisiones son indicadores probables de capacidad y logro. Medimos diferencias significativas en las reducciones de emisiones per cápita anualizadas entre las ciudades informantes y las ciudades participantes que no informan ningún dato de emisiones, que probablemente sean más similares a las ciudades externas de la UE en sus trayectorias de emisiones en comparación con las ciudades informantes. En segundo lugar, si bien la evaluación de las tendencias de las emisiones como una variable de resultado no proporciona una "medida del esfuerzo"26 ni describe la miríada de insumos y factores que han llevado a un resultado particular, el seguimiento y la notificación de los inventarios de emisiones indican un "medio de implementación"26 para evaluar el progreso de una entidad hacia un resultado de política como la mitigación climática. Estos hallazgos con respecto a los vínculos entre el monitoreo y el desempeño tienen implicaciones para impulsar mejoras en la mitigación del clima a nivel subnacional, lo que sugiere que las inversiones en el monitoreo son un predictor probable del éxito. Rivas et al.23 encontraron que las probabilidades de monitorear las emisiones son 2,24 veces mayores cuando una autoridad local brinda apoyo financiero para la implementación de un plan climático.

Los datos que describen los resultados de la mitigación luego permiten la identificación de las "condiciones generales de implementación exitosa" y la ingeniería inversa de las vías causales que condujeron a las reducciones de emisiones. Nuestro conjunto de datos y el marco ML replicable y escalable pueden proporcionar un primer paso para desentrañar qué medidas específicas, o ninguna, condujeron a las reducciones de emisiones observadas. Dado que nos limitamos a datos sobre la población de las ciudades, el PIB, la contaminación del aire y las emisiones de CO2 de combustibles fósiles, nuestro análisis no puede dar cuenta de otras diferencias estructurales subyacentes (por ejemplo, variación en las instituciones de gobierno, etc.) que pueden dilucidar aún más las diferencias en las emisiones. resultados, ya que la acción y las políticas sobre el cambio climático están "profundamente entrelazadas con otras agendas de políticas".

Dado que la disponibilidad de datos de inventarios de emisiones autoinformados a nivel subnacional se limita principalmente a Europa, los estudios futuros deben ampliar la búsqueda de conjuntos de datos relevantes y sustitutos que puedan llenar este vacío, en particular para las entidades con capacidad y recursos limitados en el Sur Global29 ,30,31. Los actores en estos países enfrentan limitaciones (p. ej., experiencia, falta de roles claramente designados en las agencias gubernamentales relevantes para producir inventarios, documentación y sistemas de archivo insuficientes) y problemas técnicos (p. ej., datos de actividad incompletos o inexistentes o falta de datos experimentales para desarrollar países o factores de emisión específicos de la tecnología) para producir inventarios de emisiones10,32. Nuestro próximo paso es expandir nuestro enfoque a un conjunto de jurisdicciones subnacionales fuera de Europa para producir un conjunto de datos global para las ciudades que participan en iniciativas climáticas transnacionales, según lo registrado en el conjunto de datos de Hsu et al.1 de más de 10,000 ciudades y gobiernos regionales. Encontramos evidencia convincente de que los conjuntos de datos geoespaciales a gran escala se pueden aplicar para estimar las emisiones de dióxido de carbono a nivel de ciudad, incluso para los actores de ciudades pequeñas que comprenden la mayoría de los participantes en el EUCoM, aunque más datos y un alcance ampliado pueden hacer una mejor prueba de estrés. aplicabilidad del modelo más allá de Europa. Nuestro método cierra la brecha entre estos conjuntos de datos geoespaciales derivados de sensores remotos disponibles a nivel mundial para los actores a escala de ciudad, una deficiencia que Pan et al.33 señalan en los conjuntos de datos de CO2 de combustibles fósiles como el inventario ODIAC, que distribuye principalmente las emisiones nacionales de CO2 de combustibles fósiles. espacialmente basados ​​en mediciones satelitales de la intensidad de la salida de luz, y que pueden no atribuir correctamente las emisiones a los actores subnacionales. Por último, se requiere más investigación que evalúe en profundidad las políticas de mitigación que adoptan diferentes grupos de ciudades para lograr reducciones de emisiones y resultados de mitigación para informar la planificación urbana y el desarrollo de políticas climáticas futuras.

Este estudio ciertamente no está exento de limitaciones. Existen algunas áreas de incertidumbre que podrían afectar la validez de nuestras predicciones y resultados. Primero, asumimos que los inventarios de emisiones autoinformados por los actores de EUCoM son una fuente válida de datos para entrenar nuestro modelo y predecir las emisiones de otros. Utilizamos el conjunto de datos "verificados" de datos de emisiones autoinformados para 6200 ciudades que habían informado datos de inventario de emisiones evaluados por el Centro Conjunto de Investigación de la Comisión Europea34. Aunque Kona et al.34 aplicaron una serie de verificaciones estadísticas para validar estos inventarios de emisiones informados, señalan varias limitaciones. Dado que el EUCoM se centra en las emisiones de gases de efecto invernadero relacionadas con sectores en los que una autoridad local tiene poder para influir a través de medidas sectoriales y políticas, las ciudades participantes solo informan las emisiones de fuentes seleccionadas (p. ej., consumo de energía para edificios, transporte y generación local de energía, fuentes industriales que aún no están cubiertas por el Esquema de Comercio de Emisiones de la UE, y desechos/aguas residuales. emisiones ya incluidas en las iniciativas de control a escala nacional, como los mecanismos del Sistema de Comercio de Emisiones (ETS) de la UE". Por lo tanto, una segunda limitación es que hay fuentes y sectores de emisiones que podrían faltar en los inventarios de las ciudades de EUCoM, particularmente si una ciudad no no tienen la capacidad para medir esas emisiones o consideran que ciertas fuentes de emisiones no son de importancia material para fines de gestión. En tercer lugar, el uso de diferentes factores de emisión, metodologías de estimación y límites de informes por parte de las ciudades que informan agregan incertidumbre al uso de sus inventarios como datos de capacitación, y descubrimos que algunos "valores atípicos" de predicción podrían atribuirse al hecho de que los datos autoinformados iniciales los datos de emisiones podrían ser el resultado de un error de cálculo o notificación por parte de la propia ciudad23. Rivas et al.23 señalan esta limitación, particularmente con respecto a los datos que a veces se informan con factores de emisión faltantes, que luego deben completarse con factores nacionales o regionales y podrían afectar la precisión de la estimación final23. En cuarto lugar, asumimos que los límites espaciales de EUCoM y las ciudades externas permanecen estáticos durante el período de tiempo, mientras que estos pueden haber cambiado con el tiempo. Si los límites han cambiado o están identificados o emparejados incorrectamente con una ciudad, sus predicciones podrían ser inexactas. En quinto lugar, si bien observamos diferencias significativas entre las emisiones de diferentes ciudades, puede haber algunas diferencias fundamentales entre estos grupos de ciudades que darían cuenta del desempeño de mitigación que nuestro modelo no puede determinar (p. ej., si las ciudades que informan EUCoM son fundamentalmente diferentes de las que no -ciudades informantes o no participantes en términos de geografía, cultura o gobierno que impulsarían sus tendencias de emisiones).

Por último, existen limitaciones en los enfoques basados ​​en el aprendizaje automático para la predicción, que han sido identificados y clasificados por Kapoor y Narayanan36. Dado que los enfoques de aprendizaje automático son inherentemente estocásticos37, la introducción de la aleatoriedad para mejorar la generalización del modelo, que se considera una ventaja de los enfoques de ML en comparación con los métodos de regresión gaussiana tradicionales, pone en riesgo la reproducibilidad potencial de un modelo36. Nuestras estimaciones, por lo tanto, solo representan un nivel medio de emisiones de arranque probable utilizando los parámetros específicos ajustados en la submuestra de entrenamiento y establecidos en una semilla particular o inicialización por el entorno informático. En particular, nuestras predicciones de LAU que no reportan datos de emisiones deben interpretarse con la advertencia principal de que asumimos las relaciones entre las predicciones subyacentes que nuestro modelo ha descubierto para las ciudades que reportan datos de emisiones para estas otras ciudades. Sin embargo, reconocemos que esta es una advertencia importante para nuestros resultados, pero que el objetivo principal de nuestro estudio es explorar las fortalezas y limitaciones potenciales de un enfoque de ML para desarrollar un modelo de predicción generalizable para las emisiones a nivel de ciudad que podría aplicarse. fuera de Europa, dados los datos adicionales de emisiones de ciudades no europeas.

A pesar de estas limitaciones, esta investigación es un primer paso para abordar la "falta de conocimiento sistemático sobre las contribuciones globales de las ciudades al Acuerdo de París",25 que reconoce el papel de "todos los niveles de gobierno"38 y busca información específica sobre sus impactos39. Pocos actores de la ciudad que participan en iniciativas climáticas transnacionales informan datos de monitoreo e inventario, e incluso las principales ciudades que afirman ser líderes climáticos mundiales están ausentes de los informes9,10,25,40. Nuestro estudio proporciona un enfoque consistente y datos de series temporales para investigar las tendencias y el desempeño de la mitigación a escala de ciudad, con potencial para ampliar el alcance a áreas fuera de Europa.

Los datos de emisiones comparables y generalizados son esenciales para respaldar el modo "facilitador y catalítico"41 del Acuerdo de París y su mecanismo de "compromiso, revisión y trinquete" diseñado para evaluar continuamente el progreso y las contribuciones de los actores nacionales y subnacionales a los esfuerzos globales de mitigación42. Para que se produzcan ciclos catalíticos virtuosos que respalden este proceso, se necesitan datos de emisiones para evaluar qué acciones son efectivas para impulsar la mitigación y qué entidades están logrando reducciones.

Los datos de las ciudades que participan en EUCoM se recopilaron de dos fuentes: Kona et al.34, que proporciona una "versión verificada y armonizada" de los datos de EUCoM para 6200 ciudades miembros a fines de 2019, y el sitio web de EUCoM. El conjunto de datos de Kona et al.34 para las ciudades de EUCoM incluye datos de emisiones autoinformados (p. ej., inventarios de emisiones de referencia o de seguimiento), así como otros datos característicos de las ciudades de la Agencia Europea de Estadística. Complementamos este conjunto de datos con datos más recientes para ciudades del sitio web de EUCoM, que se rasparon utilizando el paquete Beautiful Soup Python43 en febrero de 2021. Principalmente recopilamos información sobre la fecha de adhesión de cada ciudad a la iniciativa EUCoM, año de emisiones de referencia, emisiones de referencia ( en toneladas de emisiones de dióxido de carbono o tCO2), objetivo de reducción de emisiones, año objetivo y cualquier emisión de inventario informada (es decir, datos de emisiones informados en un año posterior al año de referencia definido, de la página de Progreso de cada ciudad). También obtuvimos información sobre la población de las ciudades y las coordenadas geográficas (latitud/longitud) del sitio web de EUCoM, si está disponible. Dado que Kona et al.34 aplican una serie de técnicas estadísticas para validar su conjunto de datos, priorizamos los datos de emisiones autoinformados de esta fuente si había datos disponibles para una ciudad tanto en Kona et al.34 como en el sitio web de EUCoM. La Fig. 1 complementaria muestra un diagrama de dispersión de los datos de emisiones registrados tanto del sitio web de EUCoM como de Kona et al.34, que ilustra una fuerte correlación (r2 = 0,986). En total, nuestro conjunto de datos contenía nombres de 7805 ciudades que participan en la iniciativa EUCoM, con 6114 reportando cualquier información de emisiones. También imputamos un objetivo de reducción de emisiones del 20 % para 2020 si no se informó ningún objetivo de reducción de emisiones específico en Kona et al.34 o en el sitio web de EUCoM a los fines del análisis de seguimiento del progreso descrito en nuestro estudio anterior10.

Un primer paso importante en la construcción de nuestro modelo predictivo de emisiones fue determinar un conjunto de predictores subyacentes de emisiones de carbono a nivel de ciudad que estarían disponibles universalmente para todas las ciudades EUCoM y LAU en Europa. Evaluamos varios predictores de emisiones urbanas de gases de efecto invernadero para incluirlos como predictores en nuestro modelo, en base a la literatura existente sobre las principales fuentes e impulsores de los perfiles de emisión de las ciudades6,44,45,46. En términos de fuentes de emisión, el sector energético, específicamente la conversión de energía en electricidad, es la mayor fuente de emisiones urbanas de gases de efecto invernadero, y comprende alrededor de la mitad hasta el 65 % de las emisiones urbanas totales, seguido por el sector del transporte (15–20 %). 44. Dado que las fuentes estacionarias no explican las emisiones de gases de efecto invernadero de la ciudad en su totalidad, también investigamos otros indicadores indirectos de las principales fuentes de emisiones, incluida la demanda de calefacción y refrigeración, y las variables de contaminación del aire, como la contaminación del aire por partículas finas, que en las ciudades resulta principalmente del transporte (~ 25%47), polvo y óxidos de azufre (SO2, SO4). También incluimos la población y el producto interno bruto (PIB) como impulsores socioeconómicos relevantes de las emisiones climáticas urbanas6, y evaluamos algunos predictores a nivel de país, según nuestro estudio anterior10 que encontró que las reducciones de emisiones a nivel nacional eran predictores del desempeño del cambio climático a nivel de ciudad , incluida la tendencia de las emisiones de CO2 a nivel de país (2000-2018)17 y la intensidad de carbono de la generación de electricidad para la Unión Europea48.

Dado que los datos de emisiones de alta resolución como resultado de la producción y el consumo de electricidad no están disponibles para la gran mayoría de las ciudades incluidas en nuestro análisis, confiamos en la base de datos del Inventario de datos abiertos para el dióxido de carbono antropogénico (ODIAC), que proporciona una cuadrícula global. , datos anuales de resolución espacial de 1 km × 1 km de las emisiones de dióxido de carbono de la quema de combustibles fósiles, la producción de cemento y la quema de gas desde 2000 hasta 201949. Seleccionamos el conjunto de datos ODIAC en función de una evaluación previa de su relevancia para el análisis de emisiones de carbono a nivel urbano. como se describe en Hsu et al.10.

Como sustitutos del consumo de energía del edificio debido a la calefacción y la refrigeración, descargamos datos de temperatura de la superficie terrestre con resolución espacial promedio mensual (0,5 × 0,625 grados o 55,5 × 69,375 km) del producto de temperatura MERRA-2 de la NASA50 y luego calculamos los grados día de calefacción y refrigeración (HDD y CDD, respectivamente) según la cantidad de mediciones promedio mensuales que se desvían de una temperatura de referencia, \({T}_{{base}}\), que luego se multiplicaron según la cantidad de días en cada mes respectivo (es decir, asumiendo el mismo HDD o CDD para cada día del mes) y luego se suman a lo largo de un año, de acuerdo con las ecuaciones. (1–2) a continuación:

donde \({T}_{{base}}=\)15,5 grados C para HDD y \({T}_{{base}}\)= 22 grados C para CDD41 y \({m}\) es el mes. Para el modelo de la UE, excluimos los grados día de enfriamiento ya que el 99 % de las ciudades europeas tenían 0 cdd.

Incluimos datos de contaminación del aire extraídos de recursos de teledetección satelital. Incluimos la exposición anual, cuadriculada (~1 km) a la contaminación por partículas finas (PM2.5) para los años 2001–202051, ya que la contaminación por PM2.5 se genera a partir de fuentes similares a las emisiones de carbono en áreas urbanas, principalmente la combustión de combustibles fósiles a partir de la electricidad. generación y transporte52. También extrajimos varias variables relevantes de contaminación del aire del sensor MERRA-2, incluida la concentración de masa superficial de polvo (DUSMASS), la concentración de masa superficial de carbono negro (BCSMASS), la concentración de masa superficial de dióxido de azufre (SO2SMASS) y la concentración de masa superficial de sulfato (SO4SMASS) .

Evaluamos algunos predictores a nivel de país, con base en un estudio anterior10 que encontró que las reducciones de emisiones a nivel nacional eran predictores del desempeño del cambio climático a nivel de ciudad, incluida la tendencia de emisiones de CO2 a nivel de país (2000–2018)17 y la intensidad de carbono de la electricidad. generación para la Unión Europea53, aunque nuestro modelo final no incluyó estas variables, ya que no contribuyeron significativamente a la importancia de la característica para nuestro modelo (Fig. 1b).

Además, consideramos la población y el producto interno bruto (PIB) como impulsores socioeconómicos relevantes de las emisiones climáticas urbanas6. Para la población, utilizamos el conjunto de datos Gridded Population of the World (GPW)54, que proporciona estimaciones de población con una resolución espacial de 1 km para incrementos de cinco años desde 2000 hasta 2020. Calculamos las estimaciones de población anual interpolando linealmente entre estos datos de cinco años. incrementos Para el PIB, utilizamos datos de PIB per cápita cuadriculados anualmente a nivel mundial con una resolución espacial de 1 km de Kummu et al.55, que proporciona datos de 1990 a 2015. Unimos espacialmente cada LAU a su correspondiente Nomenclatura de Unidades Territoriales para Estadísticas o NUTS (Nivel 3), para la Unión Europea su Unidad Territorial Internacional, para derivar un producto regional bruto (PRB) de la Agencia Estadística Europea56. Dado que los valores NUTS3 GRP tienen un área ligeramente más amplia que un LAU, usamos la tasa de cambio anual de 2016 a 2018 aplicada a los datos del PIB de Kummu para cada LAU para que coincida con la serie temporal de los otros predictores espaciales.

Dado que el formato original de estas variables predictoras (p. ej., emisiones de CO2 de combustibles fósiles) son todos datos espaciales cuadriculados, fusionamos estos conjuntos de datos con cada ciudad de EUCoM a través de uniones espaciales. Primero recopilamos la latitud y la longitud del centroide de cada ciudad según lo proporcionado por las diversas fuentes de datos. Cuando los centroides de la ciudad no estaban disponibles en Kona et al.34, el sitio web del Pacto de los Alcaldes de la UE, o determinamos errores en las coordenadas geográficas de cualquiera de estas fuentes, extrajimos los centroides de la ciudad a través del sitio web GeoHack de Wikipedia.

Para determinar los límites espaciales de cada ciudad, utilizamos distintos enfoques que se describen a continuación. Para la mayoría de las ciudades, recopilamos datos para unidades administrativas locales (LAU), que se definen como "divisiones administrativas de bajo nivel de un país por debajo de una provincia, región o estado", para los 28 países de la Unión Europea de la Unión Europea. Agencia de Estadística de la Unión57. Los datos LAU se unieron espacialmente a nuestro marco de datos de ciudades EUCoM en Python utilizando el paquete geopandas58 para asociar cada ciudad con un límite LAU con el fin de hacer coincidir variables predictoras adicionales. Implementamos una serie de controles de calidad para garantizar que las uniones espaciales se realizaran correctamente y para identificar cualquier problema en las coordenadas geográficas que pudiera haberse especificado incorrectamente en el sitio web del Pacto de la UE. Estos controles de calidad incluyen (1) evaluar si las ciudades tienen las mismas coordenadas geográficas pero se identifican con nombres distintos; (2) comparar la población informada en el sitio web de Kona et al.34 o EUCoM para un actor individual y la población interpolada después de la unión espacial; (3) examinar cualquier ciudad con emisiones per cápita autoinformadas <0,2 toneladas por persona o >40 toneladas por persona; (4) la tasa de crecimiento anual compuesta de las emisiones es >−50 % y <50 %. Estas comprobaciones nos permitieron determinar si había algún error en la unión espacial o en los datos subyacentes recopilados para las ciudades de EUCoM de Kona et al.34 o del sitio web de EUCoM.

Donde las correcciones manuales a las LAU tampoco dieron como resultado uniones espaciales correctas, utilizamos OpenStreet Map (OSM)59 para obtener el límite correcto, particularmente para las grandes ciudades que pueden abarcar más de una LAU. La Fig. 2 complementaria ilustra algunos ejemplos de los resultados de unión espacial incorrectos y los límites fijos con OSM. Después de verificar los límites de las ciudades, aplicamos estadísticas zonales utilizando el paquete de Python rasterstats versión 0.15.060, donde cada variable predictora se resumió para cada ciudad utilizando su límite espacial. Con base en la definición de las variables predictoras, calculamos los valores medios, excepto la población, donde calculamos la suma de todos los píxeles que intersecan con cada ciudad o límite LAU.

Las ciudades que participan en el EUCoM deben presentar un Plan de Acción de Energía Sostenible (y Clima)" (SE(C)AP) que incluye un inventario de emisiones de línea de base y un inventario de monitoreo cada dos años después de eso. Sin embargo, en el momento de los datos En febrero de 2021, de los casi 10 000 signatarios que figuran en el sitio web, solo 6114 actores habían informado datos de emisiones, y solo 1400 habían informado más de un año de datos de monitoreo de emisiones. Solo incluimos datos de ciudades con una población interpolada mayor que el percentil 5 (374 habitantes) de la distribución de la población de las ciudades. En total, 329 ciudades tenían poblaciones por debajo de este umbral y no se incluyeron en los conjuntos de datos de entrenamiento o predicción. De acuerdo con Hsu et al. (2020), también filtramos los puntos de datos que informaron <0,2 toneladas de CO2 por persona o >40 toneladas de CO2 por persona. El período de tiempo para los datos de emisiones autoinformados osciló entre 1990 y 2020, pero solo usamos datos > 2000 (5880 actores únicos con 6961 puntos de datos de emisiones) para el entrenamiento del modelo ya que este es el período de tiempo disponible para las variables predictoras.

Además, dividimos nuestros datos en tres subconjuntos: el primer subconjunto utilizado como datos de capacitación incluye todas las ciudades de EUCoM que tienen al menos un año de datos de emisiones informados, ya sea sus emisiones de referencia o un año de inventario posterior de datos informados (EUCoM, 2021); un segundo subconjunto son ciudades que participan en el EUCoM pero no han informado ningún dato de emisiones; el tercer subconjunto son ciudades que no participan en el EUCoM. El primer subconjunto de datos de emisiones notificados al EUCoM se utiliza como datos de entrenamiento para predecir las emisiones de los dos últimos subconjuntos de datos. Aplicamos el modelo construido con el primer conjunto de datos a estas ciudades y predijimos su emisión probable de un año determinado. La Fig. 3 complementaria proporciona un diagrama de flujo de los pasos de procesamiento descritos anteriormente. Nuestros conjuntos de datos de entrenamiento y prueba se generaron en base a una división estándar de 80/20 de los datos mientras se preservaba la representación subyacente del país (es decir, un poco más de la mitad de los datos de entrenamiento disponibles son de ciudades de Italia (52 %), seguidas de España (26 %).

Evaluamos varios modelos de regresión, incluida la regresión multilineal, el bosque aleatorio, SVM y el refuerzo de gradiente extremo (XGBoost). El modelo multilineal es de la biblioteca base de R; random forest y SVM son del paquete R caret versión 6.0-8661; y XGBoost del paquete XGBoost R versión 1.3.2.162. Elegimos el error cuadrático medio (RMSE) y r2 como la matriz de comparación del modelo para examinar cómo se desempeña cada modelo en los conjuntos de datos de entrenamiento y prueba. Para los modelos de bosque aleatorio, SVM y XGBoost que están controlados por un conjunto de hiperparámetros, aplicamos la búsqueda en cuadrícula con validación cruzada quíntuple a los modelos para obtener los mejores parámetros que dan como resultado el RMSE más bajo. La Tabla complementaria 6 muestra los hiperparámetros que usamos en estos tres modelos. Los valores faltantes en las variables independientes son un problema común en los modelos basados ​​en ML, y los modelos que evaluamos manejan los valores faltantes de diferentes maneras. El modelo XGBoost es capaz de manejar valores faltantes sin ninguna imputación. Por lo tanto, después de entrenar un modelo XGboost con datos completos en todas las variables independientes (referido como XGBoost-w/o NA), también entrenamos el modelo XGBoost con los datos que pueden tener valores NA en las variables independientes (referido como XGBoost-w /-NA en las siguientes secciones. Tenga en cuenta que todos los valores de NA se eliminan después de que dividimos los datos en conjuntos de entrenamiento y prueba, de modo que todos los conjuntos de datos de entrenamiento y prueba sean exactamente iguales para los modelos además de XGBoost-w/ NA. La Tabla complementaria 6 muestra entrenar y probar RMSE y r2 de los modelos mejor ajustados.Tanto el bosque aleatorio como el modelo XGBoost son modelos de regresión basados ​​en árboles, y nuestros resultados sugieren que los modelos basados ​​en árboles funcionan mejor que otros modelos para nuestro conjunto de datos (Tabla complementaria 6). Además, se entrena el modelo XGBoost-w/ NA con 357 puntos de datos más con valores de NA en las variables independientes y se consigue: RMSE = 155865,63 y r2 = 0,90.

Según los resultados del entrenamiento del modelo y la capacidad de manejar los valores faltantes, decidimos continuar con XGBoost. XGBoost significa "impulso de gradiente extremo" y ha ganado popularidad debido a su alto rendimiento en competencias de aprendizaje automático como Kaggle63. Los modelos de aumento de gradiente como XGBoost realizan tareas de regresión supervisadas a través de un enfoque iterativo para predecir una variable objetivo (es decir, emisiones), optimizando el rendimiento predictivo al combinar múltiples árboles "débiles" para adaptarse a nuevos modelos que son predictores más precisos de una variable de respuesta64,65. Una ventaja de los modelos de aprendizaje automático que aumentan el gradiente, como XGBoost, es que son resistentes a los problemas que preocupan en las técnicas típicas basadas en regresión, incluidos los problemas de multicolinealidad66,67. Un árbol de decisiones consta de divisiones: selecciones iterativas de funciones que separan los datos en dos grupos y luego determinan cuál es la "división" óptima en una función en función de la puntuación. Si dos características o variables están correlacionadas, solo se seleccionará una y el algoritmo no utilizará la información de la característica correlacionada porque ya ha sido capturada por la primera. El modelo de aumento de gradiente XGBoost ha sido ampliamente utilizado en el monitoreo de la calidad del aire65,68,69 y la estimación de emisiones de gases de efecto invernadero (GEI)70 por su alta eficiencia, flexibilidad y portabilidad. Si y Du65 señalan además las ventajas adicionales de XGBoost, que requiere menos preprocesamiento de datos y tiene menos hiperparámetros, parámetros que utiliza un modelo de ML para controlar el proceso de aprendizaje para el ajuste71.

Utilizamos la eliminación recursiva de características (RFE)72, una técnica de aprendizaje automático que ayuda con la selección de características para identificar las características óptimas para un problema de predicción o clasificación mediante la eliminación de las características "más débiles" en un conjunto de datos73. Aunque los enfoques de RFE pueden ser más relevantes para conjuntos de datos que incluyen varias docenas o cientos de variables, implementamos RFE usando el paquete FeatureTerminatoR74 en R, que sugirió la inclusión de grados día de calefacción, emisiones de CO2 de combustibles fósiles (odiac), contaminación por partículas finas ( pm25), pib per cápita, población, densidad de población, latitud, longitud, concentración de masa de polvo y año de emisión. Evaluamos especificaciones de modelos alternativos que incluían variables adicionales recopiladas (p. ej., concentraciones de emisión de dióxido de azufre), pero su inclusión no mejoró significativamente la precisión de predicción de nuestro modelo y erramos en la parsimonia del modelo en nuestra especificación de modelo final75 (Figura 5 complementaria y Tabla 7).

Nuestra implementación de XGBoost está determinada por un conjunto de hiperparámetros, que son parámetros que utiliza el modelo de aprendizaje automático para controlar el proceso de aprendizaje71. Estos incluyeron la profundidad máxima del árbol, la tasa de aprendizaje, la suma mínima de peso en un nodo, la reducción de pérdida mínima y el porcentaje de filas para usar en cada árbol, que son los hiperparámetros estándar incluidos en la implementación de XGBoost en R76. Para obtener el mejor conjunto de hiperparámetros para el modelo y evaluar su rendimiento, primero dividimos nuestro conjunto de datos con un muestreo dividido 80/20 entre países, lo que significa que usamos el 80 % de los datos como datos de entrenamiento para predecir el otro 20 % de los conjunto de datos65. Luego realizamos una búsqueda en cuadrícula (Tabla complementaria 4) en los hiperparámetros con validación cruzada quíntuple para determinar el modelo con el error cuadrático medio de la raíz media más bajo. La Tabla complementaria 4 muestra los rangos de hiperparámetros y los valores optimizados. Después de la búsqueda de la cuadrícula de hiperparámetros, entrenamos el modelo con el conjunto de datos de entrenamiento con el mejor resultado de la búsqueda de la cuadrícula de hiperparámetros. Luego probamos la precisión del modelo utilizando los datos de prueba.

El modelo final se construyó con el conjunto de parámetros óptimo de la búsqueda de cuadrícula, que es el proceso de crear modelos con todas las combinaciones de parámetros posibles y encontrar el mejor conjunto de parámetros con el que el modelo se desempeña mejor en las muestras de entrenamiento. Como se describe en la Tabla complementaria 4, el resultado óptimo para el modelo se logra cuando la profundidad máxima = 13, el peso mínimo del niño = 1, eta (tasa de aprendizaje) = 0.5, gamma = 1, y entrena el modelo con 40 rondas, que lograron un promedio error porcentual absoluto entre el entrenamiento y los valores predichos del 8 %, y r2 = 0,88 para los datos de prueba Consulte la Fig. 4 complementaria para conocer los diagramas de dispersión del rendimiento del modelo. La Tabla complementaria 7 muestra los resultados de algunas especificaciones de modelo alternativas seleccionadas que se evaluaron pero finalmente no se seleccionaron para predicciones para otros años y todas las demás LAU. La Fig. 4 complementaria muestra diagramas de dispersión de las emisiones autoinformadas y previstas para los conjuntos de datos de entrenamiento y prueba. Usamos la función integrada del paquete XGBoost R xgb.importance para determinar la importancia de las características del modelo final (es decir, qué predictores tienen el mayor poder predictivo o explicativo)76.

Después de construir el modelo final con parámetros y evaluación óptimos, aplicamos nuestro modelo a (1) ciudades EUCoM que no reportan emisiones (es decir, ciudades participantes); y (2) todas las LAU externas en Europa que no participan en el EUCoM. Arrancamos 1000 intervalos de emisiones pronosticados para cada año para cada actor para garantizar estimaciones medianas sólidas. Además de los parámetros óptimos de la búsqueda en cuadrícula, usamos el parámetro "submuestra" para introducir aleatoriedad en el modelo. Este parámetro determina el porcentaje de filas en nuestro conjunto de datos para usar en cada árbol. Establecemos este valor en 0,90 y, por lo tanto, el modelo se construye con el 90% del conjunto de datos total. Luego calculamos el percentil 5, el percentil 95, la media y la mediana para cada estimación de emisiones previstas para cada actor y año.

Calculamos varias métricas de desempeño (p. ej., tendencia lineal en las emisiones pronosticadas entre 2001 y 2018, cambio porcentual anual en las emisiones y reducción porcentual anualizada en las emisiones per cápita) utilizando los datos de emisiones pronosticadas para cada actor y los evaluamos antes de utilizar la reducción porcentual anualizada. en emisiones per cápita (tendencia anual de emisiones per cápita) como nuestra principal métrica de evaluación, consistente con Hsu et al.10, como se describe en la ecuación. 3.

De acuerdo con Hsu et al.10, determinamos si una ciudad está 'en camino' para lograr su objetivo de reducción de emisiones establecido o no, calculamos la proporción de reducción de emisiones per cápita real (es decir, lograda) en el año del inventario con respecto al objetivo. reducción de emisiones per cápita en el año del inventario, ambos en comparación con el año de referencia, suponiendo que la reducción de emisiones entre el año de referencia y el año objetivo se prorratea linealmente (es decir, una reducción de emisiones constante de un año al siguiente). Más específicamente, definimos \(\rho\) a través de las siguientes ecuaciones. (4–7):

dónde:

\({{Predemissions}}_{\min ({year})}\) son las emisiones per cápita pronosticadas de la ciudad en el año mínimo para el que hay datos de predicción disponibles. Para la mayoría de las ciudades este fue el año 2001;

\({{Predemissions}}_{\max ({year})}\) son las emisiones per cápita pronosticadas de la ciudad en el año máximo para el que hay datos predictivos disponibles. Para la mayoría de las ciudades este fue el año 2018;

dónde:

\({{Year}}_{\min }\) es el año mínimo para el que se dispone de datos de emisiones previstas

\({{Year}}_{\max }\) es el año máximo para el que se dispone de emisiones previstas

\({{Año}}_{{objetivo}}\) es el año en el que se lograrán las reducciones de emisiones comprometidas

dónde:

\({Objetivo}\) es la reducción de emisiones comprometida de la ciudad (porcentaje).

Para investigar si la participación en el EUCoM está asociada con un cambio en las emisiones de las ciudades, empleamos un enfoque de modelado de series de tiempo interrumpido (ITS)20 para comparar las tendencias en las emisiones anuales per cápita de las ciudades del EUCoM antes y después de su año de adhesión. Los diseños de STI evalúan un resultado para una muestra de población expuesta a una intervención antes y después, utilizando observaciones repetidas a intervalos regulares19,77. Aunque existe una fuerte validez interna de un diseño ITS, existen limitaciones en términos de una potencial validez externa débil en el sentido de que los resultados pueden no ser generalizables a otros grupos debido al hecho de que ITS no puede descartar la posibilidad de factores no medibles o no controlados que conduzcan a un cambio en la variable de resultado.

Estimamos los cambios porcentuales anuales en las reducciones de emisiones per cápita (\({pct}.{chg}\)) de 2001 a 2018 para cada ciudad (\(i\)) en el país (\(c\)) para cada año ( \(t\)) con la siguiente ecuación. (8):

donde \({Tiempo}\) es una variable que indica el número de años desde que una ciudad se adhirió a la iniciativa EUCoM; \({Joined}\) es una variable ficticia que indica si la observación se refiere a antes (0) o después (1) de la adhesión de la ciudad; \({TSJ}\) es el tiempo transcurrido desde que una ciudad se unió a la EUCoM en años. También controlamos las diferencias entre la densidad de población de las ciudades, el PIB per cápita, las emisiones per cápita previstas por nuestro modelo de aprendizaje automático, el objetivo de reducción porcentual para 2020 y si la ciudad ha adoptado un plan de mitigación o ha realizado un inventario de emisiones. También incluimos variables ficticias de país (\({\gamma }_{C}\)) para controlar los factores no observados e invariables en el tiempo comunes a las ciudades dentro de un país y efectos fijos anuales (δt) para controlar las características exógenas que pueden influir en las emisiones en un año dado.

El raspado de datos y el procesamiento de datos geoespaciales se realizaron con python (versión 3.68), el paquete Beautiful Soup (versión 4.8.2), geopandas (versión 0.9.0), versión rasterio (1.0.21) y rasterstats (versión 0.15.0) y el entorno de programación estadística R (versión 3.6.2). El modelo de aprendizaje automático fue desarrollado y realizado en R utilizando el paquete XGBoost (versión 1.6.0.1)76. Las figuras se realizaron utilizando el paquete de visualización de datos ggplot278 (versión 3.3.6) y los mapas se realizaron en QGIS (versión 3.16).

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de Nature Portfolio vinculado a este artículo.

Los datos generados en este estudio se han depositado en el repositorio Data-Driven EnviroLab Dataverse (https://doi.org/10.15139/S3/NRJ5ZO). Los datos sin procesar recopilados, procesados ​​y utilizados para este estudio incluyen: la base de datos del Inventario de datos abiertos para el dióxido de carbono antropogénico (ODIAC) (https://doi.org/10.17595/20170411.001); Producto de temperatura mensual NASA MERRA-2 (https://doi.org/10.5067/KVIMOMCUO83U); NASA MERRA-2 densidad de masa de columna media mensual de componentes de aerosol (carbono negro, polvo, sal marina, sulfato y carbono orgánico), concentración de masa superficial de componentes de aerosol (https://doi.org/10.5067/FH9A0MLJPC7N); PM2.5 de superficie del Grupo de Análisis y Composición Atmosférica de la Universidad de Washington en St. Louis (https://doi.org/10.1021/acs.est.1c05309); Conjunto de datos Gridded Population of the World54 (https://doi.org/10.7927/H4F47M2C) Datos de producto interno bruto (PIB) globalmente gridded de Kummu et al.55 (https://doi.org/10.1038/sdata.2018.4); Producto interior bruto (PIB) de Eurostat a precios de mercado actuales por regiones NUTS 2 (http://data.europa.eu/88u/dataset/egT31kJF7IArVLXu1rTkQ); Kona et al.34 Global Covenant of Mayors, un conjunto de datos de emisiones de gases de efecto invernadero para 6200 ciudades en Europa y los países del sur del Mediterráneo (https://doi.org/10.5194/essd-13-3551-2021); se recopilaron otros datos para las ciudades del Pacto de los Alcaldes de la UE de (https://www.covenantofmayors.eu/); Unidades administrativas locales de la base de datos de Eurostat56 (https://ec.europa.eu/eurostat/web/nuts/local-administrative-units); límites administrativos de ciudades de OpenStreetMap (https://planet.openstreetmap.org); Los centroides de las ciudades se extrajeron a través del sitio web GeoHack de Wikipedia (https://www.mediawiki.org/wiki/GeoHack).

El código utilizado para este estudio está disponible en la página de GitHub de Data-Driven EnviroLab (www.github.com/datadrivenenvirolab/citiesML) o previa solicitud razonable del autor correspondiente.

Hsu, A. et al. ClimActor, datos transnacionales armonizados sobre la participación en redes climáticas de los gobiernos municipales y regionales. ciencia Datos 7, 1–8 (2020).

Artículo Google Académico

Reckien, D. et al. ¿Cómo planean las ciudades responder al cambio climático? Evaluación de los planes climáticos locales de 885 ciudades de la UE-28. J. Limpio. Pinchar. 191, 207–219 (2018).

Hsu, A. & Rauber, R. Diversos actores climáticos muestran una coordinación limitada en un análisis de texto a gran escala de documentos de estrategia. común Entorno terrestre. 2, 1–12 (2021).

Artículo Google Académico

Hsu, A., Cheng, Y., Weinfurter, A., Xu, K. y Yick, C. Seguimiento de los compromisos climáticos de ciudades y empresas. Naturaleza 532, 303–305 (2016).

Milojevic-Dupont, N. & Creutzig, F. Aprendizaje automático para la mitigación del cambio climático diferenciado geográficamente en áreas urbanas. Sostener. Ciudades Soc. 64, 102526 (2021).

Artículo Google Académico

Panel Intergubernamental sobre Cambio Climático & Panel Intergubernamental sobre Cambio Climático. Asentamientos Humanos, Infraestructura y Planificación Territorial. en Cambio Climático 2014 Mitigación del Cambio Climático (2015).

Stehle, F., Hickmann, T., Lederer, M. & Höhne, C. Política climática urbana en economías emergentes: una perspectiva de gobernanza multinivel. (2020).

Boehnke, R., Hoppe, T., Brezet, H. & Blok, K. Buenas prácticas en la acción local de mitigación climática de ciudades pequeñas y medianas; explorando el significado, la implementación y el vínculo con la reducción real de las emisiones de carbono en trece municipios de los Países Bajos. J. Limpio. Pinchar. 207, 630–644 (2019).

Domorenok, E., Acconcia, G., Bendlin, L. & Campillo, XR Experimentos en la Gobernanza Climática de la UE: El Potencial Incumplido del Pacto de los Alcaldes. globo Reinar. Polit. 20, 122–142 (2020).

Artículo Google Académico

Hsu, A. et al. Los determinantes del desempeño muestran que las ciudades europeas están cumpliendo con la mitigación climática. Nat. Clima Chang. 10, 1015–1022 (2020).

Ibrahim, N., Sugar, L., Hoornweg, D. y Kennedy, C. Emisiones de gases de efecto invernadero de las ciudades: comparación de marcos de inventarios internacionales. Entorno local. 17 (2012).

Rolnick, D. et al. Abordar el cambio climático con el aprendizaje automático. Encuestas informáticas de ACM (CSUR), 55, 1–96 (2022).

Oda, T. et al. Errores e incertidumbres en un inventario cuadriculado de emisiones de dióxido de carbono. Mitigar Adaptar. Estrateg. globo Chang. 24, 1007–1050 (2019).

Artículo Google Académico

Raupach, MR, Rayner, PJ & Paget, M. Variaciones regionales en la estructura espacial de las luces nocturnas, densidad de población y emisiones de CO2 de combustibles fósiles. Política energética 38, 4756–4764 (2010).

Artículo Google Académico

Morán, D. et al. Estimación de las emisiones de CO2 de 108000 ciudades europeas. Sistema Tierra ciencia Datos 14, 845–864 (2022).

Artículo ANUNCIOS Google Académico

Nangini, C. et al. Un conjunto de datos global de emisiones de CO2 y datos auxiliares relacionados con las emisiones de 343 ciudades. ciencia Datos 6, 180280 (2019).

Instituto de Recursos Mundiales (WRI). Observatorio del Clima 2020. (2020).

Salvia, M. et al. ¿Las ambiciones de mitigación climática conducirán a la neutralidad de carbono? Un análisis de los planes a nivel local de 327 ciudades de la UE. Renovar. Sostener. Energía Rev. 135, 110253 (2021).

Artículo Google Académico

Bernal, JL, Cummins, S. & Gasparrini, A. El uso de controles en estudios de series de tiempo interrumpido de intervenciones de salud pública. En t. J. Epidemiol. 47, 2082–2093 (2018).

Artículo Google Académico

Shadish, WR, Cook, TD & Campbell, DT Diseños experimentales y cuasi-experimentales para la inferencia causal generalizada. (2002).

van der Heijden, J. Estudiando la gobernanza climática urbana: por dónde empezar, qué buscar y cómo hacer una contribución significativa a la erudición y la práctica. Sistema Tierra Gobierno 1, 100005 (2019).

Artículo Google Académico

Gordon, DJ & Johnson, CA Redes de ciudades, gobernanza climática global y el camino hacia 1,5 °C. actual Opinión Reinar. Sostenibilidad 30, 35–41 (2018).

Artículo Google Académico

Rivas, S., Urraca, R., Palermo, V. & Bertoldi, P. Pacto de los Alcaldes 2020: Impulsores y barreras para el seguimiento de los planes de acción climática. J. Limpio. Pinchar. 332, 130029 (2022).

Artículo Google Académico

Kona, A. et al. Pacto de los Alcaldes: Logros y Proyecciones de Emisiones de Gases de Efecto Invernadero. publicaciones.jrc.ec.europe.eu (2016).

Boehnke, RF, Hoppe, T., Brezet, H. & Blok, K. Buenas prácticas en la acción local de mitigación climática de ciudades pequeñas y medianas; explorando el significado, la implementación y el vínculo con la reducción real de las emisiones de carbono en trece municipios de los Países Bajos. J. Limpio. Pinchar. 207, 630–644 (2019).

Artículo Google Académico

Aldy, JE El papel crucial de la vigilancia política en la política climática internacional. Clima Cambio 126, 279–292 (2014).

Artículo ANUNCIOS Google Académico

Bulkeley, H. ¿Pueden las ciudades aprovechar su potencial climático? Reflexiones sobre la COP21 París y más allá. Entorno local. 20, 1405-1409 (2015).

Artículo Google Académico

Hale, TN et al. Acción climática subestatal y no estatal: un marco para evaluar el progreso, la implementación y el impacto. Clima Política 21, 406–420 (2021).

Artículo Google Académico

Bulkeley, H. et al. Gobernando el cambio climático transnacionalmente: evaluando la evidencia de una base de datos de sesenta iniciativas. Reinar. Plan. C. Política del gobierno 30, 591–612 (2012).

Artículo Google Académico

Chan, S., Falkner, R., Goldberg, M. y van Asselt, H. Universidad de Easte. ¿Efectivo y geográficamente equilibrado? Una evaluación basada en resultados de acciones climáticas no estatales. Taylor p. 18, 24–35 (2018).

Kuramochi, T. et al. Más allá de la acción climática nacional: el impacto de los compromisos de la región, la ciudad y las empresas en las emisiones globales de gases de efecto invernadero. 20, 275–291 (2020).

Ogle, SM et al. Avance de los inventarios nacionales de gases de efecto invernadero para la agricultura en los países en desarrollo: mejora de los datos de actividad, factores de emisión y tecnología de software. Reinar. Res. Letón. 8, 015030 (2013).

Pan, G., Xu, Y. & Ma, J. El potencial del monitoreo satelital de CO2 para la gobernanza climática: una revisión. J. Medio Ambiente. Administrar 277, 111423 (2021).

Artículo CAS Google Académico

Kona, A. et al. Global Covenant of Mayors, un conjunto de datos de emisiones de gases de efecto invernadero para 6200 ciudades en Europa y los países del sur del Mediterráneo. Sistema Tierra ciencia Datos 13, 3551–3564 (2021).

Artículo ANUNCIOS Google Académico

Pacto de los Alcaldes de la UE. Directrices para la elaboración de informes sobre el clima y la energía del Pacto de los Alcaldes. https://www.covenantofmayors.eu/IMG/pdf/Covenant_ReportingGuidelines.pdf (2016).

Kapoor, S. & Narayanan, A. La fuga y la crisis de reproducibilidad en la ciencia basada en ML. Preimpresión en https://arxiv.org/abs/2207.07048 (2022).

Sabuncu, MR Intelligence juega a los dados: la estocasticidad es esencial para el aprendizaje automático. https://doi.org/10.48550/arxiv.2008.07496 (2020).

CMNUCC. Acuerdo de París, Convención Marco de las Naciones Unidas sobre el Cambio Climático. 21.ª Conferencia de las Partes (2015) FCCC/CP/2015/L.9.

CMNUCC. Documento oficioso revisado para consultas de información: preparación para el primer inventario mundial. https://unfccc.int/topics/global-stocktake/inputs. (2021).

Brooks, S. No, las ciudades no son realmente líderes en el clima. Basta de porristas sin sentido. Green Tech Media https://www.greentechmedia.com/articles/read/hard-truths-about-city-failures-with-clean-energy (2017).

Hale, T. 'Todas las manos a la obra': El acuerdo de París y la acción climática no estatal. globo Reinar. Polit. 16, 12–22 (2016).

Artículo Google Académico

Hale, T. Cooperación catalítica. globo Reinar. Polit. 20, 73–98 (2020).

Artículo Google Académico

Richardson, L. Hermosa sopa. https://pypi.org/project/beautifulsoup4 (2019).

Marcotullio, PJ, Sarzynski, A., Albrecht, J. & Schulz, N. La geografía de las emisiones urbanas de gases de efecto invernadero en Asia: un análisis regional. globo Reinar. Chang. 22, 944–958 (2012).

Artículo Google Académico

Dodman, D. ¿Culpar a las ciudades por el cambio climático? Un análisis de los inventarios urbanos de emisiones de gases de efecto invernadero. 21, 185–201 (2009).

Rosa, EA & Dietz, T. Impulsores humanos de las emisiones nacionales de gases de efecto invernadero. Nat. Clima Chang. 2012 28 2, 581–586 (2012).

CAS Google Académico

Karagulian, F. et al. Contribuciones al material particulado ambiental (PM) de las ciudades: una revisión sistemática de las contribuciones de fuentes locales a nivel global. atmósfera Reinar. 120, 475–483 (2015).

Artículo ADS CAS Google Académico

Agencia, EE Emisiones de gases de efecto invernadero por sector agregado. Eurostat (2019).

Oda, T. & Maksyutov, S. Un inventario global de emisiones de CO2 de combustibles fósiles de muy alta resolución (1 km × 1 km) derivado del uso de una base de datos de fuentes puntuales y observaciones satelitales de luces nocturnas. atmósfera química física 11, 543–556 (2011).

Artículo ADS CAS Google Académico

Bosilovich, MG, Lucchesi, R. & MS MERRA-2: Especificación de archivo. (2015).

Van Donkelaar, A., Martin, RV, Li, C. & Burnett, RT Estimaciones regionales de la composición química de partículas finas utilizando un método geocientífico-estadístico combinado con información de satélites, modelos y monitores. Reinar. ciencia Tecnología 53, 2595–2611 (2019).

Artículo ANUNCIOS Google Académico

Engel-Cox, J., Kim Oanh, NT, van Donkelaar, A., Martin, RV y Zell, E. Hacia la próxima generación de monitoreo de la calidad del aire: partículas. atmósfera Reinar. 80, 584–590 (2013).

Artículo ADS CAS Google Académico

Agencia Europea de Medio Ambiente. Emisiones de gases de efecto invernadero por sector agregado. Eurostat (2019).

CIESIN. Gridded Population of the World, Versión 4. (2016).

Kummu, M., Taka, M. & Guillaume, JHA Conjuntos de datos globales cuadriculados para el Producto Interno Bruto y el Índice de Desarrollo Humano entre 1990 y 2015. ciencia Datos 5, (2018).

Eurostat. Producto interior bruto (PIB) a precios de mercado actuales por regiones NUTS 2. https://appsso.eurostat.ec.europa.eu/nui/show.do?dataset=nama_10r_2gdp (2022).

Eurostat. Glosario:Unidad administrativa local (LAU) - Estadísticas Explicadas. Eurostat https://ec.europa.eu/eurostat/statistics-explained/index.php?title=Glossary:Local_administrative_unit_(LAU) (2018).

Jordahl, K. geopandas: herramientas Python para datos geográficos. (2014).

Haklay, M., informática, PW-IP y 2008, sin definir. Openstreetmap: mapas de calles generados por el usuario. ieeexplore.ieee.org (2008).

Perry, M. rasterstats 0.16.0. (2021).

Kuhn, M. Construcción de modelos predictivos en R usando el paquete de intercalación. Estado J. suave 28, 1–26 (2008).

Artículo Google Académico

Chen, T. & Guestrin, C. XGBoost: Un sistema escalable de refuerzo de árboles. en Proc. Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos, vols. 13-17-agosto 785–794 (Asociación de Maquinaria Informática, 2016).

Nielsen, D. Tree Boosting con XGBoost ¿Por qué XGBoost gana 'todas' las competencias de aprendizaje automático?

Seyedzadeh, S., Pour Rahimian, F., Oliver, S., Rodriguez, S. & Glesk, I. Modelado de aprendizaje automático para predecir el rendimiento energético de edificios no domésticos: un modelo para apoyar la toma de decisiones de modernización de energía profunda. aplicación Energía 279, 115908 (2020).

Artículo Google Académico

Si, M. & Du, K. Desarrollo de un modelo predictivo de emisiones utilizando un método de aprendizaje automático de aumento de gradiente. Reinar. Tecnología innovador 20, 101028 (2020).

Artículo CAS Google Académico

Alova, G. & Caldecott, B. Un modelo de aprendizaje automático para investigar los factores que contribuyen a la transición energética de los sectores de servicios públicos y productores de energía independientes a nivel internacional. iScience 24, 102929 (2021).

Artículo ANUNCIOS Google Académico

Hastie, TJ Modelos aditivos generalizados. en Modelos Estadísticos en S (2017).

Joharestani, MZ, Cao, C., Ni, X., Bashir, B. & Talebiesfandarani, S. Predicción de PM2.5 basada en Random Forest, XGBoost y Deep Learning utilizando datos de detección remota de múltiples fuentes. atmósfera 2019, vol. 10, página 373 10, 373 (2019).

Google Académico

Pan, B. Aplicación del algoritmo XGBoost en la predicción de la concentración de PM2.5 por hora. Conferencia de la OIO. Ser. Entorno terrestre. ciencia 113, 012127 (2018).

Artículo Google Académico

Li, Y. & Sun, Y. Modelado y predicción de emisiones de CO 2 a nivel de ciudad utilizando datos de acceso abierto y aprendizaje automático. Reinar. ciencia contaminar Res. 28, 19260–19271 (2021).

Artículo CAS Google Académico

Yang, L. & Shami, A. Sobre la optimización de hiperparámetros de algoritmos de aprendizaje automático: teoría y práctica. Neurocomputación 415, 295–316 (2020).

Artículo Google Académico

Yan, K. & Zhang, D. Selección y análisis de funciones en datos de sensores de gas correlacionados con eliminación recursiva de funciones. Sens. Actuadores, B Chem. 212, 353–363 (2015).

Artículo CAS Google Académico

Ketu, S. Índice de calidad del aire espacial y predicción de la concentración de contaminantes del aire mediante la eliminación recursiva de características basada en regresión lineal con regresión de bosque aleatorio (RFERF): un estudio de caso en India. Nat. Peligros 1–30 (2022).

Hutson, G. CRAN - Paquete FeatureTerminatoR. (2021).

Rasmussen, C. & Ghahramani, Z. La navaja de Occam. Adv. Información neuronal Proceso. sist. 13, (2000).

Chen, T. & Guestrin, C. XGBoost: Un sistema escalable de refuerzo de árboles. en Actas de la Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos vols 13-17-Agosto 785–794 (ACM, 2016).

Kleck, G. & Patterson, EB El impacto del control de armas y los niveles de posesión de armas en las tasas de violencia. J. Cuant. Criminol. 9, 249–287 (1993).

Artículo Google Académico

Wickham, H. ggplot2 Gráficos elegantes para análisis de datos. Revista de la Royal Statistical Society: Serie A (Estadísticas en la Sociedad) (2016).

Descargar referencias

Esta investigación fue apoyada por una subvención de la Fundación IKEA (Subvención No. A19051; AH) y un Premio de Investigación de Carrera Temprana de la Universidad Nacional de Singapur de 2018 (Subvención No. NUS_ECRA_FY18_P15; AH) otorgado a AH Agradecemos a Zhi Yi Yeo y Vasu Namdeo de Yale- NUS College por su asistencia en la recopilación de datos. También agradecemos a Glenn Sheriff (Universidad Estatal de Arizona), Joe Aldy (Escuela de Gobierno de Harvard Kennedy) y Evan Johnson (Universidad de Carolina del Norte-Chapel Hill) por sus comentarios sobre una versión anterior de este borrador.

Departamento de Políticas Públicas, Universidad de Carolina del Norte en Chapel Hill, Chapel Hill, EE. UU.

ángel hsu & xuewei wang

EnviroLab basado en datos, Universidad de Carolina del Norte en Chapel Hill, Chapel Hill, EE. UU.

ángel hsu & xuewei wang

Instituto para el Medio Ambiente, Universidad de Carolina del Norte en Chapel Hill, Chapel Hill, EE. UU.

ángel hsu & xuewei wang

Yale-NUS College, Singapur, Singapur

Jonas Tan y Wayne Toh

Facultad de Tecnología, Política y Gestión, Universidad Tecnológica de Delft, Delft, Países Bajos

nihit goyal

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

AH concibió, codiseñó el estudio, recopiló datos, realizó modelos y análisis estadísticos, hizo cifras y escribió el artículo. XW recopiló datos, realizó modelos estadísticos y validación, hizo cifras y contribuyó a la redacción del artículo. JT ayudó con la selección e implementación del modelo ML. WT ayudó con la recopilación y fusión de datos. NG ayudó a concebir y diseñar el estudio, recopilar y procesar datos e interpretar los resultados.

Correspondencia a Ángel Hsu.

Los autores declaran no tener conflictos de intereses.

Nature Communications agradece a Zhi Qiao, Monica Salvia y Yanwei Sun por su contribución a la revisión por pares de este trabajo. Los informes de los revisores están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Hsu, A., Wang, X., Tan, J. et al. Predicción del rendimiento de mitigación climática de las ciudades europeas mediante el aprendizaje automático. Nat Comun 13, 7487 (2022). https://doi.org/10.1038/s41467-022-35108-5

Descargar cita

Recibido: 14 de marzo de 2022

Aceptado: 18 de noviembre de 2022

Publicado: 05 diciembre 2022

DOI: https://doi.org/10.1038/s41467-022-35108-5

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.

COMPARTIR