Sesongvarslenes (mangel på) treffsikkerhet

Den 13. juni publiserte jeg et varsel for juli og august, basert på mer enn 500 individuelle prognoser fra åtte ulike modeller (les mer om hvordan disse lages her). På det tidspunktet var det ganske gode sjanser for at juli kom til å bli blant de fem varmeste juli-månedene i perioden 2015–2024. Følgende figur, reprodusert her, viste at sjansen for dette var over 50 % mange steder:

For ethvert sted på kartet indikerer fargene antallet juli-prognoser (av totalt 553) som er varmere enn den femte varmeste juli-måneden mellom 2015 of 2023, delt på 553 og oppgitt i prosent. Modellene som er brukt er beskrevet her, og data ble lastet ned fra Copernicus’ Climate Data Store. Publisert her 12. juni.

Nå har juli startet temmelig kjølig fra Trøndelag og sørover. Selv om det er lenge igjen av juli, og det fremdeles er lov å håpe på bedring, har jeg begynt å få meldinger fra folk som er misfornøyd med varselet for Norge (men merk at varselet ser ut til å ha truffet bra på varmen i Middelhavsområdet). Det er jeg selv også, så dette innlegget er delvis selvkritikk og delvis et forslag til en forbedret kommunikasjon av usikkerheten i varslene.

Jeg foreslår to «tiltak». Det første er enkelt og har kun med fargevalg å gjøre. Her er en alternativ måte å vise det samme varselet på:

Samme som forrige figur, men med et annet fargevalg.

Ettersom den underliggende sannsynligheten for at en juli-måned blir blant de fem varmeste av ti juli-måneder er 50 %, har jeg valgt å bruke røde farger for alt over 60 % og blå farger for alt under 40 %. Intervallet mellom 40 % og 60 % har jeg valgt å vise med hvite farger, ettersom verdier i dette intervallet ikke kan regnes som et tydelig signal. Jeg mener at dette gir et riktigere bilde av varslene enn da jeg brukte utelukkende røde farger.

Videre tenker jeg at varslene må vises sammen med informasjon om usikkerheten. Jeg har et forslag til hvordan denne kan presenteres. I eksempelet bruker jeg bare fem av de åtte modellene (dette er først og fremst fordi disse fem brukes til å lage omtrent samme antall prognoser hver måned; 50–60 per modell). Her er tilsvarende kart for disse fem modellene:

Tilsvarende de forrige figurene, men basert på kun fem av de åtte modellene (les mer om modellene her).

Resultatet endres seg knapt. For å gjøre en validering av disse modellene, kan vi bruke det som kalles hindcasts eller re-forecasts. Det er prognoser som er laget med samme modell og på samme måte som årets prognoser, men for juli-måneder bakover i tid. Den felles referanseperioden for alle disse modellene er 1993–2016.

For å validere prognosene har jeg laget juli-prognoser tilsvarende den over for disse tidligere årene, for alle modellene. For hver av disse prognosene sjekket jeg om det var over eller under 50 % sannsynlighet for at juli kom til å bli varmere enn de fem varmeste juli-månedene i løpet av de siste ni årene. Altså, for juli 2002 sjekket jeg om den ble varslet varmere enn den femte varmeste juli-måneden i perioden 1993–2001, for juli 2003 sjekket jeg om varselet var varmere enn den femte varmeste mellom 1994 og 2002, og så videre frem til jui 2016.

Videre sjekket jeg om den aktuelle juli-måneden faktisk ble varmere (ved hjelp av ERA5-reanalysen). Hver gang modellen hadde rett (altså om den varslet varmere og det ble varmere, eller den varslet at det ikke skulle ble varmere og det ikke ble det), ga jeg den 1 poeng. Og hver gang modellen tok feil, fikk den 0 poeng. Så summerte jeg opp hvor ofte modellen traff i prosent. En verdi på mer enn 50 % er bedre enn du og jeg ville ha klart ved å gjette.

Figuren under viser treffsikkerheten til hver av modellene, samt treffsikkerheten til det kombinerte varselet til slutt. Også her har jeg maskert bort verdier mellom 40 % og 60 %.

Validering av juli-prognoser for perioden 1993–2016 for fem modeller, samt et varsel laget ved å kombinere modellene til slutt (COMBINED). Verdier over 50 % indikerer at modellene gjør det bedre enn gjetning.

I flere områder gjør den kombinerte modellen det en god del bedre enn en modell basert på gjetning. Det er særlig over havet vi finner høye verdier. Årsaken til dette er at det er lettere å varsle temperaturene i havet enn i luften, ettersom de førstnevnte endrer seg saktest.

I Sør-Norge gjør ikke den kombinerte modellen det særlig godt, dessverre. Jeg ble faktisk selv litt overrasket over hvor dårlig den gjør det. Og her kommer selvkritikken: fra nå av kommer jeg til å presentere en evaluering av prognosene sammen med prognosene. Da kan folk selv ta stilling til om de stoler på dem.

For øvrig er denne typen evalueringer viktig fordi de kan brukes til å bruke modellene på en bedre måte. For eksempel går det an å undersøke om modellene er spesielt gode i gitte situasjoner. Eller om de er særlig dårlige i andre situasjoner. Hvis man vet dette, kan man gjøre forsøk på å vekte modellene ulikt, slik at det kombinerte varselet muligens blir mer pålitelig. Problemet er at valideringsperiodene er korte og at klimaet er i endring, slik at det ikke er noen garanti for at en modell som har gjort det godt historisk vil gjøre det bra i fremtiden.

Nå blir det en liten sommerpause herfra. Ha en flott sommer, uansett hvor du er!

Nedbørvarsel for september 2020

Tidligere i dag publiserte vi et temperaturvarsel for september 2020. Her kommer det et nedbørsvarsel.

Varslene er basert på en statistisk modell som bruker historiske værobservasjoner og varsler fra sesongvarslingsmodeller fra følgende sentre: Bjerknessenteret i Norge, Deutscher Wetterdienst i Tyskland, ECMWF (det europeiske værvarslingssenteret) i England, UK Met Office i Storbritannia, Météo France i Frankrike og Centro Euro-Mediterraneo sui Cambiamenti Climatici i Italia. Et alternativt sesongvarsel basert på de samme modellene (pluss en amerikansk modell og minus Bjerknessenteret sin) finnes på EU sin tjeneste Copernicus Climate Change Service her.

Merk at vi som vanlig advarer mot å tillegge varselet vekt i beslutningsprosesser. Varselet er nemlig eksperimentelt og en del av forskningsprosjektet Seasonal Forecasting Engine, som er finansiert av Forskningsrådet. Vi tar ikke på noen måte ansvar for eventuelle tap som følger av bruk av varselet.

Det første varselet er for Bergen:

De tynne, blå søylene viser observert total månedlig nedbør mellom 1993 og 2019. Den våteste septembermåneden forekom i 2018, som mange husker etter en eksepsjonelt varm sommer. I både 1993, 1996 og 1998 var det tørt, med mindre enn 100 mm i løpet av hele september. De oransje intervallene viser hvor mye nedbør vår statistiske modell forventer. Den tykkeste stolpen indikerer at det med 50% sannsynlighet vil falle mellom 186 og 380 mm nedbør i løpet av måneden. Merk at det er større usikkerhet blant modellene for nedbør enn for temperatur, så derfor er dette intervallet ganske bredt. Den tynnere stolpen viser at det kun er 10% sannsynlig at det blir under 103 mm, altså som den tørre perioden på 90-tallet. Videre er det 10% sannsynlig at det blir mer enn 469 mm. Hvis dette skjer, blir september i år enten den våteste eller den nest våteste septembermåneden etter 1992.

Under følger det varsler for Oslo, Bodø og Tromsø. Vi mottar gjerne tilbakemeldinger på denne typen varsler. Husk å registrere deg på e-postlisten vår, så mottar du varsling på mail hver gang vi legger ut et nytt varsel.

Temperaturvarsel for september 2020

Vi varsler her temperatur for september 2020 (se også eget nedbørvarsel), basert på en statistisk modell som bruker historiske værobservasjoner og varsler fra sesongvarslingsmodeller fra følgende sentre: Bjerknessenteret i Norge, Deutscher Wetterdienst i Tyskland, ECMWF (det europeiske værvarslingssenteret) i England, UK Met Office i Storbritannia, Météo France i Frankrike og Centro Euro-Mediterraneo sui Cambiamenti Climatici i Italia. Et alternativt sesongvarsel basert på de samme modellene (pluss en amerikansk modell og minus Bjerknessenteret sin) finnes på EU sin tjeneste Copernicus Climate Change Service her.

Merk at vi som vanlig advarer mot å tillegge varselet vekt i beslutningsprosesser. Varselet er nemlig eksperimentelt og en del av forskningsprosjektet Seasonal Forecasting Engine, som er finansiert av Forskningsrådet. Vi tar ikke på noen måte ansvar for eventuelle tap som følger av bruk av varselet.

For de som har fulgt oss en stund, vil presentasjonen av dette varselet være ny. Vi kommer også til å publisere kart slik vi har gjort før, men i dette innlegget presenterer vi en ny måte å varsle temperaturen for spesifikke steder. Denne metoden kan brukes for alle steder som har observasjoner, helst tilbake til 1993. Det første varselet er for Bergen:

De blå søylene viser observert månedlig gjennomsnittstemperatur for september i perioden 1993–2019. Den kaldeste septembermåneden forekom i 2007, da det var 10,3 grader i snitt, og den varmeste kom i 1999, med en snittemperatur på 15,8 grader. De oransje intervallene viser hvor den statistiske modellen vår antyder at temperaturen kommer til å ligge i 2020. Ifølge modellen er det kun 10% sjanse for at det blir kjøligere enn 11,7 grader. Til sammenligning var det 11,6 grader i 2019. Det er også 10% sjanse for at det blir varmere enn 15,1 grader. Det er kun tre år (1999, 2006 og 2016) som har hatt så varme septembermåneder i Bergen etter 1992. Videre er det ifølge modellen vår 50% sannsynlig at temperaturen kommer til å ligge et sted mellom 12,6 og 14,3 grader. Gjennomsnittet i perioden 1993–2019 var på 12,8 grader, så det ligger altså an til en ganske varm september i Bergen.

Under presenterer vi varsler for Oslo (Blindern), Bodø og Tromsø. Vi mottar gjerne tilbakemeldinger på denne typen varsler. Husk å registrere deg på e-postlisten vår, så mottar du varsling på mail hver gang vi legger ut et nytt varsel.