Evaluering – klimavarsling.no

Sesongvarslenes (mangel på) treffsikkerhet

Den 13. juni publiserte jeg et varsel for juli og august, basert på mer enn 500 individuelle prognoser fra åtte ulike modeller (les mer om hvordan disse lages her). På det tidspunktet var det ganske gode sjanser for at juli kom til å bli blant de fem varmeste juli-månedene i perioden 2015–2024. Følgende figur, reprodusert her, viste at sjansen for dette var over 50 % mange steder:

For ethvert sted på kartet indikerer fargene antallet juli-prognoser (av totalt 553) som er varmere enn den femte varmeste juli-måneden mellom 2015 of 2023, delt på 553 og oppgitt i prosent. Modellene som er brukt er beskrevet her, og data ble lastet ned fra Copernicus’ Climate Data Store. Publisert her 12. juni.

Nå har juli startet temmelig kjølig fra Trøndelag og sørover. Selv om det er lenge igjen av juli, og det fremdeles er lov å håpe på bedring, har jeg begynt å få meldinger fra folk som er misfornøyd med varselet for Norge (men merk at varselet ser ut til å ha truffet bra på varmen i Middelhavsområdet). Det er jeg selv også, så dette innlegget er delvis selvkritikk og delvis et forslag til en forbedret kommunikasjon av usikkerheten i varslene.

Jeg foreslår to «tiltak». Det første er enkelt og har kun med fargevalg å gjøre. Her er en alternativ måte å vise det samme varselet på:

Samme som forrige figur, men med et annet fargevalg.

Ettersom den underliggende sannsynligheten for at en juli-måned blir blant de fem varmeste av ti juli-måneder er 50 %, har jeg valgt å bruke røde farger for alt over 60 % og blå farger for alt under 40 %. Intervallet mellom 40 % og 60 % har jeg valgt å vise med hvite farger, ettersom verdier i dette intervallet ikke kan regnes som et tydelig signal. Jeg mener at dette gir et riktigere bilde av varslene enn da jeg brukte utelukkende røde farger.

Videre tenker jeg at varslene må vises sammen med informasjon om usikkerheten. Jeg har et forslag til hvordan denne kan presenteres. I eksempelet bruker jeg bare fem av de åtte modellene (dette er først og fremst fordi disse fem brukes til å lage omtrent samme antall prognoser hver måned; 50–60 per modell). Her er tilsvarende kart for disse fem modellene:

Tilsvarende de forrige figurene, men basert på kun fem av de åtte modellene (les mer om modellene her).

Resultatet endres seg knapt. For å gjøre en validering av disse modellene, kan vi bruke det som kalles hindcasts eller re-forecasts. Det er prognoser som er laget med samme modell og på samme måte som årets prognoser, men for juli-måneder bakover i tid. Den felles referanseperioden for alle disse modellene er 1993–2016.

For å validere prognosene har jeg laget juli-prognoser tilsvarende den over for disse tidligere årene, for alle modellene. For hver av disse prognosene sjekket jeg om det var over eller under 50 % sannsynlighet for at juli kom til å bli varmere enn de fem varmeste juli-månedene i løpet av de siste ni årene. Altså, for juli 2002 sjekket jeg om den ble varslet varmere enn den femte varmeste juli-måneden i perioden 1993–2001, for juli 2003 sjekket jeg om varselet var varmere enn den femte varmeste mellom 1994 og 2002, og så videre frem til jui 2016.

Videre sjekket jeg om den aktuelle juli-måneden faktisk ble varmere (ved hjelp av ERA5-reanalysen). Hver gang modellen hadde rett (altså om den varslet varmere og det ble varmere, eller den varslet at det ikke skulle ble varmere og det ikke ble det), ga jeg den 1 poeng. Og hver gang modellen tok feil, fikk den 0 poeng. Så summerte jeg opp hvor ofte modellen traff i prosent. En verdi på mer enn 50 % er bedre enn du og jeg ville ha klart ved å gjette.

Figuren under viser treffsikkerheten til hver av modellene, samt treffsikkerheten til det kombinerte varselet til slutt. Også her har jeg maskert bort verdier mellom 40 % og 60 %.

Validering av juli-prognoser for perioden 1993–2016 for fem modeller, samt et varsel laget ved å kombinere modellene til slutt (*COMBINED*). Verdier over 50 % indikerer at modellene gjør det bedre enn gjetning.

I flere områder gjør den kombinerte modellen det en god del bedre enn en modell basert på gjetning. Det er særlig over havet vi finner høye verdier. Årsaken til dette er at det er lettere å varsle temperaturene i havet enn i luften, ettersom de førstnevnte endrer seg saktest.

I Sør-Norge gjør ikke den kombinerte modellen det særlig godt, dessverre. Jeg ble faktisk selv litt overrasket over hvor dårlig den gjør det. Og her kommer selvkritikken: fra nå av kommer jeg til å presentere en evaluering av prognosene sammen med prognosene. Da kan folk selv ta stilling til om de stoler på dem.

For øvrig er denne typen evalueringer viktig fordi de kan brukes til å bruke modellene på en bedre måte. For eksempel går det an å undersøke om modellene er spesielt gode i gitte situasjoner. Eller om de er særlig dårlige i andre situasjoner. Hvis man vet dette, kan man gjøre forsøk på å vekte modellene ulikt, slik at det kombinerte varselet muligens blir mer pålitelig. Problemet er at valideringsperiodene er korte og at klimaet er i endring, slik at det ikke er noen garanti for at en modell som har gjort det godt historisk vil gjøre det bra i fremtiden.

Nå blir det en liten sommerpause herfra. Ha en flott sommer, uansett hvor du er!

Hvorfor feilet juli-varselet?

Juli-varselet vårt, som ble publisert 14. juni, var basert på simuleringer med åtte sesongvarslingsmodeller som brukte tilstanden i havet og atmosfæren, samt på land, per 1. juni (les mer om hvordan vi lager varsler). Det så ut til at Sør-Norge mest sannsynlig ville få varmt vær i likhet med Sør-Europa, og at det var lavere sannsynlighet for varme i Nord-Norge. Her er kartet som ble vist:

Sannsynlighet for at juli 2023 skulle bli varmere enn gjennomsnittet for referanseperioden 1993–2016, basert på prognoser fra åtte modeller og lastet ned fra Copernicus-tjenesten. Fargeskalaen er vist over bildet og indikerer sannsynligheten i prosent.

Hvis vi tar en titt på fasiten, stemmer det ikke så godt med varselet. Kartet under viser avviket fra gjennomsnittstemperaturen i referanseperioden 1993–2016 (projeksjonen er litt forskjellig fra kartet over). Det ser ut til at det kalde området som omfattet Nord-Norge i varselet flyttet seg sørover, slik at det ble Sør-Norge som ble kaldt. For Norge sin del er fargene på fasiten omtrent motsatte av fargene i varselet. Hva gikk galt?

Temperaturen i juli 2023 minus gjennomsnittstemperaturen for juli 1993–2016, vist i grader. Data fra ERA5-reanalysen.

Vi meteorologer pleier å se på lufttrykket når vi skal vurdere hvorfor varsler slår feil. Kartet under viser varslet lufttrykk i juli, i form av avvik fra referanseperioden. En overvekt av modellsimuleringene hadde et høytrykk over Norskehavet i nord og et lavtrykk over Atlanteren vest for Portugal. Det er ikke usannsynlig at dette skyldtes de høye havtemperaturene under området med varslet lavtrykk, i kombinasjon med lavere havtemperaturer i Norskehavet under det varslete høytrykket. Ettersom luft beveger seg mot klokken rundt et lavtrykk og med klokken rundt et høytrykk, ville denne situasjonen ha ført til østlig (varm og tørr) vind inn over Sør-Norge og nordlig (kald) vind over Nord-Norge.

Varslet lufttrykk i juli 2023 minus gjennomsnittet for referanseperioden 1993–2016, basert på prognoser fra åtte modeller og lastet ned fra Copernicus-tjenesten. Fargeskalaen over bildet viser avviket i hektopascal.

Kartet under viser hva som virkelig skjedde i juli. De blå fargene illustrerer at det kom mange lavtrykk inn fra sørvest, og disse hadde med seg våte, kjølige luftmasser. Dette gjorde det forholdsvis kaldt i Sør-Norge og på De britiske øyer. Oslo var 1,4 grader under normalen (1991–2020), mens Bergen var 0,2 grader under. (I fjor var det motsatt; da var Oslo 0,2 grader under mens Bergen var 1,4 grader kaldere enn normalt.) Tromsø var 1,8 grader varmere enn normalt i juli 2023.

Lufttrykket i juli 2023 minus gjennomsnittstrykket for juli 1993–2016, vist i hektopascal. Data fra ERA5-reanalysen.

Det dårlige juli-varselet illustrerer hvorfor det er viktig å forske på sesongvarsling. Vi vet nå hva som gikk galt, men ikke hvorfor dette skjedde. Det er mange kandidater. Skjevheten i varslene kan ha vært en bivirkning av systematiske feil i modellene. For eksempel kan det hende at modellene er for sensitive til ekstremt høye havtemperaturer, og at det var derfor varslene hadde en urealistisk overvekt av lavtrykk i den sørlige delen av Nord-Atlanteren. Et annet alternativ er at det skjedde noe uventet i atmosfæren som «låste» værsystemene til situasjonen på figuren over. Vi må aldri glemme at været opptrer kaotisk, og at noen situasjoner rett og slett ikke er forutsigbare, som et resultat av sommerfugleffekten.

I Climate Futures kommer vi til å undersøke juli 2023 i detalj, i håp om å lære mer om hvorfor modellene ikke var på sporet denne sommeren.

Evaluering av varselet for november 2022

Her er en kort evaluering av varselet vårt for november. Vi bruker de nye grafene som illustrerer spennet mellom de ulike modellprognosene. Figur 1 gjengir varselet for Bergen, der det som ble målt er markert med rødt.

**Figur 1.** Prognose for akkumulert nedbør (y-aksen, i millimeter) og gjennomsnittlig temperatur (x-aksen, i grader) i november 2022 i Bergen. De blå prikkene viser hver av modellprognosene. Tallene indikerer målt temperatur og nedbør i november hvert år siden 1990-tallet. De sorte linjene viser gjennomsnittlig temperatur for perioden 1993–2016, som er modellenes referanseperiode. De blå linjene viser gjennomsnittet av modellprognosene. De gule linjene viser forventet nedbør og temperatur i november 2022 i henhold til en lineær trend de siste tiårene. Teksten i de fire kvadrantene (delene av hver graf) sier hvor stor andel av prognosene som finnes i hver kvadrant i forhold til referanseperioden, og tallene i parentes angir hvor stor andel som modellene vanligvis plasserer i hver kvadrant. De røde linjene og sirkelen viser det som ble målt i november.

Det var betydelig varmere og tørrere enn normalt, og dette ble ikke fanget opp av modellene. Den røde sirkelen ligger helt i ytterkant av «skyen» av modellprognoser. Modellene hadde riktignok høyere sannsynlighet (20 %) enn det de vanligvis har (18 %) for at det skulle bli tørt og varmt, men det er likevel klart at været ble tørrere enn de fleste av prognosene indikerte.

Figur 2 viser tilsvarende graf for Oslo. Nedbøren var ganske lik normalen, og dette var varslet. Temperaturen ble høyere enn normalt, men betydelig høyere enn gjennomsnittet av varslene.

**Figur 2.** Som Figur 1, men for Oslo (Blindern).

Til slutt ser vi på Tromsø i Figur 3. Her var temperaturen godt varslet av modellenes gjennomsnitt, mens det ble langt tørrere enn normalt selv om modellenes prognoser var at det mest sannsynlig kom til å bli våtere enn normalt.

**Figur 3.** Som Figur 1, men for Tromsø.

En oppsummering kan være at det ble varmere enn forventet i Sør-Norge (Bergen og Oslo), mens det ble tørrere enn forventet på Vestlandet og i Nord-Norge (Bergen og Tromsø).