Aarhus Universitets segl

Spørgsmål og svar til foredraget 'Tal, tilfældigheder og tipping points'

Tirsdag d. 5. november 2024 afholdte statistiker Susanne Ditlevsen foredraget 'Tal, tilfældigheder og tipping points' som en del af foredragsserien Offentlige foredrag i Naturvidenskab.

Spørgsmålene væltede ind, og der var ikke tid til at besvare dem alle under foredragene. Nenunder kan du finde svarene på de spørgsmål, som Suanne nåede at besvare på aftenen.

1. Er der mange fejl i statistik eller kan man få det svar man gerne vil have? Hans, Løgstør.

Det kommer an på hvad man spørger om. Indimellem bliver der begået statistiske fejl, også i forskningen og i aviserne. Man kan ikke altid få svar på det man gerne vil, men hvis man tænker sig grundigt om, så kan man finde ud af hvad for noget data, som man har brug for, for at få svar på de spørgsmål, man er interesseret i. Måske er det muligt at indsamle det data, der er brug for. Men man kan aldrig svare på mere end det, som der er information om i data.

2. Kan du statistisk forudsige udfaldet af dagens amerikanske valg? Mvh Steen, Bølgen i Ålsgårde.

Det kan jeg godt, fordi der er en lille krølle ved det spørgsmål: Kan du statistisk forudsige? Og ja, det kan jeg godt. Der er ca. 50% chance for, at Trump vinder, og ca. 50% chance for at Kamala Harris vinder. Kan jeg derimod forudsige hvem der vinder valget? Nej.

3. Var mødedeltagerne i NASA alle bekendt med, at der manglede datapunkter og var det en del af det 3 timer lange møde, hvorvidt disse skulle medtages? Nicolas fra Brøndby

Det ved jeg faktisk ikke. Jeg er sikker på, at de alle vidste, at der var 23 målinger og jeg er helt sikker på, at de også vidste, at der var nogle opsendelser, hvor ingen o-ringe var gået i stykker. Men om det var noget de diskuterede, det ved jeg faktisk ikke.

4. Blev statistikker under covid fremstillet korrekt? Marlene, Rebild centret.

Ja og nej. Det var jo svært og der var rigtig mange statistikker. Det kommer også an på, hvor i verden man ville have oplysninger om, men lad os se på Danmark. Jeg tror ikke, at der er nogen tvivl om, at vi fik de data, der var, men der var også et kæmpe mørketal. Mørketal betyder, for covid 19, dem som var smittet, men som vi ikke vidste var smittet. Så der er mange ting, som vi ikke vidste, men der var også mange ting, som vi vidste. Man kunne så opbygge statistiske modeller, der kunne tage højde for det.

5. Er randomiserede studier den eneste måde at finde årsagssammenhænge i statistik? Simon, Kulturhus Indre By.

Nej, heldigvis er der andre måder at gøre det på. Randomiserede studier er det, som vi kalder ’The Golden Standard’. Det er det, som vi helst ville kunne gøre, fordi der er man nogenlunde sikker på, at man har udelukket andre årsager for de effekter, man eventuelt finder. Men indimellem har vi kun adgang til det, som vi kalder observationelle data. Eksemplet med politivold bygger på observationelle data. Her er der mange ting, vi gerne vil vide noget om, men vi kan ikke randomisere. Heldigvis har vi værktøjer til at behandle den slags data.

6. Er der lavet flere undersøgelser med racisme i USA? Og hvis hvilke kan du nævne? Kai, Birkerød bibliotek.

Der er lavet flere studier og jeg er selv også blevet bedt om at kommentere på et opfølgende studie. Der var for eksempel en enkelt forsker, der lavede et meget grundigt studie. Han undersøgte den magtanvendelse, som politibetjente bruger, ikke kun hvem politiet skyder og slår ihjel. Det kunne være magtanvendelser, såsom at lægge folk i håndjern, skubbe dem op mod en bil, lægge dem ned på jorden eller binde dem bagom ryggen. Han gjorde et meget grundigt arbejde, hvor han indsamlede rigtig meget data om hver episode: havde vedkommende en hætte på, var det mørkt, kom vedkommende løbende ud med en pistol fra en benzintank og så videre. Pointen er, at kommer man løbende ud fra en benzintank med en pistol, er der større risiko for, at politiet bruger magtanvendelse. Men han begik desværre også en statistisk fejl, og det var der også en forskergruppe, der gjorde opmærksom på. Problemet var igen, at det han kiggede på, det var alle de møder, der havde været mellem politi og civile, hvor politiet havde stoppet den civile. Men også dette studie glemte at se på, at der kunne være et racistisk valg i, hvem der overhovedet blev stoppet.

Hvis hvide hovedsagelig kun bliver stoppet, hvis de laver noget voldsomt, altså er i gang med et bankrøveri eller er i gang med at slå en eller anden ned på gaden, altså hvis de kun bliver stoppet i de ekstreme tilfælde, så vil der stort set altid blive brugt magtanvendelse fra politiets side på dem. De sorte bliver selvfølgelig også stoppet, hvis de er i gang med noget stærkt ulovligt, men hvis de også bliver stoppet bare, fordi de er sorte - så kan I se, at de hvide, der bliver stoppet, og de sorte, der bliver stoppet, ikke er sammenlignelige. Derfor vil data vise, at der bliver udøvet mere magtanvendelse på hvide, simpelthen fordi hvide kun stoppes når der er behov for magtanvendelse. Hvorimod nogle af de sorte bare bliver stoppet, hvoraf der er mange, der ikke bliver brugt magtanvendelse på. Og det havde det oprindelige studie faktisk ikke med.

7. Kaj fra Kosmorama i Skælskør. Er vandstandsstigninger ikke bare naturens gang? Vi kan måske udskyde det, men ikke stoppe det. Verdenshavene stod engang 30 m højere end i dag.

Charlotte, Thorsø. Er der statistisk belæg for at sige, at klimaforandringerne er menneskeskabte?

Ja, der er ingen tvivl om, at de klimaforandringer vi ser nu, er menneskeskabte. Samtidig er der heller ikke nogen tvivl om, at der har været klimaforandringer igennem jordens historie, som selvfølgelig ikke er menneskeskabte, men de har været der. Der har været tider med højere vandstand end nu. Men det vi ser nu, det er menneskeskabt. Så kan man sige, at det jo bare er noget, som er sket før. Ja, jeg påstår heller ikke, at det ene klima er bedre end det andet. Hvis vores havstrøm her tipper, og vi kommer over i et helt andet klima, så er det ikke fordi det klima er et dårligere klima, end det vi har i dag. Det er bare et andet klima. Men det klima vi har i dag, er det klima, som vi har i dag, og som vi derfor er tilpasset til, som passer til det landbrug, de byer og kulturer, som vi har i dag. Dengang, hvor der var en meget højere vandstand, der havde vi altså ikke de byer, som vi har i dag. Det er derfor en katastrofe for menneskeheden, hvis der sker en sådan tipping. Og også for mange økologiske systemer, fordi de også er tilpasset det klima, vi har i dag. Det er jo et spørgsmål om man kigger på det på en geologisk tidsskala, altså over millioner af år, eller om vi kigger på et par menneskealdre. De fleste af os er nok mest interesserede i et par menneskealdre og ikke hvad der sker om 5 mio. år. Det kan selvfølgelig også være sjovt at vide, men af andre grunde.

8. Inge fra Albertslund Biograf. Eksemplet med skørbug: Hvordan tages højde for tilfældigheden ved udvælgelsen af metoder? Hvorfor appelsiner og citroner?

James Lind udvalgte de seks behandlinger, fordi der var nogen, der troede, at de virkede. Det betyder sådan set ikke så meget, hvordan behandlingerne er valgt, hvis man kun ser på, om de virker. Men der er en god pointe i det spørgsmål, og det er, at i dag vil man altid lave det, der hedder en ’kontrolgruppe’. Og det var der faktisk ikke, men man kunne godt have haft to, som man kun gav den kost, som alle de andre fik og ikke nogen ekstra behandling. Det er jo sådan set ikke noget problem, at man har en ide om en bestemt behandling og så laver et randomiseret forsøg, hvor man giver behandlingen til en gruppe og ikke giver behandlingen til en anden gruppe. Man har valgt den behandling, fordi man har en hypotese om, at denne behandling virker. Det er der ikke nogen problemer med, fordi man så statistisk kan analysere om den er forskellig fra kontrolgruppen. Men man havde altså ikke nogen kontrolgruppe i det her forsøg.

9. Vil du fortælle lidt om hvilke fordele og ulemper du ser for risikoberegninger udført af AI/sprogmodeller i fremtiden? Mvh. Casper fra Næstved.

Det er et meget svært spørgsmål, og det er også et meget vigtigt spørgsmål. Jeg er ikke så vild med kunstig intelligensbegrebet. Jeg foretrækker at kalde det ’neurale netværk’, fordi det reelt set blot er nogle algoritmer, altså avancerede regneforskrifter. Hvis de algoritmer kan regne rigtigt, så kan de selvfølgelig være rigtig gode. Det der lidt er problemet, når man laver risikoberegninger, i hvert fald i klimaet, er jo tit, at vi prøver på at lave risikoberegninger for noget, vi sjældent har set. AI modeller skal trænes og de skal trænes på rigtig meget data. De kan så sige noget fornuftigt om den slags data, som de allerede har set, men de kan ikke sige noget om data, som de ikke har set. Man skal i hvert fald passe meget på, hvad man konkluderer. Derfor kan det godt være svært at lave risikoberegninger med den slags modeller, hvis ikke man har data at fodre dem med.

10. Helle for VUC Dalgas Avenue. Er der grænser for hvor mange ubekendte, man som statistiker kan tage med uden at det går ud over resultatets nøjagtighed?

Det er også et rigtig godt spørgsmål. Indenfor standard statistik ser man på, hvor mange målinger man har. Jo flere målinger du har, jo flere variable kan du medtage. Man skal have målinger nok, og for hver eneste gang man tager en ny variabel ind, så skal man have flere målinger. I eksemplet med skørbug var der kun 12 patienter, så man kunne selvfølgelig ikke undersøge 14 behandlinger – og 12 behandlinger ville nok også være problematisk. Så det er et spørgsmål om hvor stort ens datasæt er. Nu er der faktisk også nogle moderne metoder, statistiske metoder, der rent faktisk kan have flere variable end der er målinger, men det er til en anden dag.

11. Mogens, Indre by kulturhus, København. Hvad skete der med dødeligheden i Wien efter Simmelweis blev fyret?

Den steg helt gevaldigt. De holdt simpelthen op med at vaske hænder. Det er faktisk rigtigt, at den steg ganske frygtelig, og den var meget høj mange steder i Europa. Det er forfærdeligt at tænke på.

12. Hvordan blev jeres AMOC artikel modtaget af det videnskabelige samfund versus offentligheden?

Jeg har lavet mange studier og skrevet mange artikler. Men der er ingen artikel, jeg nogensinde har skrevet i mit liv, der er blevet læst af så mange, så grundigt og af så dygtige folk. Under en uge efter, at vi havde udgivet artiklen, kom der en officiel side med 15-20 af de bedste klimaforskere, der udtalte sig om vores artikel. Det har jeg aldrig været ude for før. Altså det er jo fornemt at få så dygtige folk, der læser det så grundigt - udover det der hedder peer review, som man allerede har været igennem, når man har udgivet en artikel. Der har været meget forskelligartede reaktioner, hvor der er nogle som synes, at det er spændende og en meget interessant metode. Der er ikke nogen, der rigtig har stillet spørgsmål til den statistiske metode, som sådan set er ny. De to største kritikpunkter har gået på, om den her havstrøm overhovedet har et tipping point. Det er ikke kun os, der påstår det. Det er der rigtig mange, der har påstået. Det er ikke et kritikpunkt, som jeg rigtig er bekymret for, fordi det er jeg overbevist om, at den har. Det andet kritikpunkt er fuldt forståeligt og rigtigt, og det er om det data, som vi har brugt, er repræsentativt for havstrømmen. Det er rigtigt, men vi har brug for 150 års data og det er det bedste vi har. Jeg synes, at problemet er så alvorligt, at man bliver nødt til at prøve at bruge det data, som man nu engang har til rådighed. Selvfølgelig kan der være problemer med det data, som vi har brugt, men vi kan altså ikke gå tilbage og måle i fortiden, så vi må bruge det data, der er. Det vil sige havoverfladetemperaturen, som søfolk har taget igennem årene. Og nu bliver det målt med satellitter.

Den offentlige interesse har været fuldstændig vild, jeg har aldrig været ude for noget lignende. Jeg tror, at i de første 14 dage efter, at vi havde udgivet artiklen, der sad vi i interviews fra kl. 08:00 om morgenen til kl. 22:00 om aftenen. Måske i omegnen af 90 interviews eller sådan noget lignende. Vi startede kl. 08:00 med morgenradio i Danmark og interviews i Asien, Australien, New Zealand og så videre. Så var det Europa, radio og aviser og så videre midt på dagen. Og om aftenen så var det Canada, USA, Brasilien og sådan nogle steder. Det var fuldstændig vildt. Jeg har aldrig været ude for noget lignende, og det fortsætter stadigvæk. Det var fuldstændig livsomvæltende, altså der var i hvert fald 3 dage, hvor jeg ikke havde tid til at løbe ud for at tisse eller spise min frokost. Jeg kan huske engang, hvor jeg løb ud for at tisse og tænkte ”har jeg slukket mikrofonen?”.

13. Hej Susanne. Hvornår skete dit tipping point? Altså hvornår valgte du at blive statistikker. Hilsen Ida, Bilhuset i Galten

Wow. Det skete jo lidt løbende, fordi jeg tidligere var skuespiller og har en uddannelse som skuespiller. Jeg var glad og tilfreds, men så følte jeg, at der manglede noget. Jeg manglede intellektuel stimulation. Undskyld det lød lidt snobbet, men det er faktisk rigtigt. Jeg har altid elsket matematik, men man går altså ikke til matematik på aftenskole, ligesom man går til ler. Så der var ligesom ikke andre muligheder end at gå på universitetet, og det var egentlig ikke min ide, at jeg nødvendigvis skulle blive færdig. Så jeg begyndte faktisk at læse på universitetet, fordi jeg synes, at det var sjovt. Jeg blev så grebet af det, at jeg i løbet af mit studie tænkte, at det her, det vil jeg lave resten af mit liv.