Poster med etikett ‘Statistik’

Korrelation mellan blogg och väder

28 juni 2009

Efter att ha haft en varm och slö helg med lagom uppvarvning på söndag kväll ser jag tendenser till en viss korrelation mellan besöksfrekvens på bloggen och utomhustemperaturen :) Möjligen kan blogginläggen räknas hit också, men främst ser jag det på besöken.

När det är dåligt väder och kallt ute är det fler som läser än när det är varmt och fint ute. Nu när vi är nära semester och det är 30+ ute så är det få som mäktar med att bloggsurfa.

Själv längtar jag efter barnen och efter semestern och orkar inte tänka så mycket just nu. Men i avslappningen föddes ändå en tanke i helgen. Jag undrade om den sill som jag älskar att äta med kokt nypotatis verkligen är så god som jag tror eller om det är så att jag socialiserats att tro att sill och potatis är gott. Kanske mina föräldrars faiblesse för inlagd sill (och sill i andra former också, så även strömming) har gjort att jag upplever mer än sillsmaken när jag käkar denna rätt? Får jag i mig en dos minnen och socialt igenkännande tillsammans med fisken och potatisen?

Hur ska jag kunna skilja på den biologiska smaken och den sociologiska smaken? Hmmm…svårt. Kanske det går att experimentera med ;)

The Visual Display of Quantitative Information

26 juni 2009

Wow, vilken titel :) Det är Edward R. Tufte som skrivit en fenomenal bok om hur man på det tydligaste och mest informativa sättet presenterar statistiskt data grafiskt. Han går igenom historien och visar på mängder av fina exempel på hur presentatörer använt olika sätt att göra det komplicerade lätt att ta till sig för läsaren. Allt från lite svåröverskådliga bilder över förekomsten av olika sjukdomar USA per kön och etnicitet till magnifika presentationer, ja rena mästerverk, av Charles Joseph Minard. En av hans mest kända bilder är Napoleons mars 1812 där han med enorm träffsäkerhet på kartan visade den väg som hären tog, de slag de utkämpade och de förluster de led. Det är så snyggt och enkelt att ögonen tåras :) Boken innehåller fler exempel på Minards verk och de är verkligen ledstjärnor för oss som gillar att presentera material med bilder.

Det som gör boken så bra är inte bara att den är illustrativ och lätt att förstå, i övrigt ett viktigt rekursivt krav på en bok om grafiska illustrationer ;) Nej, den är dessutom pedagogisk i sitt upplägg med historisk tillbakablick, diskussion om grafisk integritet och sanningsenlighet, teori om datagrafik (obs, ej att förväxla med datorstödd grafik :) och ett helt kapitel enbart ägnat åt chartjunk. Chartjunk är bläck som använts till ingen nytta. Dekorationer eller onödigt krångliga diagramtyper. Ett 3d-diagram med tvådimensionellt data, färger som bara stör utan att förenkla osv. Jag har i många bilder fallit i den här fällan men försöker nu att hålla mig till väsentligheter. Kanske någon av er drabbas av mina grafer och håller mig emot, men då inbjuder jag till diskussion nästa gång jag visar upp ett alster som inte är lätt att förstå ;)

Tufte hinner också med kapitel om data ink maximation som ju är självbeskrivande, och är så enormt häftigt teoretiskt torrt som man kan bara tänka sig. Men det är samtidigt så otroligt lärorikt att se i bilder hur en presentation kan förenklas och göras renare. Mitt renessansöga gillar dessutom de enkla strikta linjerna som Tufte förmedlar, så om du är en barockmänniska så kanske du inte hittar din idol här ;) Estetik och teknik avslutar boken och naturligtvis så går Tufte igenom teorierna bakom det gyllene snittet och den gyllene rektangeln, min absoluta favorit!

Gyllene snittet: Sträckan B förhåller sig till sträckan A så som sträckan A förhåller sig till sträckan A+B. Jag förklarade detta för barnen i lördags och gav exempel på bildspråk där detta varit ledande. De nappade på idén och började hitta egna exempel på det gyllene snittets påverkan på vår oss och vår omgivning :D

Och vi har ett nytt elrekord!

31 december 2008

Klockan 1800 stämde vi av elförbrukningen och landade som väntat på ett nytt fantastiskt rekord! Elmätaren stannade på 69236 kWh vilket innebär 19958 kWh på ett år :) Första gången under vår tid i huset som kommit under 20000 kWh på ett år! Resultatet av mindre bad, bättre fönster och hushållning av elvärme har gett resultat :D

Nu ger vi oss på det svårare målet, att nå 19000 kWh. Tror att det sannolikt är enormt svårt att nå utan strukturförändringar så som värmeväxlare eller annat, men vi ska försöka. Med det varmare klimatets hjälp ska det gå…

Och med detta sköna glädjeämne önskar jag er alla ett

G o t t  n y t t  Å r  ! ! !

Nyårsafton – nu är det nära

31 december 2008

Wow, bara någon timme kvar innan elförbrukningsåret 2008 är till ända. Det sträcker sig från 1800 31 december 2007 till 1800 31 december 2008. I år har vi dessutom en dag extra vilket drar upp förbrukningen en smula. Just nu ligger vi på 69227 kWh och har på oss upp till 69278 för att klara det nya rekordet :) Jag visste redan i förrgår att vi skulle fixa det här, och nu är det nära. Spänningen är olidlig – även om vi vet att det är klart ;)

Jag har fått ett A

1 december 2008

Wow, jag som lämnade in i förtid. Jag som siktade på att klara ett E för att få godkänt. Jag som gått och väntat med lätt rädsla i halsen. Jag fick ett A! Helt otroligt :) Betyget A betyder ”A Studenten har visat fördjupade kunskaper och/eller färdigheter i alla läromål. Studenten har dessutom visat en mycket god förmåga att förstå och själv föra fram sociologiska argument, och därtill visat mycket god analytisk förmåga.”. Det är ju helt fantastiska ord och något jag aldrig kunde förespegla mig i början av kursen. Fasen så glad jag blir…och så peppad jag blir av att sluta ännu tidigare i mina examinationer ;)

Jag lämnade nyss in examination 2 i metodkursen. Du ser materialet på sociologisidorna. Det är rätt mycket tabeller och grafer och säger nog inte så mycket om det jag faktiskt gjort och lärt mig, men massor av saker – centralmått som typvärde, median och aritmetiskt medelvärde – frekvenser – grafiska presentationer mm har vi nu klarat av. Det är väl mest programmet jag slitit med att förstå, de övriga begreppen kunde jag sen tidigare. Jag menar, med en tjugo-flikars excelkalkyl för familjens budget lär man sig ett och annat om statistik och grafisk presentation ;)

Elen är avläst

30 november 2008

Så är vi framme vid novembers sista dag. Jag har läst av elförbrukningen och min fåfänga tro var ju att vi skulle landa på nytt rekord för rullande-tolv-månader. Och ja visst, vi klarade nytt rekord. Tolv månader bakåt i tiden har vi gjort av med 20 015 kWh. Det är sexton för mycket eftersom jag ville och trodde att vi skulle bryta ner under 20 000 som ju är en drömgräns. Jag har väntat och spekulerat i detta sedan september men alltid sett mig slagen. Det har kommit en liten köldknäpp de sista dagarana och drivit upp förbrukningen. Den här gången slog jag av två element, har slagit av lampor så mycket jag kunnat här hemma och jag har uppmuntrat barnen (!) att stänga dörren snabbt efter sig när det går ut :)

Men, som sagt, det hjälpte inte. Men det är bara en halv kWh per dag ner och det vore väl själva sjutton… För att klara 20 000 krävs 2 422 kWh i december och det är lägre än vi nånsin gjort när vi varit hemma över jul. Det är lite brydsamt, men med en mild start i december, och om barnen ser julkalendern hos kompisar och om vi sen tvättar kulört och vitt tillsammans på ekonomi-programmet… då klarar vi det nog :D

Idag hade vi första dag på snö också :) Tjejerna fick äntligen komma  ut på slalomskidor på riktigt! Nolbybacken hade kört konstsnö medan det var kallt och trots att vi hade 2,5 grader varmt och regn var backen bra pistad och tjejerna fick ett bra pass. Men vädret var sunkigt och vi blev dyngblöta. Det kändes mer som en avslutning i april än en säsångsstart i november. De kommer att bli sjukt bra i vinter. På en och en halv timmes träning skippade de plogsvängar och kör nu med sladdsvängar. De kryper ihop och böjer på benen som den värsta Lindell-Vikarby och åker snart ifrån sin pappa, ouch! Men denna vinter hoppas jag blir en brädvinter. På bräda är jag fortfarande kungen i familjen ;D

Sant eller sannolikt : Tankar kring matematik, statistik och sannolikheter

23 februari 2008


Allan Gut är professor i matematisk statistik vid Uppsala universitet och har i boken Sant eller sannolikt gjort ett mycket bra försök att förklara avancerade matematiska begrepp på ett väldigt enkelt och smakligt sätt. Som matematik- och sifferintresserad var det en skön läsning. Jag är ju ingen utbildad matematiker utan endast intresserad av ämnet till vardags. Med den här boken har jag fått verktyg till nya insikter som har gjort vissa fenomen i min omgivning lättare att förstå. Precis som Frans Johansson skriver i Medicieffekten så uppstår det kreativa upptäckter i skärningspunkterna mellan olika vetenskaper, som i det här fallet mellan matematik och organisation :)

Gut skriver om många intressanta områden i boken. Sannolikhetslära är ju t.ex. väldigt spännande och när han beskriver teorierna på konkreta sätt, som i exemplet med getterna och bilen, så blir det ju dessutom otroligt underhållande. Men det jag greps mest av i boken var det som handlade om deterministiska och stokastiska modeller. De har förklarat problemen som jag upplevt med att budgetering i verksamheter ofta slår fel när man summerar alla delar till en total. Det pratas om att alla underchefer använder ”kuddar” för att skydda sig mot negativa utfall, men det är inte hela sanningen.

Gut hjälper mig att förklara fenomenet genom att beskriva den deterministiska modellen som statistisk och den använder vi på den makroskopiska världen. Det innebär att den deterministiska modellen beskriver det genomsnittliga beteendet hos ett fenomen, och påverkas inte av slumpen. I en stor organisation så sker det statistikst sett ett antal dödsfall under ett år. Det föds ett antal barn vilka genererar föräldraledighet hos mammor och pappor. Det slutar ett antal personer och börjar ett antal personer. Dessa fenomen går ofta att beskriva med statistik och kan ligga till grund för en planering av helheten år efter år.

Den stokastiska modellen däremot använder vi för den mikroskopiska världen. Där påverkar slumpen kraftigt och vi är i händerna på sannolikhetsläran som påverkar utfallet för den lilla delen av organisationen. En chef som budgeterar för sin grupps kommande år ser det t.ex. som ytterst ovanligt att någon i gruppen skulle dö nästa år och budgeterar sålunda inte för det. Det är svårt att bedöma föräldraledighet och hur många som ska sluta i en grupp på 15-20 personer. Slumpen kan ge stora skillnader i utfallet och chefen ställs inför en stor utmaning. Under året så kommer samtalen mellan denna chef och dennes överställda chef att bli intressanta i de fall slumpen slår till och ger ett helt annat utfall. Skulle den här personen ha kunnat förutse de ovanliga effekterna eller får hon chansen att göra en ny prognos?

Det här sammantaget gör att de organisationer som använder alla gruppers budgetar för att bygga upp helhetens budget kommer att få följdfel hela vägen upp, eftersom de baserar det makroskopiska perspektivets budget på det mikroskopiska perspektivets bedömningar och det ger ofelbart skillnader! Budgeten för helheten är inte samma sak som summan av budgeten för alla delar, utan ska göras helt separat. Jag försökte att påverka budgetarbetet på myndigheten jag arbetade på när jag läste boken, men det gick väldigt trögt. Genom metaforen om gnuerna och krokodilerna lyckades jag dock plantera lite insikt och vi började arbeta med några makroskopiska nyckeltal för utbildning, avgångar osv. Det gav en enorm skillnad :) De problem vi haft varje år med att vi aldrig lyckades leverera de timmar som vi budgeterat undveks effektivt och vi träffade budgeten mycket bättre. Jag ändrade också prognosarbetet så till vida att jag gjorde en helhetsprognos för enheten istället för att summera alla underchefers prognoser. Det gick att statistiskt beskriva våra resor och uttag av de flesta budgetposter för helheten, och så använde vi underchefernas prognoser enbart till dialog i den enskilda uppföljningen.

Boken Sant eller sannolikt är väldigt intressant och är du det minsta intresserad av siffror, statistik och sannolikhet ska du läsa den. Det blir en upplevelse, jag lovar!

*Gnumetaforen (som för övrigt resulterade i att jag fick en grön tröja med rött gnutryck i gåva den 18 maj 2005 ;) handlar om en flock med 10 000 gnuer som ska vandra över den stora floden i jakt på färskt gräs. I floden ligger 1 000 krokodiler och väntar. Det är deras stora jaktsäsong och för att överleva ytterligare några månader som kommer de att äta en gnu var. Det gör att summan av alla gnuer som klarar sig över är 9 000. Det är den deterministiska modellen. Men om vi går ner i det mikroskopiska perspektivet och summerar budgeten hos respektive gnu som tänkt ta sig över så får vi sannolikt en total budget på närmare 10 000. Om vi använt den budgeten och sedan jämfört med utfallet så hade vi haft en diff på 10%! Vem ska bära hundhuvudet för att utfallet diffar från budgeten så grovt? Inte är det de uppätna gnuerna i varje fall ;) Så, budgeten för helheten baseras alltså på helt andra faktorer än budgeten för varje enskild del. Vilket i sin tur innebär att det måste finnas en über-gnu som arbetar med en deterministisk modell med statistik och de stora talens lag, istället för sannolikhet i det enskilda gnu-fallet. Häpp, så mycket lättare det blev att förstå, eller hur ;)