Våldets socialekologi – en regressionsanalys

40
U.U.D.M. Project Report 2021:14 Examensarbete i matematik, 15 hp Handledare: Rolf Larsson Examinator: Örjan Stenflo Juni 2021 Department of Mathematics Uppsala University Våldets socialekologi – en regressionsanalys Petter Kolar

Transcript of Våldets socialekologi – en regressionsanalys

Examensarbete i matematik, 15 hp Handledare: Rolf Larsson Examinator: Örjan Stenflo Juni 2021
Department of Mathematics Uppsala University
Våldets socialekologi – en regressionsanalys
Sammanfattning
Varje ar drabbas over 80 000 personer av misshandelsbrott i Sverige. Cirka 9000 blir ranade. Over 450 000 utsatts for sexualbrott. Nar vi diskuterar personlig sakerhet ar det framforallt brott mot person, alltsa brott som riktas mot enskilda personer eller enskilda personers intressen, som star i fokus och ar ocksa vad vi kommer undersoka i den har studien. Narmare bestamt kommer vi undersoka misshandelsfallen av personer over 18 ar i Stockholms kommun 2019.
Med generaliserade linjara modeller studerar vi vilka faktorer som paverkar risken att bli misshandlad. Darefter tolkar vi de resulteran- de modellerna i relation till existerande kriminologiska teorier. Av- slutningsvis skissas hur dessa resultat skulle kunna anvandas av den enskilde for att starka sin, eller andras, personliga sakerhet.
Innehall
1.1.1 Desorganisationsteorin . . . . . . . . . . . . . . . . . . 4 1.1.2 Rutinaktivitetsteorin . . . . . . . . . . . . . . . . . . . 4
1.2 Hypotes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3 Forfarande och disposition . . . . . . . . . . . . . . . . . . . . 5 1.4 Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1 Diagram . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4.2 Tabeller . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1
2 Modeller 9
3 Variabler 9 3.1 Responsvariabler . . . . . . . . . . . . . . . . . . . . . . . . . 9 3.2 Kon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.3 Plats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.4 Relation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.5 Tunnelbana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.6 Innerstad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.7 Densitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.8 Bistand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.9 Arbetsloshet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.10 Utlandsk bakgrund . . . . . . . . . . . . . . . . . . . . . . . . 11 3.11 Mobilitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4 Metod 12 4.1 Oversikt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4.2 GLM – Generalized Linear Model . . . . . . . . . . . . . . . . 13
4.2.1 Logistiska modeller . . . . . . . . . . . . . . . . . . . . 14 4.2.2 Log-linjara modeller . . . . . . . . . . . . . . . . . . . 14
4.3 Viktiga fordelningar . . . . . . . . . . . . . . . . . . . . . . . . 15 4.4 Val av variabler . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.4.1 Framatval . . . . . . . . . . . . . . . . . . . . . . . . . 16 4.4.2 Bakateliminering . . . . . . . . . . . . . . . . . . . . . 16
4.5 Modelldiagnos . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 4.5.1 Residualanalys . . . . . . . . . . . . . . . . . . . . . . 16 4.5.2 VIF . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4.5.3 AIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4.5.4 Devians . . . . . . . . . . . . . . . . . . . . . . . . . . 18 4.5.5 ROC-kurvor . . . . . . . . . . . . . . . . . . . . . . . . 19
5 Resultat 19 5.1 Val av variabler . . . . . . . . . . . . . . . . . . . . . . . . . . 19 5.2 Logistisk modell . . . . . . . . . . . . . . . . . . . . . . . . . . 20
5.2.1 Jamforelse av modeller . . . . . . . . . . . . . . . . . . 22 5.2.2 Residualer . . . . . . . . . . . . . . . . . . . . . . . . . 22 5.2.3 Devians och AIC . . . . . . . . . . . . . . . . . . . . . 22 5.2.4 ROC-kurvor . . . . . . . . . . . . . . . . . . . . . . . . 23
2
5.2.5 Val av logistisk modell . . . . . . . . . . . . . . . . . . 24 5.3 Log-linjar modell . . . . . . . . . . . . . . . . . . . . . . . . . 25
5.3.1 Residualer . . . . . . . . . . . . . . . . . . . . . . . . . 27 5.3.2 Devians . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5.3.3 Val av log-linjar modell . . . . . . . . . . . . . . . . . . 29
5.4 Koefficienter . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 5.4.1 Logistisk modell . . . . . . . . . . . . . . . . . . . . . . 30 5.4.2 Log-linjar modell . . . . . . . . . . . . . . . . . . . . . 31
6 Slutsats och diskussion 31 6.1 Modeller och hypotes . . . . . . . . . . . . . . . . . . . . . . . 31
6.1.1 Bekanta . . . . . . . . . . . . . . . . . . . . . . . . . . 31 6.1.2 Obekanta . . . . . . . . . . . . . . . . . . . . . . . . . 32
6.2 Modellutveckling och framtida studier . . . . . . . . . . . . . . 32 6.3 Praktisk tillampning . . . . . . . . . . . . . . . . . . . . . . . 33
1 Inledning
Vilka faktorer styr hur brottsdrabbat ett omrade ar? Vem, och pa vilket satt, drabbar brottsligheten? Det ar fragor som ar viktiga for den som ar intresse- rad av att forebygga brott i samhallet och starka den personliga sakerheten for den enskilde individen, och utgor ocksa de overgripande fragorna samt syftet med det har arbetet.
For att begransa uppsatsens omfang har vi valt att geografiskt avgransa oss till Stockholm och dess stadsdelsomraden vilka var 14 till antalet ar 2019. En ytterligare begransning ar att vi endast kommer beakta brottskategorin misshandel inklusive grov misshandel.
1.1 Tidigare forskning
For att analysera vilka faktorer som styr valdsmonstren i Stockholm kommer vi utga ifran tva kriminologiska modeller som gor ansprak pa att beskriva hur brottsnivan varierar mellan olika omraden. Dessa tva modeller utgor ocksa undersokningens teoretiska referensram [1].
3
1.1.1 Desorganisationsteorin
Social desorganisation ar ett begrepp som har sitt ursprung i Chicagoskolans forskning. Grannskap som var hart drabbade av brottslighet utmarktes av lag socioekonomisk status, hog grad av etnisk blandning samt stor in- och ut- flyttning. Detta underminerade lokalsamhallets formaga att uppratthalla ge- mensamma normer samt forsamrade forutsattningarna for konstruktiva svar pa kollektiva utmaningar. Enligt desorganisationsperspektivet klarar inte det lokala samhallet att utova den informella sociala kontroll som kravs for att stavja kriminellt beteende nar omradet praglas av social instabilitet. Andra har, i samma anda, foreslagit att forsvagning av den traditionella familjen och traditionell religion bidrar till ett omrades sociala desorganisation och darmed till mojligheten att kontrollera brottsligheten.
1.1.2 Rutinaktivitetsteorin
Vad var det i det moderna livet som gjorde att kriminaliteten okade? Rutinaktivitetsteorins centrala begrepp brottstillfalle definieras av tre be- tingelser:
en motiverad garningsman
ett lampligt brottsoffer
franvaro av kapabel vaktare.
Nar dessa tre forutsattningar mots i tid och rum uppstar ett gynnsamt brotts- tillfalle. Efter andra varldskriget okar antalet kvinnor pa arbetsmarknaden, resandet okar, bilen blir vanligare etcetera, allt sammantaget medfor att li- vet flyttas fran hemmet till det offentliga. Enligt teorin medfor de moder- na livsformerna i sig ett okat antal brottstillfallen som darmed forklarar okningen av antalet brott, trots stark ekonomisk tillvaxt och omfattande valfardssatsningar.
4
1.2 Hypotes
Valdsbrottsligheten kan grovt delas upp i tva kategorier; vald mellan bekanta och vald mellan obekanta. Den forsta kategorin kommer till stor del samman- falla med vald mot kvinnor inomhus mellan nara bekanta (familjevald) och den andra med vald mellan obekanta man utomhus (gatuvald).
Uppsatsens tes ar att desorganisationsperspektivet ar mer lampat for att beskriva intensiteten i den forsta typen av vald och hur det varierar mellan stadsdelar, och att rutinaktivitetsteorin och dess centrala begrepp battre forklarar hur vald mellan obekanta fordelar sig geografiskt.
1.3 Forfarande och disposition
For att utrona vad det ar som styr hur, var och med vilken intensitet valdet drabbar kommer vi visualisera vara data med hjalp av R – ett program med vilket vi dessutom amnar frambringa, och analysera, de logistiska och log- linjara regressionsmodellerna som utgor uppsatsens huvuddel.
1.4 Data
Vi kommer anvanda brottsdata fran BRA over misshandelsfall i Stockholms kommun ar 2019 [2]. Dessa data ar uppdelade i antal fall per stadsdel, om misshandeln skedde utom- eller inomhus, offrets kon samt vilken relation offret hade till garningsmannen. Anledningen till att vi valt 2019 ar tvafaldig; det ar det senaste aret med icke-prelimenar brottsstatistik och det senaste aret som inte paverkades av Covid-19. Ett arbete liknande det har men for 2020 skulle gissningsvis ge andra resultat.
Befolkningsstatistik och siffror over den oppna arbetslosheten, bistand och mobilitet i stadsdelsomradena kommer fran SWECO [3]. Uppgifter om antalet tunnelbanepassagerare ar hamtade fran SL [4]. Ovrig befolkningssta- tistik kommer fran SCB [5].
1.4.1 Diagram
Genom att gestalta data skaffar vi oss battre overblick av det insamlade da- tamaterialet och vi kan ana vissa samband. I figur 1 ser vi hur arbetslosheten i ett omrade tycks korrelera med valdsintensiteten. Y-axeln representerar an- talet fall av misshandel per invanare dar offer och garningsman ar bekanta sedan tidigare.
5
0
0,001
0,002
0,003
0,004
0,005
0,006
0,007
0,008
0,009
0,01
Be ka
nt g
är ni
ng sm
0
200
400
600
800
1000
1200
M is
sh an
de ls
fa ll
m ed
o be
ka nt
g är
ni ng
sm an
Avstigande tunnelbana/stadsdel
Figur 2: Stora floden av passagerare i tunnelbanan okar antalet gynnsamma brottstillfallen
6
I figur 2 ser vi hur summan av antalet avstigande fran tunnelbanan i respek- tive stadsdel verkar hanga samman med hur manga som blir utsatta for vald av framlingar. Till skillnad fran figur 1 visas har det faktiska antalet miss- handelsfall. Varfor den har skillnaden? Valdet mellan bekanta utgors till stor del av vald mellan partners eller familjevald, en typ av brott som ofta sker hemmavid, och darfor kommer antalet fall i ett visst omrade starkt paverkas av hur manga som bor dar. Valdet mellan framlingar sker oftare i det offent- liga och intraffar darfor i hogre grad dar manga manniskor befinner sig nar de inte ar hemma, exempelvis i samband med resor, arbete eller deltagande i nojeslivet.
1.4.2 Tabeller
Tabell 1: Misshandel totalt. Stadsdel Fall av misshandel Per 1000 invanare Bromma 325 5,2 Enskede - Arsta - Vantor 817 10,1 Farsta 450 9,7 Hagersten-Liljeholmen 471 6,5 Hasselby - Vallingby 563 9,6 Kungsholmen 474 7,8 Norrmalm 1313 21,3 Rinkeby-Kista 526 13,5 Skarpnack 277 7,6 Skarholmen 361 12,4 Spanga - Tensta 269 9,3 Sodermalm 1456 13,3 Alvsjo 162 6,9 Ostermalm 511 7,7
7
Tabell 2: Offrets relation till garningsman. Stadsdel Obekant Bekant Bromma 127 198 Enskede - Arsta - Vantor 420 397 Farsta 158 292 Hagersten-Liljeholmen 204 267 Hasselby - Vallingby 176 387 Kungsholmen 295 179 Norrmalm 1035 278 Rinkeby-Kista 188 338 Skarpnack 114 163 Skarholmen 142 163 Spanga - Tensta 78 191 Sodermalm 995 461 Alvsjo 49 113 Ostermalm 341 170
Tabell 3: Sociala faktorer.
Stadsdel Avstigande/dag % AF % med bistand utlandsk bakgrund Bromma 52300 0,74 1,4 17785 Enskede - Arsta - Vantor 88100 1,92 2,9 38531 Farsta 28500 2,31 2,9 20136 Hagersten-Liljeholmen 85300 1,08 1,4 23131 Hasselby - Vallingby 31200 2,66 3,6 34790 Kungsholmen 91800 0,57 0,6 16208 Norrmalm 312200 0,73 0,6 17158 Rinkeby-Kista 38400 3,72 6,6 42983 Skarpnack 25000 1,26 2,2 12717 Skarholmen 36600 3,23 4,9 27017 Spanga - Tensta 8800 3,33 4,9 23310 Sodermalm 204900 1,08 0,8 27375 Alvsjo 0 1,27 2,0 8237 Ostermalm 141700 0,45 0,3 18508
8
2 Modeller
Om brottsoffren bor i stadsdelen dar de utsatts for vald, vilket i hog grad ar fallet nar de inblandade kanner varandra sedan tidigare, kan man skatta sannolikheten att bli misshandlad genom att berakna misshandelsfall divi- derat med antalet boende i omradet. I det fallet ar det kanske mojligt att ta fram, och tolka, en logistisk regressionsmodell dar responsvariabeln ar en sannolikhet, i det har fallet sannolikheten att bli misshandlad under aret. Nar sa inte ar fallet, dvs om misshandeln ager rum langre ifran hemmet, blir det mer komplicerat. Vi kan se i vara data att valdet mellan framlingar ar omfattande i de centrala delarna av Stockholm men betyder det att risken for de boende i innerstan ar storre? Eller beror de stora talen pa att manga utifran reser in till stan och att det darfor sker fler moten, fler potentiellt valdsamma situationer, pa grund av det? Mycket talar for att det forhaller sig sa och da blir ocksa en logistisk regressionsmodell svartolkad. En log- linjar regressionsmodell, som skattar antalet fall av misshandel under aret, framstar som mer passande.
I kapitel 4 presenteras en fordjupning av metoder och i synnerhet av logistiska och log-linjara regressionsmodeller.
3 Variabler
3.1 Responsvariabler
Stadsdelsomraden
Kon
Relation
– Ovrig relation
9
och antalet personer over 18 ar i de motsvarande demografiska grupperna. For den log-linjara modellen utgors responsvariabeln av antalet fall upp-
delande pa samma satt med undantag for relation, har har vi ju enbart fall dar de inblandade ar obekanta.
3.2 Kon
Kon ar en kategorisk variabel som antar tva varden, man eller kvinna. Data antyder att kvinnor i hogre grad utsatts for vald av narstaende darfor later vi man utgora referens i den logistiska modellen. Mycket tyder pa att man oftare ar inblandade i fall dar offer och garningsman ar obekanta, saledes far kvinnor vara referensvariabel i den log-linjara modellen.
3.3 Plats
Variabeln Plats kan anta tva varden, inomhus eller utomhus. Har kan man formoda att bekanta i hogre grad traffas inomhus och obekanta utomhus, vi later darfor referensvariabeln vara utomhus i den logistiska modellen och inomhus i den log-linjara.
3.4 Relation
Inte bara huruvida de inblandade ar bekanta utan aven graden av bekantskap kan vara intressant att undersoka. Relationsvariabeln ar kategorisk och har tva varden; nara bekant, och som nara raknas partner eller familj, eller ovrig som kan innebara van, kollega, lagkamrat etc.
Relation finns av naturliga skal endast i den logistiska modellen och da vi hypoteserar att kvinnor i hogre grad utsatts for vald av narstaende later vi ovrig vara referens.
3.5 Tunnelbana
Vi sag tidigare att vissa kategorier av vald ar mycket vanliga i centrala Stockholm. Tunnelbanavariabeln bestams av det totala antalet avstigande pa tunnelbanestationerna i respektive stadsdel per dag. Ett forsok att fanga inte bara flodet av manniskor utan aven tunnelbanestationen som en speci- ellt brottsutsatt plats. Det finns forskning som visar att Stockholms tunnel- banestationer ar sarskilt kriminogena miljoer vilket gor Tunnelbana till en
10
3.6 Innerstad
Innerstad ar en kategorisk variabel som antar vardet 1 om stadsdelen lig- ger i innerstan och 0 om den ligger i soderort eller vasterort. I innerstaden aterfinns en stor del av stadens nojesliv, restauranger etc, institutioner vi forknippar med rutinaktivitetsperspektivet och variabeln ar ett forsok att operationalisera den delen av teorin.
3.7 Densitet
Paverkar befolkningstatheten antalet brott? Ju tatare folk bor inom ett omrade desto fler tillfallen till moten och darmed ocksa till brottstillfallen kan man forestalla sig. Densitet uttrycks i invanare per kvadratkilometer.
3.8 Bistand
Variabeln Bistand anger hur stor andel av befolkningen i respektive stads- del som erhaller ekonomiskt bistand uttryckt i procent. Ar vald vanligare i ekonomiskt utsatta omraden? Det finns forskning som pekar at det hallet. En viktig variabel att inkludera nar vi undersoker desorganisationsteorins giltighet.
3.9 Arbetsloshet
I likhet med Bistand uttrycks Arbetsloshet som procent av befolkningen i re- spektive stadsdel, men nu som ar oppet arbetslosa. Paminner om bistandsvariabeln och kan eventuellt fanga samma effekt pa ett battre satt. Med stor sannolik- het korrelerar dessa och bada utgor faktorer vi forknippar med desorganisa- tionsperspektivet.
3.10 Utlandsk bakgrund
11
teorin sa som den ursprungligen formulerades. Utlandsk bakgrund anges i pro- cent av befolkningen i de olika stadsdelsomradena med utlandsk bakgrund.
3.11 Mobilitet
Mobiliteten i ett omrade beskriver hur manga som flyttar in och ut ur stads- delen i relation till hur manga som bor dar. Mobilitet ar ocksa ett av desor- ganisationsteorins centrala begrepp.
Tabell 4: Sammanfattning av variabler
Variabel Kategori Varden Antal misshandel/Population Responsvariabel Mellan 0 och 1 Antal misshandel Responsvariabel N Kon Kategorisk variabel Man eller Kvinna Plats Kategorisk variabel Utomhus eller Inomhus Relation Kategorisk variabel Nara eller Ovrig Tunnelbana Kontinuerlig variabel N Bistand Kontinuerlig variabel Mellan 0 och 100 Arbetsloshet Kontinuerlig variabel Mellan 0 och 100 Utlandsk bakgrund Kontinuerlig variabel Mellan 0 och 100 Innerstad Kategorisk variabel Innerstad eller Ytterstad
4 Metod
I foljande kapitel kommer vi ga igenom den teori och de metoder som anvands nar vi tar fram och analyserar de bada modeller som utgor uppsatsens hu- vuddel. Avsnittet bygger huvudsakligen pa [9].
4.1 Oversikt
En vanlig linjar regressionsmodell ger vantevardet av responsvariabeln som en linjarkombination av modellens regressionsvariabler. Det rader alltsa ett linjart samband mellan responsvariabeln och de forklarande variablerna. En sadan modell fungerar bra ibland men kan det finnas fall dar den ar mindre lamplig?
12
Betrakta en linjar modell, kanske skapad utifran storstadskommuner, som forutsager att en minskning av arbetslosheten med en procent leder till 100 farre fall av misshandel per ar. Om vi applicerar det pa en mindre kommun dar det endast forekommer 50 misshandlar per ar skulle modellen ge att en minskning av arbetslosheten med en procent resulterar i ett negativt antal fall av misshandel. Det ar alltsa en uppenbart olamplig modell for generell anvandning. En battre modell predikterar istallet graden av minskning, till exempel om arbetslosheten minskar med en procent sa minskar misshan- delsfallen med en tiondel. Sadana modeller, dar logaritmen av den beroende variabeln ar linjar, benamns som log-linjara modeller.
Om vi istallet har en modell som skattar sannolikheten att en person boendes i en viss kommun kommer bli misshandlad under ett ar stalls vi infor svarigheten med en variabel som ar bunden bade uppat och nedat. En linjar modell blir av latt insedda skal olamplig. Lampligare vore mojligen en modell som exempelvis forutsager att en viss okning av arbetslosheten fordubblar risken att raka ut for misshandel. Men sannolikheten kan inte garna oka fran 50% till 100%, eller over 100%. Lattare blir tolkningen om det istallet ar oddset som fordubblas, mer om odds senare. I det fallet har vi en logistisk modell.
4.2 GLM – Generalized Linear Model
Alla Generaliserade Linjara Modeller bestar av tre komponenter:
En slumpmassig del som bestammer den beroende variabeln Y och dess sannolikhetsfordelning. Y ar ofta binar dvs den har bara tva varden (i den har studien Misshandlad eller Ej Misshandlad). Lat (Y1, ..., Yn) beteckna observationer av Y efter n antal forsok, och Yi betecknar antal lyckade utfall. I det fallet antar vi att Y ar binomialfordelad.
I andra fall kan varje observation utgoras av ett antal, i sadana fall kan vi anta en fordelning av Y som galler for icke-negativa heltal sa som Poisson eller negativ binomial.
En systematisk del som utgors av linjarkombinationen av de forklarande variablerna {xi}. Den kallas aven den linjara prediktorn och har for- men:
α + β1x1 + ...+ βkxk
13
En variabel kan baseras pa andra tex x3 = x1x2. En sadan variabel kallas samspelsvariabel, x3 beskriver samspelet mellan x1 och x2.
En lankfunktion, en funktion g(.) som uppfyller
g(µ) = α + β1x1 + ...+ βkxk
dar µ = E(Y ). Lankfunktionen sammanbinder modellens slumpmassiga del med dess systematiska del.
4.2.1 Logistiska modeller
En logistisk regressionsmodell bestammer sambandet mellan en binar respon- svariabel och en eller flera forklarande variabler x = {x1, ..., xn}. Lat π(x) beteckna sannolikheten for ett lyckat utfall (i vart fall Misshandlad, lyckat utfall ska inte alltid forstas som onskvart utfall). Da galler:
π(x) = eα+β1x1+...+βnxn
1 + eα+β1x1+...+βnxn
Lankfunktionen vid logistisk regression kallas logitfunktionen och har for- men
logit[π(x)] = log
θ = π(x)
1− π(x)
4.2.2 Log-linjara modeller
Log-linjara modeller kan anvandas nar den beroende variabeln ar ett icke- negativt tal, sa som ar fallet vid raknedata eller antalsdata. For lankfunktionen g(µ) galler
g(µ) = log(µ) = α + β1x1 + ...+ βnxn
Har kommer vi lata Y vara negativt binomialfordelad, inte Poissonfordelad, se nasta avsnitt.
14
P (Y = y) = e−µµy
y!
Poissonfordelningen har endast en parameter µ > 0 som bade utgor dess vantevarde och varians,
E(Y ) = V ar(Y ) = µ
Om variansen ar storre an medelvardet for data foreligger overspridning. Den negativa binomialfordelningen har ytterligare en parameter vilket, i motsats till Poissonfordelningen, tillater att variansen ar storre an vantevardet. San- nolikhetsfunktionen for negativ binomialfordelning ar:
P (Y = y) =
( y + r − 1
r − 1
) (1− p)ypr
Dar 0 < p < 1 och r ar ett positivt heltal, eller ett positivt reellt tal i det generella fallet. Om r/p− r = µ galler:
E(Y ) = µ
r
Ibland betecknas 1/r med D som star for dispersion parameter, pa svenska overspridningsparameter. Nar D → 0 (eller r → ∞) kommer V ar(Y ) → µ och den negativa binomialfordelningen konvergerar mot Poissonfordelning.
4.4 Val av variabler
Om antalet regressionsvariabler ar fa kan man ta fram alla tankbara modeller och sedan valja den som bast uppfyller de pa forhand uppstallda kriterierna. Nar prediktorvariablerna ar manga blir den metoden opraktisk, da kravs andra strategier for att finna vilka variabler som bor inga i modellen.
15
4.4.1 Framatval
En sadan metod for stegvis regression ar framatval. Har utgar vi fran en enkel modell med endast en prediktorvariabel. Sedan adderar man en variabel i taget tills dessa inte bidrar till en betydande forbattring av modellen. Det finns olika kriterier pa vad som utgor en vasentlig forbattring av modellen, har kommer vi i forsta hand fokusera pa variablernas p-varde.
4.4.2 Bakateliminering
En annan strategi ar att utga fran en fullstandig modell, en modell som in- nehaller alla tankbara regressionsvariabler. Sedan utesluter man den variabel som, enligt nagot kriterium, minst bidrar till modellens giltighet. Proceduren avslutas nar inga variabler kan plockas bort utan att det leder till en avsevard forsamring av modellen.
Har bor man beakta att dessa metoder ar hjalpmedel for att fa fram en modell och att det finns andra overvaganden att gora, exempelvis gallande modellens meningsfullhet eller undersokningens karaktar, nar man lagger till eller utesluter en variabel.
4.5 Modelldiagnos
4.5.1 Residualanalys
Skillnaden mellan det observerade vardet och modellens uppsakattade varde kallas residual. En stor residual behover inte nodvandigtvis betyda att mo- dellen ar dalig. For Poissonfordelningen galler att standardavvikelsen ar
√ µ,
och den negativa binomialfordelningen har an storre standardavvikelse, sa ju storre µ desto storre residualer kan man vanta sig. Ofta ar det intressantare att betrakta den standardiserade residualen
Standardiserad residual = yi − µi SE
dar man dividerar residualen med standardfelet. Om absolutvardet ar storre an tre kan det finnas anledning att betrakta standard residualen som stor aven om sa stora varden kan uppsta slumpmassigt vid ett stort antal obser- vationer.
16
Om tva (eller flera) forklarande variablers kovarianser ar starkt korrelerade foreligger (multi)kollinearitet mellan dessa. For att undvika detta kan man berakna variablernas variansinflationsfaktor – VIF. VIF-vardet for xi upp- skattar hur uppblast variansen ar pa grund av kollinearitet:
V IF = 1
1−R2 i
dar R2 i ar forklaringsgraden som erhalls nar xi stalls mot ovriga prediktorer i
en regressionsmodell [10]. Det rader ingen enighet kring hur stort VIF-vardet maste vara for att orsaka problem men enligt tumregeln galler [7]:
1 – ingen korrelation
Storre an 5 – stark korrelation
4.5.3 AIC
Ett matt pa den relativa kvaliten hos en regressionsmodell erhaller Akaikes Informationskriterium, AIC. Ingen modell kan avbilda verkligheten perfekt men givet en uppsattning modeller att valja bland tillhandahaller AIC en skattning av modellernas kvalitet relativt varandra och kan darmed vara behjalpligt i selektionsprocessen.
Ett lagre AIC-varde tyder pa en battre modell. En av AIC-kriteriets styr- kor ligger i att det tar hansyn bade till risken att modellen ar overanpassad och faran for underanpassning, se Figur 3. Lat L beteckna den maximera- de log-likelihoodfunktionen och k sta for antalet variabler i modellen, da beraknas AIC-vardet genom:
AIC = 2k − 2ln(L)
− 10
X
Y
Figur 3: Rod linje representerar en underpassad modell och gron linje en overanpassad. Bla linje uppvisar, trots sin enkelhet, god anpassning vilket genererar lagst AIC-varde.
4.5.4 Devians
En annan metod for att valja mellan modeller ar att jamfora modellernas devians. Lat LM beteckna det maximerade log-likelihoodvardet for var aktu- ella modell och LS vara det maximerade log-likelihoodvardet for den mattade (saturerade) modellen. Den mattade modellen ar den mest komplexa model- len vi kan konstruera, som har en parameter for varje observation, och salunda ar perfekt anpassad efter data. Deviansen beraknas genom:
Devians = −2(LM − LS)
Vid val mellan tva modeller M1 och M2, dar M1 ar en enklare modell an M2, kan vi bedoma modellerna genom att jamfora deras devians
18
Devians1 −Devians2 = −2(L1 − LS)− [−2(L1 − LS)] = −2(L1 − L2)
Teststatistikan ar stor nar den enklare modellen ar vasentligt samre an M2. Vidare ar den approximativt χ2 fordelad dar antalet frihetsgrader utgors av skillnaden mellan de bada modellernas frihetsgrader. Nollhypotesen sager att den enklare modellen ar lika bra som den mer komplexa. Stora varden pa teststatistikan ger litet p-varde och nollhypotesen forkastas.
4.5.5 ROC-kurvor
ROC-kurvan ar en plot av sensitiviteten, dvs modellens sannolikhet att ge ett korrekt positivt resultat, som en funktion av specificiteten, alltsa modellens sannolikhet att ge ett korrekt negativt resultat, for olika sannolikhetsnivaer π.
Nar π ligger nara 0 kommer nastan alla prediktioner vara positiva och darmed ge en sensitivitet nara 1, specificiteten hamnar nara noll och salunda blir vardet for (1-specificiteten, sensitiviteten) nara (1,1). Om π istallet narmar sig 1 kommer sensitiviteten hamna nara 0 och specificiteten nara 1, koordi- naterna for den konkava ROC-kurvans tva andpunkter ar darfor (0,0) och (1,1).
Arean under ROC-kurvan brukar betecknas AUC (Area Under Curve), vid jamforelse mellan modeller prioriteras modellen med hogre AUC.
5 Resultat
I foljande avsnitt kommer vi anvanda de metoder som atergavs i teoriavsnit- tet for att konstruera och utvardera vara bada regressionsmodeller.
5.1 Val av variabler
Vi borjar med att kombinera framatval och bakateliminering for att salla ut vilka variabler som ska inga i de preliminara modellerna, sedan undersoker vi om det finns anledning att inkludera eller eliminera variabler for att testa studiens hypotes.
19
5.2 Logistisk modell
Forst undersoker vi vilka variabler som ar signifikanta for den logistiska mo- dellen som innehaller alla huvudeffekter. Responsvariabeln for den har mo- dellen ar sannolikheten att bli misshandlad av bekant garningsman. Predik- torerna Densitet, Innerstad och Utlandsk bakgrund visar ingen signifikans och plockas darfor bort ur modellen. VIF-vardena for modellen avslojar dock att det, precis som vantat, foreligger en stark kollinearitet mellan Bistand och Arbetsloshet vilket foranleder oss att plocka bort variabeln med lagst signifi- kans – Arbetsloshet. De kvarvarande variablerna med VIF-varden redovisas i tabell 5:
Tabell 5: Huvudeffekter logistisk modell Huvudeffekt p-varde VIF-varde β∗
Kon:Kvinna < 0,001 1,00 5.8× 10−1
Plats:Inne < 0,001 1,00 1.2 Relation:Nara < 0,001 1,00 2.2× 10−1
Tunnelbana < 0,001 2,36 1.9× 10−6
Bistand < 0,001 3,16 9.3 Mobilitet < 0,001 1,89 −4.0
Nasta steg blir att addera samspelsvariabler. For att inkludera en sam- spelsvariabel kravs att den vasentligt forbattrar modellen och/eller att det kan motiveras av studiens karaktar och hypotes.
Enligt hypotesen domineras kategorin misshandel mellan bekanta av fa- miljevald inklusive partnervald och forstas bast genom desorganisationsper- spektivet. Den forsta delen foranleder oss att testa
Kon:Kvinna × Plats:Inne
Kon:Kvinna × Relation:Nara
Plats:Inne × Relation:Nara
da dessa samspel kan antas vara positiva om hypotesen ocksa speglas i data. Med dessa nya variabler i modellen far vi parameterskattningar redovisade i tabell 6.
20
Kon:Kvinna × Plats:Inne < 0,001 6,44 6.9× 10−1
Kon:Kvinna × Relation:Nara < 0,001 4,91 1.2 Plats:Inne × Relation:Nara < 0,001 6,55 8.0× 10−1
Noterbart ar att variabeln Tunnelbana, som har betraktas som en opera- tionalisering av rutinaktivitetsperspektivet, ar signifikant och positiv vilket antyder att vissa antaganden i hypotesen utgor en forenkling av verkligheten. Vi staller upp en ny hypotes att det finns tva tendenser i datamaterialet:
1. Som tidigare har vi en del bestaende av familje- och parnervald
2. Dessutom har vi en komponent, mer beslaktad med gatuvald, associe- rad med rutinaktivitetsteorins forklaringsmodell
Den nya hypotesen, eller den nya delen av hypotesen, ger oss anledning att undersoka foljande samspel
Tunnelbana × Kon:Kvinna
Tunnelbana × Relation:Nara
Tunnelbana × Plats:Inne
Da rutinaktivitetsteorin sammanlankas med gatuvald borde dessa sam- spel vara negativa.
Totalt testar vi sex samspelsvariabler i den nya modellen, resultaten re- dovisas i tabell 7.
Tabell 7: Samspel utokad logistisk modell Samspel P-varde VIF-varde β∗
Kon:Kvinna × Plats:Inne < 0,001 6,52 6.6× 10−1
Kon:Kvinna × Relation:Nara < 0,001 4,93 1.2 Plats:Inne × Relation:Nara < 0,001 6,63 7.7× 10−1
Tunnelbana × Kon:Kvinna 0,002 3,95 −1.3× 10−6
Tunnelbana × Relation:Nara < 0,001 3,39 −1.5× 10−6
Tunnelbana × Plats:Inne < 0,001 4,61 −2.7× 10−6
21
5.2.1 Jamforelse av modeller
For att bestamma vilken av de tva kandidatmodellerna som ar bast anvander vi oss av metoder beskrivna i teoriavsnittet.
5.2.2 Residualer
Forst analyserar vi modellernas kvalitet genom att berakna och jamfora deras standardiserade residualer med hjalp av funktionen rstandard i R. Tumregeln sager att standardiserade residualer med ett absolutvarde storre an tre tyder pa samre anpassning.
Den forsta modellen har sju standardiserade residualer med ett varde storre an tre, den storsta ar sa stor som 5,74. Den andra modellen, som del- vis inkluderar ett rutinaktivitetsperspektiv, har endast tva standardiserade residualer med absolutvarde storre an tre, den storsta med absolutvarde 3,29.
Bara genom att jamfora residualerna ser vi att de adderade samspelsva- riablerna i Modell 2 innebar en avsevard forbattring jamfort med den forsta modellen.
5.2.3 Devians och AIC
Genom jamforelse av modellernas devians och AIC-varden finner vi ytterli- gare kriterier vid val av modell.
Tabell 8: Devians och AIC-varden Modell Devians AIC-varde df Logistisk Modell 1 260,22 832,56 102 Logistisk Modell 2 172,70 750,04 99
Av tabell 8 framgar att Modell 2 har avsevart mycket lagre AIC-varde vilket talar till dess fordel.
Nasta steg blir att jamfora modellernas devians. Ar den mer komplexa Modell 2 en vasentlig forbattring av Modell 1 ? Med hjalp av χ2-testet fran
22
kapitel 4.5.4 kan fragan besvaras. Nollhypotesen sager att Modell 2 inte forbattrar den enklare Modell 1. Differensen mellan modellernas devians ar 260.22 − 172.70 = 87.52 och antalet frihetsgrader ar 102 − 99 = 3. Om vi later α = 0.001 sa ligger det kritiska vardet for χ2 fordelningen med tre fri- hetsgrader pa 16.3. Nollhypotesen forkastas da 87.52 > 16.3 och testet ger starkt signifikant stod at att Modell 2 ar den battre modellen.
5.2.4 ROC-kurvor
Slutligen plottar vi modellernas ROC-kurvor och beraknar deras respektive AUC-varde for att avgora vilken modell som bast forklarar data (se avsnitt 4.5.5). I R maste var beroende variabel vara formulerad som ettor och nollor for att producera ROC-kurvor. Egentligen ar responsvariabeln en lang rad ettor och nollor men dessa konverteras till ett reellt tal mellan 0 och 1, talet motsvarar andelen ettor av det totala antalet data. For att omvandla responsvariabeln till en binar variabel later vi de kategorier med skattad sannolikhet > 0.0013, vilket ar det genomsnittligt skattade vardet for alla kategorier, tilldelas vardet 1, ovriga tilldelas vardet 0.
23
0. 0
0. 2
0. 4
0. 6
0. 8
1. 0
AUC: 0.969
AUC: 0.949
Figur 4: ROC-kurvor for Modell 1 och Modell 2.
Resultaten av ROC redovisas i Figur 4. Bada modellerna visar upp god anpassning, AUC-varden mellan 94-97 % anses hogt, men aven har ar det Modell 2 som ar nagot battre.
Har kan vi paminna oss om att nar vi konverterar den beroende variabeln till binar form sa ar det en approximering, salunda ar ocksa ROC-kurvorna approximeringar och man kan misstanka att AUC-vardena ar aningen opti- mistiska. Men oavsett hur vi valjer gransvardet nar vi skattar responsvaria- beln ar resultaten entydiga, Modell 2 far hogre AUC-varde.
5.2.5 Val av logistisk modell
Modell 1 har tva fordelar; den ar enklare och den uppvisar lagre grad av korrelation mellan de oberoende variablerna. I ovrigt talar allt till Modell 2 :s fordel.
24
Modell 2 har mindre standardiserade residualer, endast tva har ett ab- solutvarde storre an 2 jamfort med Modell 1 som har sju residualer av den storleken.
En jamforelse mellan modellernas AIC-vardena visar ocksa att Modell 2 ar nagot battre.
χ2-testet av modellernas devianser ger aven det att Modell 2 ar en sig- nifikant forbattring. Slutligen visar ROC-kurvorna och de tillhorande AUC- vardena att den mer komplexa modellen ar battre att forklara data.
Sammantaget blir det tydligt att Modell 2 ar en klar forbattring av den ursprungliga, enklare, modellen och vi valjer den for vart fortsatta studium. Figur 9 sammanfattar var slutgiltiga modell.
Tabell 9: Faststalld logistisk modell Variabel β∗ p-varde Intercept −7.2 < 0,001 Kon:Kvinna −3.8× 10−1 < 0,001 Relation:Nara −9.8× 10−1 < 0,001 Plats:Inomhus 7.1× 10−1 < 0,001 Tunnelbana 5.4× 10−6 < 0,001 Bistand 9.1 < 0,001 Mobilitet −3.9 < 0,001 Kon:Kvinna×Relation:Nara 1.2 < 0,001 Kon:Kvinna×Plats:Inomhus 6.6× 10−1 < 0,001 Relation:Nara×Plats:Inomhus 7.7× 10−1 < 0,001 Kon:Kvinna×Tunnelbana −1.3× 10−6 0,0019 Relation:Nara×Tunnelbana −1.5× 10−6 < 0,001 Plats:Inomhus×Tunnelbana −2.7× 10−6 < 0,001 AIC=750.04 AUC=0.969
5.3 Log-linjar modell
Efter att modellen over misshandelsfall mellan bekanta konstruerats aterstar att ta fram en modell for vald mellan obekanta. Har uppstar fragan om vilken sannolikhetsfordelning for responsvariabeln som ger bast modell. Da det finns anledning att misstanka overspridning i vara data faller valet naturligt pa negativ binomialfordelning, se avsnitt 4.3.
25
I analogi med hur vi skapade den logistiska modellen borjar vi med att undersoka vilka huvudeffekter som ar signifikanta. Responsvariabeln ar nu antalet fall av misshandel i Stockholms kommun.
Densitet visar ingen signifikans och utesluts omedelbart ur modellen. Utlandsk bakgrund, Bistand och Arbetsloshet visar hog grad av korrelation och ar signifikanta var for sig men inte tillsammans. Det ar alltsa rimligt att behalla en och endast en av dessa variabler. Valet faller pa Bistand da den visar stark signifikans, dessutom ingick Bistand i den logistiska model- len vilket ocksa talar for att vi ska behalla den. Situationen ar liknande for variablerna Innerstad och Mobilitet, bada ar signifikanta var for sig men inte tillsammans. Da variabeln Mobilitet ar mer svartolkad an Innerstad valjer vi bort Mobilitet. De aterstaende variablerna sammanfattas i tabell.
Tabell 10: Huvudeffekter log-linjar modell Huvudeffekt p-varde VIF-varde β∗
Kon:Man < 0,001 1,01 1.0× 10−1
Plats:Ute < 0,001 1,00 5.5× 10−1
Population < 0,001 1,75 3.5× 10−5
Tunnelbana < 0,001 3,16 6.2× 10−6
Bistand < 0,001 3,48 6.5 Innerstad 0,0039 2,21 4.3× 10−1
Det enda som mojligen avviker fran hypotesens ar att Bistand, som vi forknippar med desorganisationsperspektivet, ar signifikant. Kanske ar det precis som i det tidigare fallet sa att hypotesen ar en for drastisk forenkling av verkligheten och att det aven har kravs en syntes av de bagge teorierna.
Vidare framgar att det foreligger en viss korrelation mellan huvudeffek- terna, framfor allt mellan Tunnelbana, Bistand och Innerstad, men da VIF- vardet haller sig klart under fem ar det pa en acceptabel niva.
Nar modellens huvudeffekter fastslagits aterstar att eventuellt lagga till samspelsvariabler. I linje med hypotesen om att vald mellan obekanta domi- neras av gatuvald ar vi intresserade av eventuella samband mellan Kon och Plats. I motsats till hypotesens forutsagelser valjer vi ocksa att undersoka om det finns samband mellan Bistand och de ovriga huvudeffekterna.
Modellerna visar att det finns ett positivt samband mellan Kon och Plats och att Bistand endast visar positivt signifikant samband med Population.
26
Vi valjer att ga vidare med tva konkurrerande modeller som bygger pa resul- taten av testkorningarna. Den enklare modellen, Modell 1, innehaller endast samspel mellan Kon och Plats medan den utokade Modell 2 aven inklude- rar samspel mellan Bistand och Population. Huvudeffekter ar desamma for bagge modeller, se tabell 10.
Tabell 11: Sammanfattning av log-linjara modeller
Modell Samspel p-varde β∗ AIC Devians DF Modell 1 Kon:Man × Plats:Ute < 0,001 6.30× 10−1 449.5 63.4 48 Modell 2 Kon:Man × Plats:Ute < 0,001 6.35× 10−1 430.9 44.8 47
Bistand × Population < 0,001 4.33× 10−4
Modell 2 har bade vasentligt lagre AIC-varde och devians vilket talar till dess fordel, men en av huvudeffekterna som ingar i den adderade samspelsva- riabeln, Bistand, ar inte langre signifikant vilket talar for Modell 1.
5.3.1 Residualer
I analogi med hur vi analyserade de logistiska modellerna borjar vi med att examinera de standardiserade residualerna.
Modell 1 har inga absolutvarden storre an tre och endast tre standar- diserade residualer har absolutvarde storre an tva. Modell 2 har inte heller standardiserade residualer med absolutvarde storre an tre och, precis som Modell 1, bara tre residualer som ar storre an 2. Modell 2 visar marginellt battre anpassning om man enbart ser till de standardiserade residualerna men skillnaderna ar trots allt relativt sma, vilket ocksa framgar i Figur 5 dar vi ser residualerna grafiskt representerade i en plot.
27
− 2
− 1
Figur 5: Visualisering av de standardiserade residualerna for de log-linjara Modell 1 och Modell 2.
5.3.2 Devians
Som i fallet med de logistiska modellerna gar vi vidare med att jamfora modellernas devians. Om Modell 2, som innehaller fler samspel, avsevart forbattrar Modell 1 talar det till dess fordel nar vi ska valja modell. Som tidigare anvands χ2-testet fran kapitel 4.5.4 i syfte att ta reda pa om sa ar fallet, och nollhypotesen ar fortfarande att den mer avancerade modellen inte forbattrar Modell 1. Differensen mellan modellernas devians ar 63.4− 44.8 = 18.6 och antalet frihetsgrader ar 48 − 47 = 1. Om vi later α = 0.001 sa ligger det kritiska vardet for χ2 fordelningen med en frihetsgrad pa 10.8. Nollhypotesen forkastas da 18.6 > 10.8 och testet ger starkt signifikant stod at att Modell 2 ar den battre modellen.
Om vi istallet analysera Modell 1 genom att jamfora den med den mattade
28
modellen, dvs med en modell som innehaller lika manga variabler som obser- vationer och som darfor ar perfekt anpassad efter data, far vi ocksa ett matt pa modellens kvalitet . Den mattade modellens devians ar noll och antalet frihetsgrader ar ocksa noll. Differensen mellan Modell 1 :s och den mattade modellens devians ar darfor densamma som deviansen for Modell 1, 63.4, och antalet frihetsgrader ar lika med frihetsgraden hos Modell 1 alltsa 48.
P-vardet for χ2-testet ar 0.068 och vi kan darmed inte forkasta nollhypo- tesen gallande den mattade modellen. Testet visar saledes att Modell 1 anda ar bra pa att beskriva vara data.
5.3.3 Val av log-linjar modell
Modell 1 ar enklare och mer lattbegriplig an Modell 2 och de bada model- lernas standardiserade residualer ar i samma storleksordning. Det som talar for Modell 2 ar dess lagre AIC-varde och χ2-testet som visar att Modell 2 innebar en signifikant forbattring. Men da den adderade samspelsvariabeln saknar naturlig tolkning, och da Modell 1 totalt sett visar god anpassning faller valet till slut pa den enklare modellen. En sammanfattning av den slutgiltiga log-linjara modellen aterfinns i tabell 12.
Tabell 12: Faststalld log-linjar modell Variabel β∗ p-varde Intercept 1.53 < 0,001 Kon:Man 6.67× 10−1 < 0,001 Plats:Utomhus 9.82× 10−1 0.30 Population 3.15× 10−5 < 0,001 Tunnelbana 6.18× 10−6 < 0,001 Bistand 4.50 < 0,001 Innerstad:IN 3.43× 10−1 0,0035 Kon:Man×Plats:Utomhus 6.30× 10−1 < 0,001 AIC=449.48
Noterbart ar att variabeln Plats inte ar signifikant, p-varde 0.30, nar vi lagger till samspelsvariabeln, men da Plats ar av intressen for studiens hypotes och da den dessutom ingar i samspelet finns det anda tillrackliga skal att behalla den.
29
5.4 Koefficienter
I det har avsnittet analyseras koefficienterna for de bada fastslagna model- lerna och huruvida de ar i overensstammelse med studiens hypotes.
5.4.1 Logistisk modell
Enligt hypotesen beskriver den logistiska modellen framforallt familje- och partnervald och darmed borde de kategoriska variablerna Kon:Kvinna, Plats:Inne och Relation:Nara vara positiva, vilket de ocksa ar nar vi endast har huvu- deffekter i modellen. Nar man adderar samspel mellan dessa tre variabler blir dock bade Kon:Kvinna och Relation:Nara negativa vilket forklaras av de stora och positiva koefficienterna for samspelsvariablerna, totalt sett ar tecknen for koefficienterna forenliga med vara antaganden.
Bistand ar precis som vantat, och helt i linje med desorganisationste- orin, positiv. Att Mobilitet ar negativ gar daremot pa tvars mot desor- ganisationsperspektivet. Rinkeby-Kista ar det stadsdelsomrade som sticker ut med klart hogst mobilitet, ett omrade som ocksa praglas av hog ar- betsloshet, stor andel med ekonomiskt bistand samt etnisk heterogenitet. Sa langt overensstammer data med teori men i listan over omraden med hogst mobilitet foljer darefter Ostermalm, Skarholmen, Norrmalm och Kungshol- men, tre av dessa ar valbargade innerstadsomraden medan Skarholmen lig- ger narmare Rinkeby-Kista i sin socialekologiska profil. Nagot som utmarker stadsdelarna i innerstan med undantag for Sodermalm ar att dar bor en hog procent av unga vuxna, ca 19-40 ar, och det ar den gruppen som flyttar mest pa grund av studier, jobbyte eller andra livsstilsforandringar, vilket antagli- gen ar forklaringen till dessa stadsdelsomradens hoga mobilitet.
Det verkar alltsa som att det finns tva olika faktorer som paverkar mobi- liteten i Stockholm i nutid och att de krafter som drev folk att flytta under den forsta halvan av 1900-talet i USA inte rakt av kan tillampas pa Sverige ar 2019.
Det framgar ocksa att variabeln Tunnelbana ar positiv vilket gar emot den ursprungliga hypotesen men som ar i linje med den utokade hypotesen fran 5.2. Vidare visar Tunnelbana negativt samspel med Kon:Kvinna, Plats:Inne och Relation:Nara vilket ocksa ar som vantat om Tunnelbana fangar upp en kategori av vald som ligger narmare det klassiska gatuvaldet.
30
5.4.2 Log-linjar modell
Den log-linjara modellen bjuder inte pa nagra stora overraskningar. De bada kategoriska variablerna Kon:Man och Plats:Utomhus ar positiva vilket var att vanta da vi har i huvudsak har att gora med gatuvald. Modellens enda samspelsvariabel, Kon:Man × Plats:Utomhus ar likaledes positiv och det av samma skal.
De tva variablerna som har betraktas som operationaliseringar av rutin- aktivitetsteorin, Tunnelbana och Innerstad:IN, ar ocksa, i overensstammelse med hypotesen, positiva. Population ar positiv vilket inte heller ar sarskilt forvanande.
Det som mojligen kan overraska ar att koefficienten for Bistand ar signi- fikant och positiv vilket kan antyda att ett ensidigt rutinaktivitetsperspektiv inte klarar av att forklara valdet mellan obekanta i sin helhet.
Sammanfattningsvis kan sagas att hypotesen om att valdet mellan be- kanta domineras av partner- och familjevald och att det bast forklaras av desorganisationsteorin och att misshandel mellan obekanta framfor allt ror gatuvald och bast analyseras med hjalp av rutinaktivitetsteorin i huvudsak stammer. Ett allt for ensidigt tillampande av de bada konkurrerande teorier- na riskerar dock att missa viktiga kategorier av vald och bast resultat uppnas nar man syntetiserar dessa bada teorier.
6 Slutsats och diskussion
6.1 Modeller och hypotes
6.1.1 Bekanta
Vi utgick fran hypotesen att vald mellan bekanta till stor del bestar av familje- och partnervald och att det i sin tur oftast sker inomhus, ofta nara bostadsadressen, och att det mestadels drabbar kvinnor. Vidare bedomde vi att en logistisk regressionsanalys vore mest intressant, och aven lattolkad, atminstone om hypotesen ar nagorlunda korrekt. Dessutom antog vi att desorganisationsteorin tillhandahaller det basta teoretiska ramverket for att hitta forklaringar till hur brottsfrekvensen varierar mellan olika stadsdels- omraden.
Analysen visade att hypotesen i hog grad ligger i linje med datamateri- alet men att det finns en valdskategori som inte fangades upp av ett strikt
31
6.1.2 Obekanta
Nar det kommer till vald mellan obekanta ar situationen nastintill den omvanda da partner- och familjevald, av latt insedda skal, helt saknas i datamateria- let som istallet domineras av gatuvald. Gatuvald, enligt hypotesen, intraffar framst utomhus och drabbar framfor allt man. Vi valde dessutom att anvanda en log-linjar modell da det inte finns anledning att anta nagot starkt samband mellan brottsplats och brottsoffrets hemomrade nar vi analyserar gatuvald. Till skillnad fran fallet med vald mellan bekanta antogs ocksa att rutinak- tivitetsperspektivet erbjuder den basta teorin for att forklara forekomst av gatuvald.
Precis som i det foregaende fallet ger analysen stod till hypotesen men visar ocksa svagheten i ett alltfor enahanda teoretiskt perspektiv. I bada fallen kommer vi narmast verkligheten nar vi for ihop desorganisationsteorin med rutinaktivitetsteorin, men hur vi gor det skiljer sig at i de bagge fallen.
6.2 Modellutveckling och framtida studier
Av praktiska skal har vi begransat oss till Stockholms kommun men man skulle kunna utoka studien till att omfatta andra, eller alla, svenska kommu- ner. Vissa variabler skulle man da tvingas andra, i synnerhet operationalise- ringarna av rutinaktivitetsteorins begrepp da andra kommuner i allmanhet saknar tunnelbana och distinktionen mellan innerstad och ytterstad.
En variabel som man istallet skulle kunna anvanda vore anstallda inom hotell- och restaurangbranschen, nagot som tidigare anvants med framgang i tidigare studier [1]. Eventuellt skulle ocksa den aktuella modellen forbattras om man inkluderade en sadan variabel.
En annan begransning ar att vi endast analyserat brottskategorin miss- handel inklusive grov misshandel. Har vore det spannande med en utokad studie som aven inkluderade andra brottstyper, i synnerhet andra former av
32
brott mot person, aven om det finns forskning som pekar pa samvariation mellan valdsaktivitet och andra former av brottslighet [8].
Det hade ocksa varit intressant att lata alder vara en variabel. Har har vi endast analyserat data for brottsoffer over 18 ar, om man delade upp dessa i alderskategorier hade man sannolikt kunnat urskilja spannande monster, till exempel finns det mycket som talar for att unga vuxna oftare drabbas av valdsbrott an aldre. Vilka faktorer som paverkar brottsutsatthet hos barn och ungdomar under 18 ar fortjanar ocksa att studeras narmare med modeller for att utveckla det brottsforebyggande arbetet.
Studien skulle ocksa kunna utvidgas till att omfatta data over flera ar for att upptacka langsiktiga trender eller dela upp data finare for att spara sasongsberoende variationer, variationer over dygnet etc.
Det vore ocksa intressant att gora en finare geografisk indelning da kan fin- nas stora skillnader inom samma stadsdel. Ta Bromma till exempel, en stads- del som praglas av lag social desorganisation och som saknar de storsta trans- portnoderna. Men om Brommas omraden analyseras utefter valdsintensitet ar det tre platser som sticker ut: Brommaplan och Alvik som ar trafikno- der och Blackeberg som ligger nara utsatta omraden i Hasselby [11]. Samma tendenser som kan urskiljas for hela staden verkar alltsa framtrada lokalt. Med en mer finmaskig geografisk indelning kunde man hitta och analysera kriminogena hotspots.
Med tillgang till individdata skulle en annan typ av studie kunna verkstallas som med stor sannolikhet hade givit en intressant inblick i vad som paverkar risken for den enskilde att drabbas av valdsbrott, exempelvis hade relationen mellan hemort och brottsplats kunnat analyseras noggrannare.
6.3 Praktisk tillampning
Risk- och orsaksanalys har pa olika satt anvants i brottsforebyggande syfte. Pa samhallelig niva har det tillampats med framgang for att skapa en tyd- ligare lagesbild for att darefter kunna satta in lampliga atgarder mot den befintliga brottsligheten [12]
Nar det kommer till hur den enskilde individen kan anvanda riskanalys for att starka sin personliga sakerhet och leva ett tryggare liv finns det inte lika mycket skrivet.
Sakerhetspolisen har, i samarbete med en rad andra myndigheter, ta- git fram en handbok Personlig sakerhet i vilken det framgar hur man med medvetna forhallningssatt, forberedelser och aktiva val kan skapa personlig
33
sakerhet [13]. Skriften riktar sig i forsta hand till politiskt aktiva men manga av raden ar sa allmanna att de aven lampar sig for andra grupper.
Personlig sakerhet ger exempel pa fragor man bor stalla sig vid analys av sin egen personliga sakerhet, exempelvis: Vilka aktiviteter behover du analy- sera sarskilt? Finns det information du behover samla in eller en sakkunnig du bor radgora med? Vilka atgarder kan du vidta for att minska risken? Var och nar ar det storst risk for att du bli utsatt for ett pahopp eller angrepp? Vilka mojligheter till skydd finns vid en hotfull situation? Vilka mojligheter finns att larma och snabbt fa hjalp om nagot skulle handa? For att kunna svara adekvat pa de fragorna ar vi overtygade om att den har studien, och andra liknande studier, kan spela en viktig roll.
34
Referenser
[1] Dolmen, Lars (2002) Brottslighetens geografi. Kriminologiska Institutio- nen, Stockholms Universitet
[2] BRA. 2021. Gor din egna tabell over anmalda brott. http://statistik. bra.se/solwebb/action/start?menykatalogid=1 (Hamtad 2021-02- 25)
[3] Stockholms stad. 2021. Omradesfakta - statistik om stadens delomraden. https://start.stockholm/om-stockholms-stad/
utredningar-statistik-och-fakta/statistik/omradesfakta/
2019.pdf (Hamtad 2021-03-08)
[5] SCB. 2021 Folkmangden efter region, civilstand, alder och kon. Ar 1968 - 2020 https://www.statistikdatabasen.scb.se/pxweb/sv/
ssd/START__BE__BE0101__BE0101A/BefolkningNy/ (Hamtad 2021-02- 25)
[6] Ceccato, V. & Attig, S. (2020) Brott pa tunnelbana 2009-2019 http://kth.diva-portal.org/smash/record.jsf?pid=diva2%
3A1452597&dswid=-713 (Hamtad 2021-03-14)
[7] Statistics How To. 2015. What is a Variance Inflation Factor? https:
//www.statisticshowto.com/variance-inflation-factor/ (Hamtad 2021-03-14)
[8] Dolmen, L. & Lindstrom, P. (1991) Skola Livsstil och Brott. Allmanna Forlaget
[9] Agresti, Alan (2007) An Introdution to Categorical Data Analysis. John Wiley & Sons, Inc
[10] Blom, G. & Holmquist, B. (1998) Statistikteori med tillampningar. Stu- dentlitteratur
[11] Mitt i Bromma. 2016. https://www.mitti.se/nyheter/har-ar-brommas- farligaste-platser/lmplf !867129/ (Hamtad 2021-05-05)
35
se/forebygga-brott/rad-for-framtiden.html (Hamtad 2021-05-03)
sakerhetspolisen.se/download/18.45d184aa1624da163ef271/
#garningsman bekanta
weights = Population)
pchisq(deviance(mod_bekant_e) - deviance(mod_bekant),
#bada kandidatmodeller
roc(Binar_respons, mod_bekant_e$fitted.values, plot = TRUE,
print.auc.y = 0.45)
#Korrelationsmartis, logistisk modell
+ Bistand + Mobilitet, data = dfdatab)
mod_obekant <- glm.nb(Antal_misshandel ~ Kon + Plats + Innerstad
+ Bistand + Tunnelbana + Population
#den enklare modellen
data = dfdatao,
family = negative.binomial(35.14))
#Berakning och plot av standardiserade residualer for Modell 1 och 2
resid.mod1 = rstandard(mod_obekant)
resid.mod2 = rstandard(mod_obekant_1)
legend("topright", legend = c("Modell 1", "Modell 2"), col = c("red","#377eb8"),
pch = c(4, 19), cex = 1.35)
# Korrelationsmatris, variabler log-linjar modell
+ Population + Plats*Kon, data = dfdatao)
38