Czego dane z Chicago nauczyły mnie o przestępczości?
Od 2001 roku Chicago zbiera informacje o wszystkich zarejestrowanych przez policję przestępstawach i od kilku lat udostępnia je na Chicago Data Portal. Już z samych tych danych można wyciągnąć ciekawe wnioski, ale jeszcze ciekawiej się robi, gdy uświadomimy sobie, że tamtejsza stacja meteorologiczna udostępnia dane o pogodzie dla tego samego okresu (O’Hare Airport Station, NOAA’s National Centers for Environmental Information). Analizując to połączenie można zaobserwować kilka interesujących korelacji. Przyjrzyjmy się im.
Aby uczynić ten post bardziej atrakcyjnym przy wszystkich wynikach umieściłem link do kodu, który pozwala je obliczyć (w podpisach pod wizualizacjami). Przy pomocy tych snippetów oraz danych pobranych z wymienionych już portali można odtworzyć wszystkie wyniki. Jeśli więc jesteś zainteresowany odkrywaniem wiedzy lub przetwarzaniem danych możesz, wzorując się na tych fragmentach, samemu pobawić się z zaprezentowanymi danymi. Natomiast jeśli jesteś bardziej ambitny możesz sam napisać ten kod, a dopiero potem zobaczyć rozwiązania.
Liczba przestępstw spada
Takie stwierdzenie może wydawać się niepoprawne politycznie w czasach, gdy powszechne jest przekonanie, że z roku na rok jest coraz gorzej. Ale fakt jest taki, że liczba przestępstw w Chicago spada i aktualnie jest średnio prawie 2 razy mniejsza niż w 2001 roku.
Podobnie spada liczba przestępstw w większości cywilizowanych miast, choć często zmiany nie są aż tak wyraźne.
Istotnym pytaniem jest jednak, czy ta zmiana jest wynikiem rzeczywiście mniejszej aktywności przestępczej, czy też na przykład złagodzeniem prawa dotyczącego narkotyków. Aby to sprawdzić, popatrzmy jak zmieniała się w czasie liczba przestępstw dla konkretnych dużych kategorii.
Typ | Liczba |
THEFT | 1470337 |
BATTERY | 1280265 |
CRIMINAL DAMAGE | 796818 |
NARCOTICS | 716674 |
ASSAULT | 438977 |
OTHER OFFENSE | 433657 |
BURGLARY | 397223 |
MOTOR VEHICLE THEFT | 321094 |
DECEPTIVE PRACTICE | 272647 |
ROBBERY | 263090 |
CRIMINAL TRESPASS | 199841 |
WEAPONS VIOLATION | 77025 |
PROSTITUTION | 68410 |
PUBLIC PEACE VIOLATION | 49235 |
OFFENSE INVOLVING CHILDREN | 45584 |
CRIM SEXUAL ASSAULT | 27488 |
SEX OFFENSE | 25276 |
INTERFERENCE WITH PUBLIC OFFICER | 16712 |
GAMBLING | 14470 |
LIQUOR LAW VIOLATION | 14178 |
ARSON | 11488 |
HOMICIDE | 10014 |
KIDNAPPING | 6807 |
INTIMIDATION | 4086 |
STALKING | 3569 |
Po przeanalizowaniu zmian dla różnych kategorii przestępstw zaobserwować można, że wszystkie one spadają. Rzeczywiście narkotyki szybciej od innych kategorii, ale stanowią one raptem 10% wszystkich przestępstw, więc same nie wpłynęłyby na tak znaczne zmiany. Wyraźnie spada liczba przestępstw we wszystkich kategoriach.
Liczba przestępstw waha się na przestrzeni roku
Średnia liczba przestępstw w miesiącu waha się wyraźnie na przestrzeni roku. Szczególnie dobrze widać te cykliczne oscylacje, gdy przeanalizujemy średnią liczbę przestępstw na dzień w każdym miesiącu.
Tutaj średnia liczba przestępstw na dzień uśredniona dla każdego z miesięcy w roku:
Co ciekawe, liczba przestępstw waha się również na przestrzeni tygodnia, choć w znacznie mniejszym stopniu. Złodzieje okazują się najbardziej aktywni w piątki (być może dlatego, że wtedy ludzie spędzają czas poza domem), natomiast najmniej aktywni są w niedzielę. Może sumienie im wtedy nie pozwala? A może po prostu wszyscy potrzebują dnia na odpoczynek?
Interesującym pytaniem jest skąd takie wahania na przestrzeni roku? Jedynym istotnym czynnikiem, jaki udało mi się odkryć, jest temperatura.
Zależność między temperaturą, a liczbą przestępstw
Ogólna reguła jest taka, że im wyższa temperatura, tym więcej przestępstw. Tutaj przedstawiona jest średnia liczba przestępstw na dzień dla przedziałów temperatury po 10 stopni Fahrenheita.
Przy niskich, zimowych temperaturach mamy średnio 771,9 przestępstw. W upalne dni wartość wzrasta o 43% - do 1105,7 przestępstw. Wzrosty te nie są takie same dla wszystkich kategorii. Przykładowo w kategorii “narkotyki” nie ma wzrostu, a wręcz można mówić o spadku przy wyższych temperaturach.
Napaście rosną natomiast bardzo szybko wraz z temperaturą. Dużo szybciej, niż na przykład uszkodzenie mienia.
Nasuwający się wniosek jest taki, że im cieplej, tym prawdopodobnie ludzie chętniej wychodzą z domów, a więc jest więcej okazji sprzyjających tego typu przestępstwom. Są też pewne podstawy by przypuszczać, że temperatura ma wpływ na zachowanie.
Podsumowanie
Szersze analizy powinniśmy raczej pozostawić kryminologom, ale zobaczyliśmy kilka ciekawych korelacji, które można zaobserwować dla udostępnionych danych o przestępczości. Średnia liczba przestępstw:
- systematycznie spada
- rośnie wraz z temperaturą
- oscyluje na przestrzeni roku, ze szczytem w lipcu i minimum w grudniu
- oscyluje na przestrzeni tygodnia, z maksimum w piątek i minimum w niedzielę