Je moet er goede ogen voor hebben. Als bijziende zie ik details stúkken beter zonder bril dan met. Nou, dat heb ik goed kunnen gebruiken.
Big data is nogal 'een dingetje'. We leggen vanalles vast. Daarin moeten we zelf toch verborgen zitten dan?! En, nog mooier, daarin moeten ook dingen te zien zijn die we zelf nog niet eens bedachten. Data mining heette dat een jaar of tien, vijftien geleden; het zoeken naar verbanden in grote databestanden.
Dat is link.
Zonder idee, zonder theorie data crunchen, data vermalen is precies hetzelfde als wat onwetende oermensen deden met natuurverschijnselen: er werd een verklaring bij gezocht. Nu zijn wij uiteraard véél geciviliseerder, véél slimmer en véél verstandiger en dús doen we dat niet. Toch?
Nou, mooi wel. Vooral hier in de wereld van de big data loert dat gevaar. Databestanden kun je draaien, wentelen en je kunt er berekeningen op loslaten totdat je systeem ineens piept: Significant Verband Gevonden! En dan blijkt dat kinderen inderdaad door ooievaars worden gebracht, want er is een significant verband vastgesteld tussen hun komst en de piek aan geboorten. Dat het geen causáál verband is... Tja, dát had die theorie moeten aanreiken.
Met de nodige voorzichtigheid zijn big data wel degelijk enorm interessant. Want ze kunnen ook theoretische noties genereren. Want zo werkt dat; je ziet iets, snapt het niet en probeert het te verklaren. Dat de oermens hogere machten de natuur lieten beheersen, had alles van doen met de toen beschikbare kennis. Ze begónnen pas. Net zoals wij nog steeds bar weinig snappen van zowel wat 'leven' nu feitelijk is, als van dat startpunt van alles, de oerknal. Dat er 'gewoon iets is begonnen op basis van toeval' - mijn idee erover - gaat er meestal niet in, want 'alles heeft een reden, een begin'.
Een mooi voorbeeld hoe dat werkt, gaf CNN me in handen in de vorm van dit artikel:
Gelet op de in het artikel genoemde aantallen is dit wel big data. Maar het leukst vind ik dus de laatste zin. Als je in de resultaten ziet dat Engeland vooral iOS is - Apple-spul gebruikt dus - en Spanje android, en als je weet dat ze ongeveer dezelfde inkomensniveaus, dan is de vraag aan de orde waarmee je het verschil dan verklaard. Op basis van díe veronderstellingen kun je dan weer verder zoeken. Zijn de Spanjaarden anti-autoritair? En kiezen ze daarom voor open source? En heb je Nederland gezien? De randstad rood en de rest groen.
Uiteraard heb ik gedaan wat iedereen doet die een speeltje in handen heeft: effe proberen. En waar op? Op de plek waar ik woon. Je hebt er wél goede ogen voor nodig. In, slecht leesbare, letters staan de wijken in de kaart. Zelfs als bijziende was het een opgave.
Dit is Leiden:
Echt enorm verrast ben ik niet. Zowel iOS als Androïd. En als je het zou kunnen zien, ook Blackberry en 'anders'. Redelijk wat 'anders' overigens.
Wat me wél frappeerde, is dat de concentraties niet willekeurig zijn. Als ik het goed zie, zijn het bijvoorbeeld de beide stations, het stadscentrum en de snelwegen. Dat vind ik toch best opvallend. Zeker de stations en het centrum kunnen nogal druk zijn. Maar toch
tweeten we dan vooral als we onderweg zijn?!
Geen opmerkingen:
Een reactie posten