Video: Wat is er 'Big' aan 'Big Data'? | BIG DATA (November 2024)
De nieuw opkomende "big data" -meme is nooit op een zinvolle en definitieve manier gedefinieerd. Het is de meest amorfe nieuwe buzz-term die ik al tien jaar heb gezien. Het is een van die termen van 'oog van de toeschouwer' die werden gebruikt om een seminar op te vrolijken en uiteindelijk beleggers te laten genieten.
Laten we beginnen met de vraag wat big data betekent? Veel data? Meer gegevens dan u aankan? Amorfe gegevens? Uit de hand gegevens? Nuttige gegevens voor analyse? Nutteloze gegevens? Informatie overbelasting?
Als je genoeg leest over big data, is dit alles en meer. De sleutel is niet de data, maar de uitdaging hoe om te gaan met de data en wat te doen met de data zelf.
Met andere woorden, hoe kunnen we deze enorme stapel gegevens die we hebben verzameld, nuttig maken op nieuwe en winstgevende manieren? De datapools kunnen overal vandaan komen via verschillende computermechanismen zoals Facebook-berichten, NSA-logs, mailinglijsten, klanten, enz.
Ik zou beweren dat de meeste lezers van deze kolom zelf repositories zijn van big data. Ik heb net een 3 Terabyte-schijf gekocht voor back-up. Ik heb veel gegevens om een back-up van te maken! Big data!
Een handig hulpmiddel dat ik me kan voorstellen, is een hulpmiddel voor het analyseren van big data dat de politie zou kunnen gebruiken om u schuldig te maken aan een willekeurig misdrijf door uw bestanden te doorlopen. Of vind tenminste iets dat je in verlegenheid zou brengen. Big data!
Dit alles is gebaseerd op een opmerking van een voormalige CEO van American Express, die een publiek vertelde dat als het bedrijf dit wilde (en dit geldt voor alle creditcardbedrijven) het uw persoonlijke koopgewoonten en -tendensen zou kunnen gebruiken om een compleet dossier en zeker vertellen of u een affaire hebt of niet. Big data!
Voor zover ik weet, is dit precies wat big data het beste doet, mensen bespioneren.
Het populaire commentaar van de industrie is dat op een of andere manier enorme databases die informatie over u bevatten, voor uw voordeel zullen worden gebruikt. Ja, weet je, dus je krijgt s voor dingen waar je echt in geïnteresseerd bent. Gerichte reclame. Dit komt iedereen ten goede!
Hier is hoe dit werkt. Ik ben geïnteresseerd in het kopen van een nieuwe camera en hoor over de nieuwe Bogus One. Ik lees een artikel op PCMag.com over de camera, dan ga ik naar Amazon en bekijk de prijzen en gebruikersrecensies. Het lijkt alsof niemand de camera leuk vindt. Het is een voor de hand liggend stuk onzin. De recensenten schuwden allemaal de camera. De kopers haten de camera. Dit is geen camera die ik wil. Maar de big data-analyse software besluit me honderden advertenties te geven, op elke webpagina die ik bezoek, alle met de Bogus One-camera. Big data!
Het is erger dan dat. Als het de andere kant op zou gaan en ik besloot dat ik de camera leuk vond en wilde en de camera daadwerkelijk kocht, kreeg ik nog steeds advertenties die me aanmoedigden om de camera te kopen. Big data!
Gerichte "big data" -reclame is de grootste belasting ooit.
OK, dus laten we dat fiasco vergeten en overgaan op het gebruik van big data voor trends. Big data kan verschillende naalden in verschillende hooibergen vinden. Dus je zou zoiets krijgen: Veertig procent van alle kopers van Subaru zijn vegetarisch / veganistisch en 80 procent van hen zijn democraten. Maar dat aantal steeg tot respectievelijk 60 procent en 90 procent als we het hebben over een Subaru Outback. Bovendien neemt het toe tot 99 procent vegetarisch / veganistisch en 99 procent democraat als de auto groen is geverfd.
Big data-theoretici zouden op het seminar een velddag hebben met deze informatie. Maar het negeert alle variabelen die de berekeningen en trends kunnen veranderen, die eindeloos zijn. Hoe lang zal een van deze specifieke big data standhouden als de CEO van Subaru naar een bijeenkomst in een groene Outback rijdt en verklaart dat "Alle walvissen moeten worden vernietigd!"?
Er is niet eens zoveel nodig om de dynamiek van big data-conclusies te veranderen. Ondanks wat de American Express-man zegt, zijn gegevens eigenlijk blind. Daarom krijg je advertenties voor producten die je al hebt gekocht.
Met big data zou je snel conclusies trekken.
Als iemand tien boeken koopt over het maken van een bom, betekent dit dan dat hij het federale gebouw wil opblazen? Wat als hij een expert was in de verwijdering van bommen en dat niet was opgenomen in zijn functie als politie-adviseur? Big data kan nog niet alles weten. Het kan niet weten wat je denkt. Ik denk bijvoorbeeld dat de Bogus One-camera slecht is. Big data kan dat niet weten tenzij ik wordt ondervraagd. En ik kan erover liegen.
Dit klinkt allemaal niet goed of gezond voor de samenleving. Springen naar conclusies, veronderstellingen maken, handelen op basis van valse veronderstellingen. Het publiek achtervolgen met nutteloze s.
Big data als een hoog concept zal zichzelf nooit volledig definiëren en een ellendige dood sterven. Ik hoop.