Huis Appscout Hoe big data toe te passen op de echte wereld

Hoe big data toe te passen op de echte wereld

Video: Big Data In 5 Minutes | What Is Big Data?| Introduction To Big Data |Big Data Explained |Simplilearn (November 2024)

Video: Big Data In 5 Minutes | What Is Big Data?| Introduction To Big Data |Big Data Explained |Simplilearn (November 2024)
Anonim

In deze editie van Fast Forward sprak ik met Hicham Oudghiri, de CEO en mede-oprichter van Enigma, een bedrijf dat gespecialiseerd is in het verzamelen en begrijpen van grote gegevenssets. Enigma is een operationeel datamanagement- en inlichtingenbedrijf voor particuliere klanten, maar het is misschien het best bekend voor Enigma Public, een verzameling doorzoekbare, publiek toegankelijke datasets met alles van de salarissen van White House Office-medewerkers tot restaurantinspecties in New York City. We spraken over de kracht van big data, de grenzen van de privacy van consumenten en de toekomst van onze data-driven wereld.

Waarom leg je me niet een beetje uit over wat een open databedrijf vandaag betekent?

Absoluut. We begonnen met het verzamelen van een enorme hoeveelheid openbare gegevens overal waar we die konden vinden, met als missie echt proberen om zeer uiteenlopende feiten over de wereld te verbinden. We realiseerden ons daarbij dat net zo goed als de toegang tot deze onderliggende gegevens werd verbroken, dit patroon weergalmde voor de eigen gegevens van mensen, voor publiek-private datarapportageschema's zoals in regelgevingsomgevingen. Wat we echt brachten, was het idee van open data als operationeel model overal waar we kwamen.

Onze 'sweet spot' van vandaag is het cultiveren van deze enorme opslag van activa van openbare gegevens en deze te laten werken in echte probleemomgevingen, vaak achter de firewall voor bedrijven. Hoewel we een enorme hoeveelheid gegevens verzamelen en distribueren, hebben we geconstateerd dat het nemen van de volgende stap voorwaarts om die gegevens daadwerkelijk te interpreteren en te koppelen aan privégegevens, echt helpt om de impact van enkele van de problemen die we wilden oplossen te verkleinen.

Mensen horen over open gegevenssets, openbare gegevenssets, privégegevenssets. Over wat voor datasets hebben we het hier?

We hebben het over brongegevens, officiële gegevens, dingen die overheidsinstanties zouden publiceren, dingen die internationale instanties zouden publiceren, alles wat ongelijk is, van bedrijfsregistratie en eigendomsbeoordelingen tot H-1B visa of vrachtcontainerzendingen. Absoluut niet praten over dingen zoals LinkedIn-gegevens, wat recent een enorm onderwerp van discussie is geweest over de vraag of dat zelfs een openbare gegevensset is. Er was onlangs die rechtszaak met veel twist.

Maar we hebben het vooral over officiële brongegevens, waar een mandaat en een soort formele wettelijke goedkeuring bestaat om dit openbaar te maken, meestal voor het vergroten van de transparantie in het economische en handelsstelsel. Het is erg belangrijk voor ons om bijvoorbeeld te weten vanuit het oogpunt van verantwoording, wat onze overheid uitgeeft aan de verschillende particuliere bedrijven, of vanuit het oogpunt van verantwoording, wat de verdeling van visa is tussen bedrijven. Die gegevens worden vaak door de overheid verzameld voor alternatieve doeleinden zoals rapportage, planning, toewijzing van middelen en vervolgens teruggegeven aan het publiek voor dit secundaire en vaak tertiaire voordeel. Het meest populaire voorbeeld is alleen weergegevens, toch?

Alle weergegevens die we verzamelen, zijn afkomstig van officiële bronnen of GPS als technologie.

Dus u neemt al die openbare gegevenssets en dan kunt u ze samenvoegen met privégegevenssets die een bedrijf u specifiek zal geven en echt de inzichten zien tussen het combineren van de twee?

Ja, heel vaak. Denk aan een canonieke use case waarin je probeert iets te doen als uitzoeken of een bedrijf echt is. Als het een klein bedrijf is, neem bijvoorbeeld een restaurant of een klein bedrijf. Heel vaak is het soort profiel dat ze zouden hebben extreem dun. Maar als je naar dingen zou kijken zoals hun drankvergunningen of zelfs inspecties van het Department of Labour of inspecties van het gezondheidsdossier, krijg je een veel gedetailleerder beeld van wie ze zijn.

Vaak helpt dat deze bedrijven een soort van instantiëring dat ze zelfs echt zijn voor het verkrijgen van toegang tot krediet, voor het verzekeren van dit soort dingen. Stap over van: "Hier is je 18-pagina-applicatie" en een zeer vervelend proces via zeven verschillende compliance-sets, naar iets dat online kan gebeuren op een geautomatiseerde manier en in het algemeen een minder risicovolle manier.

Dus in plaats van ze gewoon in Google te typen om te zien of ze een website hebben en dat ze echt zijn, kunt u al deze andere gegevenssets laten valideren voor zelfs basisspullen?

Absoluut.

We hadden het voordat we live gingen over Ozark , dus je favoriete programma, mijn nieuwe favoriete programma, en het idee om deze gegevenssets te gebruiken voor compliance en voor financiële rapportage en zelfs om witwassers op te sporen.

Ja. Allereerst een van de beste shows die er zijn. Enorme plug naar Netflix, is eersteklas Hollywood-studio geworden.

Ze hebben ervoor betaald. Ze hebben hun weg naar die markt gekocht.

Dat hebben ze zeker. Maar de show gaat over dit Jason Bateman-personage dat zichzelf als een witwasser van dit drugskartel vindt. De vangst is dat hij zijn leven redt door te zeggen dat hij naar de Ozarks gaat en nieuwe kanalen vindt om geld wit te wassen. Hij begint zich in deze slaperige bedrijven te kopen en loopt vervolgens door een verscheidenheid aan kosten.

Het probleem van het witwassen van geld is een enorm theoretisch probleem, omdat u, eerlijk gezegd, kijkt naar activiteitenpatronen tussen verschillende handelaren of consumenten van financiële diensten en ook naar de onderlinge verbindingen. Dus je zult een geregistreerde agent zijn, natuurlijk iemand als Jason Bateman, die rondgaat en dit voor een paar bedrijven doet. Hij koopt privé voor hen en begint zijn naam te krijgen op verschillende vormen, en je zult dat patroon van activiteit opmerken. Dit is iets waar banken tegen moeten vechten, uiteraard, want het is een nadeel voor het systeem en ze zijn klaar om dit te doen.

Criminaliteit is net zo digitaal en gedecentraliseerd als muziek. Dit is een veel groter probleem. Er is niet één grote maffiafamilie waar de overheid maandenlang op de loer ligt en ze Capone-stijl krijgt. Dit is een complete achtervolging op vele fronten. We hebben geholpen en gewerkt om openbare gegevens over dat probleem te brengen, maar ook door onze technologie die we hebben gebruikt om al deze openbare gegevens samen te brengen op dat probleem, gewoon omdat de banken veel technologische opklimming hebben doen om hun eigen gegevenssets samen te voegen tot krachtige, contextuele aanwijzingen voor deze onderzoekers die ze over het personeel hebben.

Ik heb het gevoel dat we nu op een punt zijn waar we al deze openbare gegevens hebben die zijn gemaakt door overheidsinstanties. We hebben al deze privégegevenssets. Elk bedrijf heeft meerdere gegevenssets en veel verschillende formaten, vaak binnen hetzelfde bedrijf. Toch is er niet veel standaardisatie, en ze samen laten werken is eigenlijk een grote uitdaging.

Het is een enorme uitdaging, en waarschijnlijk een van de grootste stellingen die we bij Enigma hebben, is een grote kloof. Een van mijn investeerders noemde het op deze manier - er is een wereld waar data in bits wordt geinstrumenteerd en er is een wereld waar het in atomen wordt geinstrumenteerd. De technologiebedrijven Google, Facebook en Amazon hebben allemaal geweldig werk verricht door de gegevens te verzamelen die ze van uw activiteit op het web krijgen en deze nieuwe diensten, zoals zoeken en betere e-commerce-ervaringen, te creëren. Maar die gegevens bestaan ​​allemaal. Het is digitaal native. Het luistert alleen maar naar jou op internet. Het web is een protocol en die protocollen zijn ontworpen om elkaar te spreken.

Maar als je deze gegevens hebt die zijn geinstrumenteerd in atomen, of de echte wereld, zoals iemand die een bank in de Ozarks binnengaat en om een ​​kleine lening vraagt, ziet dat er anders uit dan iemand anders die een ander bankfiliaal binnenloopt, of een vrachtcontainer schip binnenkomt dat vraagt ​​naar de naam van het bedrijf dat de verzending uitvoert. Al deze gegevens zijn ontworpen - of niet ontworpen - om met elkaar te praten, dus er is een enorm probleem om deze gegevens samen te voegen. Ik denk dat het deze minder, puur technische industrieën langer zal kosten om de vruchten te plukken van wat je hebt gezien in technologie met big data. Maar als ze dat doen, denk ik dat het veel zal veranderen van hoe we dagelijks leven op een behoorlijk impactvolle manier.

Ik krijg ook het gevoel dat, wanneer er een financieel motief is om deze gegevenssets samen te voegen en deze inzichten te creëren, bedrijven een manier vinden om ervoor te betalen en ze een manier vinden om het voor elkaar te krijgen. Creditcardbedrijven zijn een van de eerste bedrijven die patronen kunnen identificeren en fraude kunnen identificeren. Ik heb het gevoel dat de publieke sector behoorlijk ver achterloopt als het gaat om het creëren van inzichten uit deze hoeveelheden gegevens. Is dat een eerlijke beoordeling?

De particuliere sector heeft altijd, in zekere zin, een voorsprong gehad in het operationaliseren van technologie. De financiële prikkel is enorm en ook de bedieningsstijl van een kleinere eenheid. De Amerikaanse overheid is feitelijk een van de grootste organisaties ter wereld en het is echt een mensenprobleem om iets voor elkaar te krijgen. Zorg ervoor dat prikkels op elkaar zijn afgestemd, zodat mensen het juiste risico nemen.

Maar we hebben de overheid een aantal zeer innovatieve dingen zien doen. We werkten samen met de stad New Orleans, ik denk dat het twee jaar geleden was, om hen te helpen in principe te voorspellen waar de sloppenhouders waren, meestal om rookmelders in deze huizen te installeren. Post-Katrina, je had een enorme hoeveelheid ziekte. Veel huisbaas kwam weg met het achterlaten van mensen met slechte omstandigheden. Eerlijk gezegd, rookmelders doen gewoon geweldig werk om de dood door brand te voorkomen. In plaats van een brandweerman naar een willekeurig huis te sturen, wat als u factoren zoals demografie en hoe oud het gebouw gebruikte en de laatste keer dat er een bepaald soort installatie van een soort infrastructuur zoals telecommunicatie-infrastructuur was?

Je gebruikt al deze feiten en je krijgt een slagingspercentage van de deuren waarop je klopt, dat is aanzienlijk hoger. We hebben veel van dit soort geldbal voor dingen van de lokale overheid behoorlijk sterk zien spelen. Het is duidelijk dat er een enorme hoeveelheid gegevensgebruik is geweest in de inlichtingengemeenschap, zoals u zich kunt voorstellen. We vinden wel dat er zakken innovatie zijn. Maar nogmaals, het gaat allemaal over hoe je het operationaliseert.

Je hebt al die gegevenspunten, maar dan moet je het op de juiste manier opvragen, op zoek naar de patronen. Je moet bijna zoeken naar de correlaties, en dat is een hele reeks vragen en antwoorden. Het brengt een relatie tot stand met de gegevens waarvan ik denk dat we net beginnen uit te zoeken hoe dat werkt.

Ja. We beginnen erachter te komen hoe het werkt vanuit een skillset-perspectief. En er is een soort verschuiving in termen van statistisch denken versus niet statistisch denken. Er is dit gezegde: "Alle modellen zijn verkeerd, maar sommige zijn nuttig, " - het gaat er dus echt om of u, zonder de gegevens, zonder de algoritmen, een beetje de parameters van uw statistisch denken kunt contextualiseren. Ik krijg dit misschien niet goed, zoals in het geval van brand, misschien krijgen we dit niet goed, maar we kunnen onze kansen vergroten om het goed te krijgen of we kunnen ons risicogebied verkleinen of wat we moeten zoeken. Die get-it-done-houding bij het probleem brengen, dat is skillset nummer één als het gaat om statistisch kunnen denken. Sommige mensen zijn opgesloten in: "Nou, de enige manier waarop we zeker kunnen zijn is of we X, Y en Z hebben."

Ik zal je een geval in een privévoorbeeld geven. Heel vaak in banken, om redenen van historische fraude en compliance, was de manier waarop ze zouden verifiëren of iemand echt was voordat ze een creditcard uitgingen, ervoor zorgen dat hun telefoonnummer en hun adres overeenkwamen met wat ze op de aanvraag hadden. Niet alle bedrijven gebruiken nu vaste telefoonlijnen. Niet alle bedrijven gebruiken hun hoofdadres als degene die ze feitelijk exploiteren. Er is een soort verouderde realiteit van mensen die nu bij WeWork werken en mensen die voice over IP gebruiken. Je vertrouwd voelen met het identificeren van mensen door hun sociale aanwezigheid of door enkele van de gegevenssets die we bij Enigma inbrengen die deze aanvullende bewijspunten bieden. Historisch de statistieken bekijken en uitvoeren om te zien of de kans groot is dat het echt is, versus de garantie dat u van tevoren van deze alternatieve middelen zou krijgen.

Ik vind dat ook een interessant punt, die veronderstelling dat alle modellen fout zullen zijn, ofwel grotendeels fout of op een kleinere manier fout, maar dat is prima omdat het je nog steeds kan helpen goede beslissingen te nemen. Is dat een vaardigheid die we onze kinderen goed onderwijzen, en waar zouden ze die training zelfs krijgen? Ik bedoel, het zou niet noodzakelijk in wiskunde zijn. Het zou niet in sociale studies zijn. Waar halen ze die gevoeligheid vandaan?

Statistieken zijn vaak onderverdeeld, zoals wiskundeonderwijs in het algemeen, maar je ziet het op andere plaatsen. Je ziet het tegenwoordig zelfs in je ESPN-feed opduiken. Mensen voelen zich veel comfortabeler met voorspelling als onderdeel van hun leven. Eerlijk gezegd, ik ben dol op deze zwarte zwaanmomenten waar dat allemaal in ons gezicht vliegt. Neem de laatste verkiezingen. Je had Hilary aan het winnen en je had 's werelds beste datawetenschappers bij enkele van de beste instellingen noemen het verkeerd.

Winnen, maar winnen had geen 70 procent kans om te winnen, want dat betekent nog steeds dat Donald Trump één op de drie keer wint. En raad eens? Dit was een van die drie keer.

Absoluut. En dan is er de opleiding die we zien dat deze patronen mensen comfortabeler maken. In de klas denk ik dat een van de grootste problemen die we hebben, alleen het toegepaste leren is. Het is alsof ik geen idee heb waarom ze geen persoonlijke financiën in de klas onderwijzen. Ik bedoel, ik was een idioot met mijn geld op de leeftijd van 18 en het effect op schulden en dat alles. Ik ben nog steeds verbaasd dat ze dat niet doen, dus ik heb het gevoel dat we ons verplaatsen in een wereld waar onderwijs steeds meer te weten komt over de toegepaste dingen en minder over de theoretische dingen. Maar dan maak ik me zorgen als we sommige delen van cultureel leren verliezen. Het is allemaal een afweging.

Ik ga nog verder op die weg en praat over kunstmatige intelligentie.

Kunstmatige intelligentie, een enorm transformationele technologie. Het lijkt mij dat er een rol is voor kunstmatige intelligentie om ons te helpen deze wereld van overvloed aan gegevens te begrijpen en die patronen voor ons te vinden. Ben je optimistisch over het feit dat AI ons helpt daar iets van te begrijpen of gaat dat iets heel anders zijn dan de rest van onze menselijke ervaring?

Nee. Ik bedoel, ik ben optimistisch in de zin dat ik optimistisch ben over de mensheid in het algemeen. Ik heb het gevoel dat dat een flip-gen ding is dat mensen op een bepaald moment overkomt. Een van de dingen die ik het leukste vind aan de belofte van kunstmatige intelligentie is dat het de technologie daadwerkelijk zal laten verdwijnen, omdat de focus nu ligt op technologie en gegevens die zo aanwezig zijn. Maar in werkelijkheid is het werk van gegevens zeer intensief. Er is een reden waarom ze datamining noemen als je dingen in een dataset zoekt. Het is heel smerig. De gegevenssets zijn niet schoon. Het is in zekere zin nogal brutaal.

Wat ik leuk vind aan AI is dat het deze feedbacklussen creëert uit waargenomen ervaring. Hoewel je al deze gegevens van al deze plaatsen verzamelt, weet je niet echt hoe het zal samenkomen, dus begin je de resultaten te bestuderen. Machine learning helpt ons echt een beetje meer resultaatgericht te zijn in hoe we tot statistisch denken komen. Ik denk dat het ons zal helpen een deel van de smerigheid van dat werk weg te nemen en een beetje meer resultaatgericht te zijn in hoe we het benaderen. Nu zal het absoluut eng zijn in termen van de impact op automatisering op sommige gebieden waar ik eerlijk gezegd denk dat AI met rust moet worden gelaten, zoals het vervangen van een jury. Zullen we ooit die kwaliteit van emotionele intelligentie krijgen? Ik weet het niet.

En je moet kiezen en zeggen dat je die emotionele kwaliteit in de jury wilt in tegenstelling tot een pure waarschijnlijkheid dat deze persoon schuldig is of niet schuldig?

Ja. Voor mij, de onderliggende mensheid, vind ik super belangrijk. Eerlijk gezegd, gewoon in het vak zitten en zien hoeveel de menselijke aanraking belangrijk is om zelfs mensen te overtuigen om statistisch te gaan denken, ben ik optimistisch dat we dat niet zullen verliezen met de komst van AI op schaal.

We hebben een beetje aangeraakt of LinkedIn een openbare gegevensset was. Veel mensen hebben het gevoel dat ze in deze wereld leven waar alles over hen online beschikbaar is, van hun aankooppatroon tot hun leeftijd tot hun medische geschiedenis. Het maakt mensen ongemakkelijk. Het maakt mensen bang dat de overheid te veel informatie heeft. Ik maak me persoonlijk meer zorgen dat particuliere bedrijven te veel informatie hebben en veel minder gereguleerd zijn.

Ja.

Hebben we wetten nodig om onze persoonlijke informatie te beschermen? Moet persoonlijke informatie afzonderlijk worden behandeld dan uw overheidsdossiers?

Absoluut. We hebben heel weinig bescherming tegen de wetten die de manier bepalen waarop we onze gegevens weggeven. Denk erover na in bepaalde beroepen. In de medische wereld zit het op slot. Maar om de een of andere reden is het niet noodzakelijkerwijs op slot in andere industrieën. De reden was toen dat je niet veel kon doen met je persoonlijke gegevens. Tegenwoordig hebben ze echt een goed idee van hoe je je kunt omzetten of de kans dat je ergens zult zijn. Voor alle doeleinden is dat naar mijn mening eigenlijk vooral gunstig voor ons.

Maar tegelijkertijd verdienen onze gegevens nog steeds die hoeveelheid heiligheid in de manier waarop ze worden verwerkt. Europa komt met zeer strenge wetten. Er komt een wet uit genaamd GDPR. Het zal naar verwachting in 2018 worden aangenomen en het bevat alles, van ervoor zorgen dat bedrijven de lijn van hun persoonlijke gegevens volgen, wie deze heeft, hoe toegang wordt gegeven binnen het bedrijf, recht om te worden vergeten maatregelen. Als u zegt: "Mijn gegevens verwijderen", verwijdert u deze dan of bewaart u deze voor andere informatie? Er is dus altijd een uitwisseling tussen consumenten en de diensten waarvoor ze werken. Veel van deze services zijn gratis en we zijn er dol op, toch?

Ik zou een deel van mezelf weggeven voor toegang tot YouTube, toch? Ik ben er gewoon heel blij mee.

En waarschijnlijk heb je dat.

En waarschijnlijk heb ik dat. Maar het betekent niet dat dat deel dat ik weggeef niet in een kluis moet doen en dat ik weet dat die doos onder een bunker staat en al die goede dingen.

Ook het idee van het verlopen van gegevens, wat tegenwoordig in de digitale wereld een relatief nieuw concept is. Vroeger was er een zekere onduidelijkheid. Als er 30 jaar geleden iets gebeurde, zou het moeilijk zijn om records te vinden en een profiel van toen te krijgen. Maar daar zijn de kinderen van vandaag die hun hele leven online zijn geweest en wat ze deden en plaatsten toen ze 13 waren, zal er zijn wanneer ze 63 zijn.

Ja.

We hebben geen juridische infrastructuur die daar op een zinvolle manier mee om kan gaan.

Nee, dat doen we niet en het is een harig gebied. Het is een harig gebied in het arbeidsrecht. Het is een harige plek om te daten, toch?

Als je kijkt naar iemands Facebook-profiel - ik denk dat cultuur zich daaraan aanpast, omdat iemands online aanwezigheid openbaar is. Maar het is bijna theatraal. Het is alsof je publieke aanwezigheid niet de echte jij is. Wat was die Jim Carey-film? We zetten allemaal een masker op, figuurlijk gezien. Dus ik denk dat je online aanwezigheid meer zal lijken op deze galerij of dit kunstwerk dat je beschrijft en dan is er de echte jij. Maar je doet nog steeds een bodyshot of zoiets… Dat, je wilt nooit openbaar zijn. Er is een echte vraag of mensen die jong genoeg zijn de mogelijkheid hebben om te beslissen of het slim is om dat online te zetten of niet. Het is zeker eng.

Laten we het over de Trump-administratie hebben. Ik heb op meerdere fronten gehoord… Je werkt duidelijk met veel openbare gegevenssets. Je moet toestemming vragen om deze informatie vaak te krijgen, of erachter te komen hoe je deze kunt inslikken. Is het nu gemakkelijker? Hoe is de toegang tot openbare gegevenssets veranderd sinds de Trump-regering aantrad?

Ja. Mijn eerste waarschuwing wanneer ik hierover praat, is een groot verschil tussen de regering Trump en de Amerikaanse regering. De Amerikaanse overheid is verreweg een van de transparantere instellingen die ik ooit in de wereld ben tegengekomen. We zijn enorm transparant ten opzichte van onze collega's voor de hoeveelheid gegevens die we publiceren, voor hoeveel we dit soort dingen financieren, dus nummer één.

Als het gaat om Trump, ik bedoel, het was me heel duidelijk dat iedereen erg bezorgd zou moeten zijn over de houding van deze administratie met transparantie en het delen van informatie. Allereerst zijn er zeer expliciete dingen zoals het verwijderen van de lijst met bezoekers aan het Witte Huis, een praktijk die Obama heeft ingevoerd en ik denk dat een van de meest centrale boekhoudsystemen van de overheid. Er zijn EPA-gegevens geweest, er zijn klimaatgegevens geweest, en in het algemeen is er zelfs discussie geweest over enkele volkstellinggegevens die hierdoor worden beïnvloed. Je moet onthouden, dit zijn geen kleine inspanningen. Ik denk dat de volkstelling van de VS elke keer dat het gebeurt meer dan $ 4 miljard kost, met iets meer dan 300.000 vrijwilligers.

Sommige van deze dingen, we zullen hun impact in vier jaar zien, net gezien de financieringscycli van hoe het gebeurt. Hoewel deze administratie zeker niet vriendelijk is, denk ik dat de transparantie-ruggengraat in dit land sterk genoeg is. Vreemd genoeg komt dat zowel van links als van rechts. Sterk genoeg om ervoor te zorgen dat deze beweging naar openheid van informatie hier blijft.

En er wordt veel gereden op deze datasets.

Ja. Het is hoe we beslissen waar we ziekenhuizen plaatsen. Het is hoe we beslissen hoe ambulances worden gerouteerd. Het is hoe we beslissen dat zoveel basisservices, zoals afvalbeheer, op dit soort dingen vertrouwen.

Vertel mensen die naar de Enigma openbare gegevensset kijken, die ik meerdere keren heb bezocht… super, super cool. Wat moeten mensen verwachten als ze daar naartoe gaan? Wat kunnen ze daaruit halen?

Een van onze verplichtingen is om continu eerlijk te zijn over deze missie om alle gegevens te verzamelen, maar deze zoveel mogelijk terug te geven aan mensen. Het is volledig gratis te gebruiken voor niet-commerciële doeleinden, journalistieke doeleinden. We willen ervoor zorgen dat iedereen toegang heeft tot deze gegevens. U hoeft niet eens in te loggen of ons enige informatie te geven om toegang te krijgen. Toen we het bedrijf oprichtten, was er een groot uitgangspunt bij toegang.

Zoals we door de jaren heen veel meer hebben geleerd, zijn toegang en interfaceontwerp en zoeken en geloofwaardigheid erg belangrijk. De andere is curatie geweest en dat is de enorme focus van Enigma Public, dat we deze zomer opnieuw hebben gelanceerd, was het idee dat mensen moeten weten hoe deze gegevens worden gebruikt. Mensen moeten niet alleen best practices kennen voor het werken met gegevens, maar ook welke datasets goed zijn voor wat. Wat is nieuw, wat spannend? Ik denk dat dat soort onderwijs iets is waar we erg enthousiast over zijn en waarvan we hopen dat mensen het krijgen zodra ze op de site belanden.

Het is zeker de moeite van het bekijken waard. Ik denk dat bedrijven opnieuw die gegevens zien en dat ze weten dat ze er bovenop kunnen bouwen. Ik denk dat er voor journalisten en voor burgers veel meer onderwijs nodig is.

Absoluut, veel meer onderwijs en, hopelijk, een hele reeks diensten er bovenop, dingen leveren aan mensen zoals ik en jou als we niet zogezegd zijn, zogezegd.

Laat me je de vragen stellen die ik iedereen stel die in de show komt. Welke technologische trend baart u het meest? Is er iets dat je 's nachts wakker houdt?

De trend die mij het meest bezighoudt, of het ding waarvan ik denk dat we aan de horizon het meest moeten uitkijken, is deze notie van biologische programmering, dus de mate waarin we veel beter worden in het programmatisch creëren van strengen van biologisch leven organismen. Dat heeft een enorme impact voor het goede, maar heeft ook een enorme impact op het vermogen om via dit ding kleinschalige, in feite malfeasance te creëren. Waar technologie en bio elkaar ontmoeten, ben ik altijd een beetje bezorgd over hoe dat wordt afgehandeld. Het is alsof de volgende golf voor mij, post-nucleair, echt ons vermogen is om dingen zoals programmatisch opeenvolgende dingen in een kleinschalig lab te doen en te verspreiden.

De uitdaging is dat, zelfs als we hier wetten in de Verenigde Staten aannemen, dat niet betekent dat iemand niet hetzelfde onderzoek in China of Rusland kan doen.

Absoluut - en zelfs vanuit veiligheidsoogpunt, toch? Dus we beginnen nu echt de middelen te hebben voor iedereen om hun eigen biologische oorlogsprogramma te maken. Dus dat is voor mij het meest waar ik me zorgen over maak. Maar de keerzijde omvat dingen als gepersonaliseerde geneeskunde, het feit dat je mijn lichaam echt kunt begrijpen, je kunt bijna deze biologische versie van een softwareprogramma maken dat is ontworpen om elke ziekte die ik heb te genezen. Net zo bezorgd als ik ben, ben ik daar ook enthousiast over.

Ik denk dat de tekortkoming zal zijn dat we een soort ethische structuur nodig hebben om deze nieuwe technologieën in te voeren. We hebben het nauwelijks gedaan met kernwapens en kernenergie, maar we hebben het daar gedaan en ik denk dat we iets moeten ontwikkelen vergelijkbaar. Is er op persoonlijk niveau een technologie die je elke dag gebruikt die net je leven heeft getransformeerd, waar je versteld van staat?

Dit is een beetje raar, maar alleen FaceTime. Of videochat. Ik heb een aantal familieleden in het buitenland en ik reis veel voor werk. Het verschil tussen een telefoongesprek en een videochat, gewoon nonchalant aan de telefoon, het heeft me echt de hele belofte doen voelen dat internet iedereen heeft verbonden. Binnen 15 seconden kunnen. Ik kom oorspronkelijk uit Marokko, dus ik zie iemand over de hele wereld en zeg: "Hé, wat ben je van plan?", zien hoe het weer eruit ziet in hun omgeving en hoe ze gekleed zijn en hun houding, dat heeft echt veranderd hoe ik me verbonden voel met mensen om me heen en me het gevoel gaf dat we allemaal een beetje meer in dit grote dorp wonen, en ik zoals dat gevoel.

Er is ook iets interessants dat ik de video-conferencing boom soort van opkomst zag. Het zou het volgende zijn. Niemand zou meer bellen. Videoconferenties zijn nooit echt van de grond gekomen maar videochatten, persoonlijker, diepgaand anders en niet in een werkomgeving, iets dat bijna casualer is dan een telefoongesprek. Alsof het onmiddellijk kan gebeuren.

Ik heb een 3-jarige dochter en zij heeft het helemaal onder de knie. Ze video-chats voordat ze belt. Ze weet niet wat een telefoontje is. Je zet een luidspreker op en je vraagt ​​haar om met iemand te chatten en zij is helemaal niet geïnteresseerd. Je zette haar voor haar grootvader op FaceTime en ze zou er 20 minuten kunnen zijn.

Het zal net zo vreemd voor haar zijn als die roterende telefoons die kinderen tegenwoordig niet weten hoe te gebruiken. Hicham, hoe kunnen mensen je online volgen, ontdekken wat je doet en Enigma bijhouden?

Ga naar enigma.com. Bekijk Enigma Public zeker, dat is public.enigma.com. Bekijk onze website. We hebben een behoorlijk actief Twitter-account, nog geen Instagram voor ons.

Zeg nooit nooit.

Zeg nooit nooit. Maar-

Je kunt geweldige dingen doen met infographics.

Ja dat is waar. We zijn echt grote fans van data vis. We hebben dit coole deel van onze site, labs.enigma.com, waar al onze experimenten en enkele van onze pro-bonoprojecten zijn zoals ik noemde met New Orleans, dus ik zou dat ook bekijken.

Heel cool. Heel erg bedankt voor het komen.

Geweldig. Heel erg bedankt dat je me hebt.

Hoe big data toe te passen op de echte wereld