Inhoudsopgave:
- Een praktische definitie
- Diep leren versus goedkoop leren
- Hoe werkt goedkoop leren?
- 2018 en verder: waar ML nu is
Video: Top 10 Machine Learning Trends | Machine Learning in 2020 | Machine Learning Training | Edureka (November 2024)
Van natuurlijke taalverwerking (NLP) tot diep leren en verder, machine learning (ML) heeft vele aspecten van de meest populaire bedrijfstechnologieën ingevoerd. ML is slechts één factor in de kunstmatige intelligentie (AI) revolutie, maar het is een belangrijke. ML-algoritmen zijn een vitale intelligentielaag die is ingebakken in de producten die we gebruiken, en we zullen het in de toekomst alleen maar in meer gebruikscases zien binnensluipen.
ML-algoritmen zijn ingebed in de structuur van veel van de technologie die we elke dag gebruiken. ML-innovaties op het gebied van computer vision, deep learning, NLP en meer maken deel uit van een grotere revolutie rond praktische AI. Het zijn geen autonome robots of bewuste wezens, maar een soort intelligentie die is geïntegreerd in onze apps, software en cloudservices die AI-algoritmen en Big Data onder het oppervlak combineert.
De trend is nog meer uitgesproken in het bedrijfsleven. ML wordt niet langer alleen gebruikt voor gespecialiseerde onderzoeksprojecten die worden uitgevoerd door een team van datawetenschappers. Bedrijven maken nu gebruik van ML om bruikbare business intelligence (BI) en voorspellende analyses te verkrijgen uit steeds grotere hoeveelheden gegevens. Daarom is het belangrijker dan ooit om niet alleen te weten wat ML is, maar ook om de meest effectieve strategieën te leren hoe het te gebruiken voor tastbare waarde.
Een praktische definitie
De duidelijke definitie van ML geeft systemen de mogelijkheid om te handelen en iteratief te leren en aanpassingen te maken, zonder expliciete programmering. Dunning zei dat ML een tak van statistieken is, maar een tak die erg praktisch is. Hij benadrukte dat je in een zakelijke context realistisch en realistisch moet zijn over hoe je het toepast. De kerntaak van ML is het creëren van een bedrijfsproces dat herhaalbaar, betrouwbaar en uitvoerbaar is.
"Machine learning gaat niet achteruit kijken naar wetenschappelijke gegevens en proberen te beslissen welke conclusies haalbaar zijn, " zei Dunning. "Het gaat erom vooruit te kijken en vragen wat we kunnen voorspellen over de toekomst en wat er zal gebeuren in verschillende scenario's. Als het gaat om zaken doen met deze gegevens, hebben we het over zeer beperkte situaties waarin je repliceerbaarheid wilt."
Afbeelding tegoed: Todd Jaquith op Futurism.com. Klik om de volledige infographic uit te vouwen.
Diep leren versus goedkoop leren
Je kunt dat basisidee opsplitsen in een aantal verschillende velden binnen ML, maar Dunning wees met name op twee gebieden aan beide uiteinden van het spectrum: diep leren en wat hij 'goedkoop leren' noemt. Diep leren is het ingewikkelder concept.
"We wilden dat machine learning dieper ging. Dat is de oorsprong van de term, " zei Dunning. "In de afgelopen 10 of 15 jaar zijn technieken ontwikkeld die het daadwerkelijk doen. Vroeger was er veel engineeringwerk nodig om relaties in de gegevens zichtbaar te maken voor algoritmen, die lange tijd niet zo slim waren als wij wilde dat ze waren. Je moest deze smakelijke gegevens op een plaat algoritmen geven, dus codeerden we al deze functies die systemen nu alleen doen met de hand."
Diep leren is waar veel van de innovatie rond neurale netwerken ligt. Het combineert geavanceerde technieken zoals computer vision en NLP tot lagen van "dieper" leren die hebben geleid tot enorme stappen op gebieden zoals beeld- en tekstherkenning. Dit is geweldig voor complexe modellering, maar kan te veel zijn voor eenvoudiger, dagelijks zakelijk gebruik dat kan vertrouwen op gevestigde ML-frameworks en technieken met veel minder parameters.
Goedkoop leren, legt Dunning uit, betekent eenvoudige, effectieve, beproefde technieken waarbij bedrijven geen dure middelen hoeven te investeren om het wiel opnieuw uit te vinden.
"In de informatica praten we veel over laaghangend fruit. De beschikbaarheid van gegevens en de enorme toename van rekencapaciteit betekent dat we de hele boom hebben verlaagd, " legde hij uit. "Eenvoudig machine learning is niet alleen meer voor datawetenschappers."
Hoe werkt goedkoop leren?
Basis ML-algoritmen kunnen correlaties identificeren en aanbevelingen doen, of ervaringen meer contextueel en gepersonaliseerd maken. Dunning zei dat er in vrijwel elk aspect van de manier waarop we omgaan met computers een mogelijkheid is om goedkoop leren te gebruiken om dingen gewoon beter te laten werken.
Een voorbeeld van goedkoop leren in de praktijk is fraudedetectie. Banken en handelaars behandelen wijdverspreide fraude, maar het is vaak verspreid en betreft laag genoeg waarden die niet worden gemeld. Dunning legde uit dat met behulp van een algoritme voor goedkoop leren (d.w.z. een bestaande ML-test die is geprogrammeerd voor deze specifieke taak), verkopers gemakkelijker de gemeenschappelijke compromispunten kunnen identificeren die gebruikers in gevaar brengen en fraudepatronen vangen die anders niet zouden zijn zichtbaar.
"Stel dat u wilt weten welke verkopers gegevens lekken die tot fraude leiden. U kunt een G 2- test gebruiken om eenvoudig te achterhalen welke verkopers oververtegenwoordigd zijn in de transactiegeschiedenis van slachtoffers van fraude versus consumenten zonder fraude, " zei. "Dit lijkt te eenvoudig om machine learning te worden genoemd, maar het vindt slechteriken in het echte leven. Uitbreidingen van deze techniek kunnen worden gebruikt om iets geavanceerdere technieken uit te breiden waardoor eenvoudiger leeralgoritmen kunnen slagen waar ze anders zouden falen."
Goedkoop leren kan op allerlei verschillende manieren worden gebruikt, dus Dunning gaf nog een voorbeeld van hoe een online bedrijf het zou kunnen gebruiken. In dit geval legde hij uit hoe een bestaand ML-algoritme een eenvoudig probleem met het rangschikken van reacties kan oplossen.
"Stel dat u een artikel hebt met een aantal opmerkingen. In welke volgorde moeten deze worden geplaatst? Hoe zit het met het ordenen van de opmerkingen op basis van hoe interessant mensen denken dat ze zijn? U kunt het aantal keren tellen dat mensen de opmerking lezen, en hoe vaak hebben ze het overstemd, maar er is nog een beetje magie nodig, "zei Dunning.
"Eén stem van één lezer is waarschijnlijk niet beter dan acht stemmingen op 10 lezers, " legde hij uit. "Erger nog, als je vroege winnaars bovenaan zet, zien de andere opmerkingen nooit het daglicht en dus leer je ze nooit. Een klein beetje machine learning genaamd Thompson sampling kan dit oplossen op een manier die gegevens verzamelt over nieuwe opmerkingen en waar ranglijsten onzeker zijn, maar deze doorgaans rangschikt op een manier die gebruikers de beste ervaring biedt."
Dunning legde ook een aantal best practices voor hoe uw bedrijf het maximale uit ML kan halen. Voor een overzicht van hoe logistiek, gegevens en een arsenaal van verschillende algoritmen en tools een succesvolle bedrijfsstrategie vormen, bekijk je ons 7 Tips voor succes van machine learning.
2018 en verder: waar ML nu is
Misschien komt dit niet als een verrassing voor u, maar de Big Data en bijbehorende database-ruimte groeit snel op zijn zachtst gezegd. Tijdens de BigData SV 2018-conferentie in San Jose presenteerde Peter Burris, Chief Research Officer van tech-analistenbureau Wikibon Research, bevindingen waaruit blijkt dat de omzet van de wereldwijde Big Data-industrie naar schatting zal groeien van $ 35 miljard in 2017 tot $ 42 miljard in 2018. Op bovendien voorspelt Burris dat de omzet tegen het jaar 2027 $ 103 miljard zal bedragen.
Om al deze gegevens effectief te verwerken, zullen slimme ML-oplossingen nog noodzakelijker worden dan ze nu zijn. Het is duidelijk dat ML in de nabije toekomst een hot topic zal blijven. Toen we een jaar geleden voor het laatst met MapR's Dunning spraken, benadrukte hij een berekende, realistische benadering van ML voor bedrijven. Maar een jaar is lang wanneer je het hebt over technologie. We hebben Dunning onlangs ingehaald en volgens hem zijn de dingen ongeveer hetzelfde gebleven sinds ons laatste gesprek. "Op dat hogere niveau is er niet veel veranderd, " zei Dunning. "Het basisidee van redeneren vanuit bewijs is zeker geen nieuws van het afgelopen jaar, maar een deel van de tooling is veranderd."
Met dat in gedachten zei Dunning ook dat er meer spelers in het veld zijn dan een jaar geleden, maar dat feit is niet noodzakelijk een goede zaak. "Een ding dat is gebeurd is de opkomst van meer en meer leveranciers die het hebben over 'magisch' machine learning, om er een smerig woord over te maken, " legde hij uit. "Er is een grote misvatting dat je je gegevens gewoon in een product kunt gooien en er mooie inzichten uit kunt halen."
- Waarom machine learning de toekomst is Waarom machine learning de toekomst is
- Comet.ml wil veranderen hoe we omgaan met machine learning Comet.ml wil veranderen hoe we omgaan met machine learning
- Google vereenvoudigt machine learning met SQL Google vereenvoudigt machine learning met SQL
Het verwachten van een magisch resultaat van ML kan "underwhelming" zijn, volgens Dunning. "Je moet nog steeds nadenken over welk probleem er echt toe doet. Je moet nog steeds gegevens verzamelen en je moet nog steeds de implementatie van je systeem beheren", zei hij. "En deze pragmatische, logistieke realiteit domineert nog steeds het probleem."
Dunning heeft problemen met een deel van de verheven marketing die sommige softwarebedrijven bieden. "Geen van de magische AI-dingen komt daar zelfs op neer, " zei hij. Hij heeft een advies voor bedrijven om te overwegen. Volgens hem is het inhuren van een specifieke AI-bedrijfsanalist een manier om ervoor te zorgen dat goede praktijken mogelijk zijn, zodat iemand in uw bedrijf aspecten van uw bedrijf kan identificeren die kunnen worden verbeterd met behulp van ML-technologie.
"In sommige gevallen kan dat een uitbreiding van uw bedrijf tot nieuwe kansen zijn", legt Dunning uit. Maar in de meeste gevallen benadrukte hij echter dat het van cruciaal belang is iemand aan te nemen om de behoeften van uw organisatie te begrijpen en die informatie te gebruiken als leidraad voor uw ML-strategie.