Huis Bedrijf Google vereenvoudigt machine learning met sql

Google vereenvoudigt machine learning met sql

Inhoudsopgave:

Video: BigQuery ML: Machine Learning with Standard SQL (November 2024)

Video: BigQuery ML: Machine Learning with Standard SQL (November 2024)
Anonim

Google heeft nu mogelijkheden voor machinaal leren (ML) toegevoegd aan zijn Google BigQuery, het cloud-database-aanbod van Petabyte (PB). Nu genaamd BigQuery ML, kunt u met de nieuwe versie eenvoudige SQL-instructies (Structured Query Language) gebruiken om ML-modellen te bouwen en in te zetten voor voorspellende analyses.

Dat is niet alleen goed nieuws voor datawetenschappers die Google gebruiken. Het is ook goed voor bedrijven die geïnteresseerd zijn in het verbeteren van hun gegevensanalysemogelijkheden, omdat het een meer effectieve concurrent toevoegt aan een vrij kleine lijst van leveranciers die dit niveau van verfijning kunnen leveren via de cloud. De andere twee meest bekende namen zijn Amazon's Relational Database Service en Microsoft's Azure SQL, en u kunt meer vinden in onze recente verzameling van clouddatabaseservices.

De vloek van alle leveranciers en kopers van dataproducten is altijd de vaardigheidskloof geweest. Dat geldt vooral voor diegenen die geïnteresseerd zijn in ML en voorspellende analyses, omdat deze disciplines vaak kennis van nieuwe technologieën en query-talen vereisen.

"Voor elke datawetenschapper zijn er honderden analisten die met data werken, en de meeste gebruiken SQL, " vertelde Sudhir Hasbe, directeur Productbeheer bij Google Cloud, aan PCMag. Iets moest geven als de kracht van een leger van data-analisten zou worden ontkoppeld van de bottleneck die door te weinig en te overwerkte datawetenschappers werd gecreëerd.

Het antwoord van Google op dit dilemma is ronduit opmerkelijk. Hoewel ML een populaire trend is en overal in producten van allerlei aard voorkomt, is het nog steeds een stevig terrein voor datawetenschappers. Veel leveranciers hebben vooruitgang geboekt bij het vereenvoudigen van de technologie, maar de lelijke waarheid is dat je het met veel kunt vereenvoudigen en het is nog steeds te moeilijk voor meer dan 99 procent van de menselijke bevolking om het te gebruiken. Toch moeten we het kunnen gebruiken omdat ML meer kan doen, en sneller dan een groep super-slimme mensen.

Google plant ML in Google BigQuery zodat het dichter bij de gegevens staat. De applicatie zal ML-mogelijkheden sneller brengen dan traditionele ML-modellen, deels omdat de data-analyse bij de bron kan worden uitgevoerd. Nu in bèta stelt BigQuery ML analisten (en datawetenschappers) in staat voorspellende analyses uit te voeren, zoals het voorspellen van verkopen en het creëren van klantsegmenten bovenop de gegevens waar deze wordt opgeslagen. Dat alleen al is een respectabele en opmerkelijke upgrade.

Google ging echter verder dan dat door een mogelijkheid toe te voegen waarmee gegevensanalisten eenvoudige SQL-instructies kunnen gebruiken om ML-modellen te bouwen en te implementeren. Op dit moment zijn de opties lineaire regressie en logistieke regressiemodellen voor voorspellende analyse, aangezien dit de twee meest gebruikte modellen zijn.

Hier is een illustratie die Google heeft gegeven om aan te tonen hoe data-analisten deze mogelijkheid zouden gebruiken:

Google is van plan om in de loop van de tijd meer ML-opties aan deze mogelijkheid toe te voegen, volgens Hasbe. "We moeten van onze klanten horen aan welke modellen ze ons willen toevoegen, zodat we eerst de meest bruikbare modellen kunnen aanbieden, " zei hij.

Aanvullende Google BigQuery-upgrades

Boven de substantiële lijst met upgrades na ML staan ​​clustering, BigQuery Geographic Information Systems (BigQuery GIS), een nieuwe Google Sheets-dataconnector en een nieuwe Google Sheets-dataconnector.

Clustering is ook in bèta en maakt het mogelijk geclusterde tabellen te maken in een gegevensoptimalisatiebeweging die rijen met vergelijkbare clustersleutels samenvoegt. Dit verlaagt de kosten omdat het de prestaties verbetert en Google BigQuery in staat stelt de gebruiker alleen de gescande gegevens in rekening te brengen in plaats van de hele tabel of partitie.

BigQuery GIS is momenteel in alfa en wordt gebruikt voor georuimtelijke gegevensanalyse. Terwijl het Google Cloud-team samenwerkte met Google Earth Engine om BigQuery GIS te bouwen, moet u uw eigen geospatiale gegevens naar de tafel brengen. Dat is geen probleem in en over verschillende industrieën, waaronder verbonden autosystemen, het Internet of Things (IoT), productie, detailhandel, slimme steden en telematica. Om nog maar te zwijgen van overheidsinstanties, variërend van de Environmental Protection Agency (EPA) en de National Geospatial-Intelligence Agency tot de National Oceanic and Atmospheric Administration (NOAA) en natuurlijk alle militaire afdelingen.

BigQuery GIS gebruikt de S2-bibliotheek, die nu meer dan een miljard gebruikers heeft via een verscheidenheid aan producten zoals Google Earth Engine en Google Maps. Als u meer geospatiale gegevens nodig hebt, deelt de federale overheid een enorme hoeveelheid hiervan op GeoPlatform.

Een nieuwe Google Sheets-dataconnector zal waarschijnlijk veel data-analisten verrukken, gewoon omdat het zo praktisch is voor dagelijks gebruik. U hebt toegang tot Google BigQuery vanuit de Google Spreadsheets (spreadsheet-programma) en kunt Google Spreadsheets gebruiken, zoals Explore, een gecombineerde samenwerking, datavisualisatie en een tool voor het doorzoeken van natuurlijke talen.

Google BigQuery heeft nu ook een nieuwe gebruikersinterface (UI) in bèta. Een van de interessantere elementen is visualisatiefunctie met één klik, die wordt ondersteund door Google Data Studio. Alles bij elkaar genomen is het een geweldige reeks upgrades voor een toch al elegante service. Deze upgrades worden getest in de volgende ronde van PCMag's database-as-a-service (DBaaS) oplossingsbeoordelingen, nadat de bugs zijn uitgewerkt en de producten hun respectieve alfa- en bèta-status hebben overschreden.

PCMag EIC Dan Costa bespreekt de toekomst van gegevens:
Google vereenvoudigt machine learning met sql