"Google had twintig jaar geleden een geweldige visie. Ze zouden de informatie van deze wereld organiseren en aanspreekbaar maken. En dat hebben ze nu voor miljarden mensen gedaan", zegt Diane Greene, CEO van Google Cloud tijdens haar keynote in Londen, voor een publiek van 8.000 mensen. "Met Google Cloud willen we nu ook aan miljoenen bedrijven de technologie leveren waarmee ze hun eigen data kunnen organiseren en aanspreekbaar maken." Hetzelfde, maar dan op enterprise-niveau. Google haalt hier dan ook klanten als Airbus, Carrefour en SEP op het podium, die elk verschillende cloudplatformen van de techgigant gebruiken, van machine learningdiensten tot G Suite.
...

"Google had twintig jaar geleden een geweldige visie. Ze zouden de informatie van deze wereld organiseren en aanspreekbaar maken. En dat hebben ze nu voor miljarden mensen gedaan", zegt Diane Greene, CEO van Google Cloud tijdens haar keynote in Londen, voor een publiek van 8.000 mensen. "Met Google Cloud willen we nu ook aan miljoenen bedrijven de technologie leveren waarmee ze hun eigen data kunnen organiseren en aanspreekbaar maken." Hetzelfde, maar dan op enterprise-niveau. Google haalt hier dan ook klanten als Airbus, Carrefour en SEP op het podium, die elk verschillende cloudplatformen van de techgigant gebruiken, van machine learningdiensten tot G Suite. Opvallend is daarbij de nadruk op kunstmatige intelligentie of AI. Google wil namelijk niet alleen een leverancier zijn van clouddiensten. Het bedrijf wil AI en machine learning bereikbaar maken voor alle bedrijven, ook die zonder data scientists op de loonlijst. "80 procent van data is ongestructureerd", zegt Rajen Sheth, director of product management. "Het gaat dan om mails, videos enzovoort. Met deep learning en machine learning kan je daar nu eindelijk wat uit halen. Maar dat is moeilijk, want zoveel data scientists zijn er niet." De oplossing van Google is Cloud AI, een openbronplatform dat volledig beheerde diensten aanbiedt om machine learning modellen te maken. "We doen dat met bouwblokken die je in je eigen applicaties kan stoppen", legt Sheth uit, "Er zijn bijvoorbeeld blokken voor beeldherkenning, vertaling, tekst-naar-spraak modules enzovoort." "Data analytics zijn nog altijd te moeilijk", knikt ook Sudhir Hasbe, director Product Management (Analytics) voor Google Cloud. "Traditionele platformen verwachten dat je zelf alles doet van monitoring over performance tuning enzovoort, zodat er weinig tijd overblijft voor de analyse zelf. Daarom willen wij al die rest overnemen en voor jou doen. We voorzien alles van tools voor het binnenhalen van gegevens, onderzoek, voorbereiding, pre-process en meer." De diensten moeten via modellen alles klaar zetten voor een degelijke analyse van data. En daarna? Daarna zijn nog er meer tools. "We bieden ook een volledig machine learning portfolio aan waarmee je makkelijk een model kunt trainen", aldus Hasbe. Een van de grote beloftes van Cloud AutoML, het machine learning aanbod van Google, is dan ook dat u geen expertise nodig hebt om machine learning te gebruiken. "Met een simpele interface kan je bestaande machine learning modellen nemen en ze aanpassen aan de specifieke noden van je bedrijf", aldus Sheth. Een voorbeeld wordt alvast gegeven door Sophie Maxwell, conservation technology lead bij de Zoological Society London, een conservatie-instituut dat verbonden is aan de London Zoo. Zij spreekt over een typisch werkmiddel van veel onderzoekers naar diersoorten: de cameraval. Daarbij worden camera's over een gebied verspreid. Elk zijn ze uitgerust met een sensor en nemen ze een foto als ze beweging detecteren. Bedoeling is om zeldzame diersoorten waar te nemen en te 'tellen' in hun eigen leefgebied. "Maar die data die je uit zo'n project haalt is heel divers", zegt Maxwell. "Daar zitten beelden bij die vaag zijn, er zitten ook heel veel foto's in van diersoorten die niet bedreigd zijn of die je voor je specifieke onderzoek niet nodig hebt. En met 400.000 beelden per onderzoek, is dat een hele hoop werk voor onderzoekers om daardoor te gaan." De oplossing is, voorspelbaar, machine learning. Met versimpelde software als Cloud ML werd het model getraind op een 'gelabelde' set, zodat het algoritme leerde om bepaalde zeldzame diersoorten te herkennen. Daarna werd het getest op een ongelabelde set foto's van een reeks camera's in Borneo. Het project is succesvol genoeg om uitbreiding te vinden. "Uiteindelijk willen we een platform maken waar zoölogen hun modellen kunnen delen voor specifieke niches", zegt Sophie Maxwell, "zodat ze bijvoorbeeld een specifieke diersoort in een specifieke regio kunnen zoeken." Het is iets dat we Rajen Sheth meerdere keren horen zeggen op deze conferentie: "Er zijn veel meer ontwikkelaars in de wereld, dan data scientists en machine learning experts." Het valt daarbij op dat Google de ontwikkelaars via verschillende routes benadert. BigQuery ML laat SLQ developers toe om machine learning rechtstreeks in het data warehouse te ontwikkelen, met enkele lijnen SQL code. Kubeflow laat analyses dan weer draaien bovenop Kubernetes. Maar dat alles blijft wel aan de technische kant. Google giet de infrastructuur en de programmering in een makkelijkere interface, maar lost daarmee niet meteen de problemen op die machine learning nu al tegenkomt. Denk daarbij bijvoorbeeld aan databases die niet juist gebalanceerd zijn, of onvolledig zijn. Gaat Google een zoöloog het concept van 'garbage in, garbage out' uitleggen? Ja, zo blijkt. Google wil dat in de eerste plaats oplossen met documentatie, zegt Rajen Sheth. "We leggen mensen wel uit hoe ze op de juiste manier moeten coderen", vertelt hij aan Data News. "Dat als je begint met onvolledige databases, dat je dan bevooroordeelde algoritmes krijgt. We proberen ook tools te schrijven om te zorgen dat mensen doorhebben, of dat ze zich ervan bewust zijn hoe ze daarmee moeten omgaan." Als het van Google afhangt, wordt binnenkort iedereen alvast een beetje 'data scientist'.