Ron Tolido ziet big data als zwarte zwanen

Volgens IBM is negentig procent van alle data die tegenwoordig bestaan de afgelopen twee jaar gecreëerd (zie Datamation.com). Geen wonder dat Ron Tolido, Europese CTO en Architecture and Advisory lead van de global Insights & Data practice bij Capgemini, de omgang met die enorme hoeveelheden beschouwt als een zwarte zwaan. Niet eerder vertoond in de geschiedenis. Tegelijkertijd biedt het fenomeen enorme kansen voor organisaties, en zorgt het voor een renaissance van het IT-beroep.

Het boek 'De Zwarte Zwaan' (2008) van Nassim Nicholas Taleb stond 120 dagen in de top 100. Zwarte zwanen, zo beschrijft Taleb, zijn onvoorspelbaar; ze hebben een gigantische impact... en achteraf proberen we ze aannemelijk en voorspelbaar te maken. Zwarte Zwanen zijn toevallige gebeurtenissen die ons leven bepalen, van bestsellers tot wereldrampen. Harry Potter was een Zwarte Zwaan, het internet, 11 september was er een. Zwarte Zwanen liggen ten grondslag aan bijna alle belangrijke gebeurtenissen in de geschiedenis, politiek, wetenschap, in zaken en privé. Maar we zien ze pas achteraf, omdat mensen te veel op details letten en te weinig op de algemeenheden. We richten ons op wat we al kennen en staan te weinig stil bij wat onbekend is, aldus de auteur.

Precies dat is wat er aan de hand is met big data, volgens Tolido. “Binnen het bedrijfsleven begint het fenomeen sterk te leven. Het spreekt tot de verbeelding: we hebben nooit zoveel gegevens tot onze beschikking gehad. En gezien de relatief lage prijs voor opslag kunnen we al die data gewoon opslaan en analyseren. Maar we hebben dit nooit eerder meegemaakt. We weten niet goed wat we ermee aan moeten. Eigenlijk kunnen we, met het Internet of Things in het achterhoofd, spreken van een hele zwerm zwarte zwanen.”

Niet filteren
In 2013 verwachtte Gartner dat enterprise data de komende vijf jaar met 650 procent groeit. IDC ziet een Moore's Law voor datacreatie: een verdubbeling elke anderhalf jaar. In 2011 schiepen we volgens IDC 1,8 zettabytes aan informatie. “Die gegevens komen overal vandaan”, zegt Tolido. “Niet alleen van mensen, maar ook van machines; in toenemende mate van sensoren. De overgrote meerderheid behoort tot niet gestructureerde data zoals we die tegenkomen op social media, blog posts, e-mail, locatiegegevens van mobiele telefoons, transactiegegevens van elektronische handel, digitale foto's en video's, om maar wat te noemen. Er zit enorm veel potentie in die gegevens.”

Wat je in elk geval niet moet doen, is wat elke dataspecialist al decennia doet: het filteren en vooraf structureren van data. Om ze veilig in een datawarehouse te kunnen stoppen, om er cubes van te maken, om ze geordend in een (relationele) database op te slaan. “Je moet ze niet in een database willen stoppen, maar in een ‘data lake’: een meer van gegevens, waar je later uit kunt putten wat je nodig hebt - in welke verschijningsvorm en met welke technologie dan ook. We weten nu nog niet wat we ermee kunnen doen; maar we moeten al wel een platform bouwen dat een waardevolle, innovatieve bestemming kan geven aan alle data. Je moet geen limiet stellen aan alle data die je opslaat; in het eigen datacenter en/of bijvoorbeeld via Hadoop in de cloud.”

Moment van verlichting
De dataexplosie is van ongekende omvang. “Er is geen precedent. We zullen in de praktijk zelf moeten ervaren wat we met alle gegevens kunnen – en mogen – doen. Er komt vast een zeker een moment van verlichting. Dat iemand binnen de organisatie een briljant idee krijgt om de data een nieuwe, extreem waardevolle bestemming te geven. Op dat moment moet je kunnen beschikken over de betreffende gegevens. Nu weet je nog niet welke gegevens dat zullen zijn, dus moet je alles bewaren.”

Niet zomaar in een vergaarbak gooien, maar een waardig (dwz.: snel, veilig en kostenefficiënt) platform bouwen dat op enterprise niveau in staat is om snel die gegevens ter beschikking te kunnen stellen. Je moet de huidige beperkingen binnen het IT-landschap van de organisatie wegnemen.”

Andere organisatie
De IT-organisatie weet niet wat haar overkomt. Aan de ene kant wordt zij overstelpt met data. Aan de andere kant ziet de business haar ineens weer staan. Op een positieve manier; niet meer die club die van alles tegenhoudt of veel te laat met inmiddels achterhaalde oplossingen komt, maar de groep mensen die nieuwe wegen bedenkt voor de bedrijfsvoering.

Tolido ziet een renaissance van het IT-vak. “Het betekent wel dat IT'ers dicht tegen de business aan moeten opereren. Bij wijze van spreken naast de marketing manager of verkoopleider moeten gaan zitten. Hun taak is het stimuleren van ideeën die big data mogelijk maken. Pas later moeten ze gaan invullen hoe dat technisch is waar te maken; maar het gaat in eerste instantie om dat moment van verlichting.“

Een opsplitsing van de IT-afdeling in een groep die zorgt voor de infrastructuur en een groep van stimulerende IT'ers ziet Tolido niet zitten. “Het grijpt toch allemaal in elkaar. SAP blijft de kern van de bedrijfsvoering, bijvoorbeeld. Dat moet je niet uit elkaar halen; het vult elkaar juist aan.”

Menselijke maat
Overigens wedt SAP – met onder meer zijn HANA-platform – ook vol op big data. Recent heeft het bedrijf een aantal applicaties opgeleverd die de snelle analyses uitvoeren op data lakes in combinatie met gestructureerde data. Bijvoorbeeld voor voorspellend onderhoud, transportmanagement en productiebeheer. Als een fabrikant vraag en aanbod wereldwijd kent, plus factoren als rentevoet, douanekosten, transportkosten, grondstoffenvoorraden, machine-omsteltijden, dan kan hij besluiten waar het het voordeligst is om op dat moment iets te maken.

Bij dit alles moeten we de menselijke maat niet vergeten, vindt Tolido. “Je kunt wel alles verzamelen en analyseren, maar je moet dat wel ethisch doen. Dat is cultuurbepaald, maar zorg ervoor dat je klanten en partners niet tegen het hoofd stoot.”

Zie ook http://www.vnsgmagazine.nl/pdf/vnsg5006/index.html#22

 

 

 

 

Meest gelezen