Naar inhoud

Stephen Brobst, Teradata: “Ongestructureerde data bestaan niet”

KOPENHAGEN #tduniv - Big data blijft een veel besproken onderwerp tijdens de gebruikersconferentie van softwareleverancier Teradata. Hoewel het bedrijf al drie jaar de term gebruikt, blijft er onduidelijkheid rondom het thema. Ongestructureerde data bestaan namelijk niet, vertelt Stephen Brobst. En van de drie v's (volume, variety en velocity) draait snelheid niet om de groei, maar om de veranderlijkheid van data. Het lijkt een nuanceverschil, maar cruciaal als je wilt weten wat data écht kunnen betekenen voor je organisatie.

Het belangrijkste onderwerp tijdens het Teradata Universe gebruikersevenement van softwareleverancier Teradata is nog steeds big data. Inmiddels drie jaar geleden introduceerde het bedrijf deze term en inmiddels wordt er weinig nog gesproken over wat en waarom big data belangrijk is. De grootste vraag is: hoe gaan we met big data om, wie maken we verantwoordelijk en hoe gaan we dat organisatorisch regelen?

Focus op 'hoe'-vraag

Omdat bedrijven nog worstelen met de 'hoe'-vraag is het aantal bedrijven dat echt met big data werkt, nog erg klein, vertelt Stephen Brobst, chief technology officer bij Teradata, aan Customer Talk. Afgezien van de dotcom-bedrijven, zoals eBay, bevinden de meeste bedrijven zich nog in de beginstadia. Pas sinds de tweede helft van 2012 zijn financiële en telecomspelers aan de slag gegaan met big data en loopt Nederland daarbij flink achter.

Toch is het belangrijk om duidelijk te hebben waar we het over hebben, vertelt Brobst. “In big data wordt nog voornamelijk gesproken over het combineren van gestructureerde met ongestructureerde data, maar alle data is gestructureerd. Ik heb het liever over multigestructureerde data. Of traditionele versus non-traditionele data. Of het kan ook relationele versus non-relationele data zijn.”

Dataformaten veranderen snel

Van de drie v's van big data (volume, variety en velocity) kijkt Brobst het liefst naar snelheid (velocity). Hoewel mensen vaak spreken over de groei van data, zit de complexiteit in de snelheid waarin data kunnen veranderen, aldus Brobst. “Doordat de data op verschillende manieren gestructureerd is, wil je voorkomen dat je data in een bepaalde structuur vastlegt, zonder dat je precies weet welke vraag je wilt beantwoorden”, aldus Brobst, die het technische stuk gelijk doortrekt naar een business voorbeeld.

“Als ik mijn mening geef op Facebook over een product of dienst, dan kunnen daar veel grammatica fouten inzitten. Toch snap je wat ik wil zeggen. Dus totdat je precies weet welke waarde je uit de data kan halen, zoals een mening over een product, moet je de data in zijn geheel binnenhalen en opslaan.” Vervolgens kunnen datawetenschappers precieze vragen ontwikkelen, zoals 'welk profiel hebben klanten die een slechte referentie geven?'. Op basis daarvan wordt data ingedeeld en kunnen business analisten hun antwoorden uit de data halen.

Te weinig datawetenschappers

Het grootste probleem waar bedrijven tegenaan lopen, is het tekort aan datawetenschappers. Deze beroepsgroep valt tussen computerwetenschappers aan de ene kant en business analisten aan de andere kant. “Om dit tekort op te lossen, proberen we klanten op te leiden, want wij kunnen als Teradata niet groeien als we geen slimme klanten hebben, die weten hoe ze met data om moeten gaan”, vertelt Brobst.

Aan de andere kant wil Teradata de technologie leveren waarmee datawetenschappers gelijk mee aan de slag kunnen. “Tachtig procent van de datawetenschappers zijn bezig met het schrijven van code om de data te kunnen verwerken. Dat is prima als je bij Google werkt, maar bij een normaal bedrijf is dit niet wenselijk. Een datawetenschappers is geen computerwetenschapper.” Overigens zijn de datascientists onderdeel van de business, maar dat staat buiten kijf, aldus Brobst.

Volgens Brobst kunnen andere wetenschappers uit bijvoorbeeld sociale wetenschappen of toegepaste natuurkunde makkelijk ingezet worden om data te analyseren en de gestructureerde data door te zetten naar de business analyse-afdeling. Daarom is het belangrijk dat bedrijven zich niet blindstaren op de term 'big data', maar hun blik verbreden naar welke waarde data kan leveren, zeker in het aannemen van de juiste mensen.  

Bron: Customer Talk
0

Reacties

Logo CustomerTalk

Cookie-instellingen

CustomerTalk maakt gebruik van cookies voor een optimale gebruikerservaring.

Graag vragen wij je toestemming voor het plaatsen van deze cookies.

Accepteren Meer informatie