Vijf interessante trends op het gebied van big data

Door Nina22 dec 2021 

Big data is een term die voor het eerst in 1980 werd gebruikt door de socioloog Charles Tilly, maar pas sinds 2013 is de term opgenomen in de Oxford English Dictionary. Vandaag de dag, meer dan 40 jaar geleden, is de term echter niet meer weg te denken uit de bedrijfswereld. Terwijl vroeger enkel grote Tech bedrijven zoals Facebook en Google gebruik maakten van deze technologie, beginnen ook de midden- en kleinbedrijven tegenwoordig de meerwaarde van deze belangrijke innovatie in te zien. Dat komt natuurlijk ook doordat big data door de jaren heen op steeds meer gebieden kan worden toegepast. Juist om die reden leggen we u graag wat meer uit over wat big data inhoudt én welke trends u op dit gebied zeker in de gaten moet houden. 

Wat is big data nu precies? 

Voordat we u gaan vertellen welke trends u zeker moet gaan volgen op het gebied van big data lijkt het ons verstandig om eerst duidelijk te krijgen wat big data nu precies inhoudt. In feite ligt aan de basis van big data namelijk geen speciale technologie, maar eerder een sociologisch feit. Als mensheid produceren we gezamenlijk iedere minuut van de dag nieuwe data. Het IDC, International Data Corporation, voorspelt zelfs dat de hoeveelheid data die wij in de toekomst gaan genereren iedere twee jaar zal verdubbelen. Dat wilt dus zeggen dat we in 2025 gezamenlijk meer dan 175 zettabytes aan data zullen produceren. En dat is zelfs nog maar de minimale hoeveelheid. De afgelopen decennia begonnen steeds meer bedrijven daarom de waarde van deze gigantische datastroom in te zien. Al deze informatie biedt organisaties namelijk de mogelijkheid om ontzettend veel te leren over hun werkprocessen, werknemers en natuurlijk hun klanten. Aan de hand daarvan is het vervolgens mogelijk om een beter inzicht te krijgen in de markt, de producten te verbeteren én de processen te stroomlijnen. 

Big data is echter veel meer dan alleen een optelsom van een grote hoeveelheid gegevens. Volgens het Amerikaanse onderzoeksbureau Gartner dient een verzameling van gegevens namelijk aan een drietal criteria te voldoen om als big data te worden beschouwd: 

  • De hoeveelheid data; 
  • De snelheid waarmee data binnenkomt en/of wordt opgevraagd; 
  • De diversiteit van de data. 

Juist die snelle stromen van diverse gegevens in uitzonderlijk grote hoeveelheden zijn voor bijna alle organisaties van groot belang. Deze gegevens zijn namelijk door veel afdelingen binnen de organisatie te gebruiken. Denk bijvoorbeeld aan het marketing en sales team, maar ook customer service heeft veel baat bij de binnenstromende data. Wat zijn daarom de belangrijkste trends met betrekking tot big data om in de gaten te houden? 

Ethisch verantwoord omgaan met data 

Volgens ons misschien wel één van de belangrijkste trends op het gebied van data in zijn algemeen is ethiek. Vandaag de dag zullen bedrijven niet meer alleen aandacht besteden aan de kwaliteit van de data en de inzichten die eraan te onttrekken zijn. Ook ethiek neemt een belangrijke positie in. Sinds dat algoritmen een steeds grotere rol zijn gaan spelen in beslissingsprocessen, is ethiek het maatschappelijk debat gaan domineren. Uit verscheidene onderzoeken is namelijk aan het licht gekomen dat grote verzamelingen data veelal een vooroordeel tot stand kunnen brengen in de analyses. Een goed voorbeeld hiervan is gezichtsherkenningssoftware op basis van big data. Het schijnt namelijk zo te zijn dat deze software beter werkt voor blanke mannen dan voor ouderen, kinderen, mensen met een andere huidskleur en vrouwen. Het gevolg hiervan is dat het algoritme ook nog beter wordt getraind op de categorie blanke mannen, waardoor de software steeds slechter begint te werken voor alle mensen die buiten deze categorie vallen. Door verschillende van dit soort incidenten zijn bedrijven dus genoodzaakt om ethisch verantwoord met data om te gaan. 

De DataOps methodologie 

De afkorting van ‘data operations’ is een nieuwe methodologie die bedoeld is om de kwaliteit van data-analyses te verbeteren en het proces te versnellen. Bij DataOps wordt de focus gelegd op een betere samenwerking tussen verschillende IT-teams en zodoende de levenscyclus van data efficiënter én sneller te maken. Binnen een onderneming zijn namelijk verschillende mensen aan het werk met data: database-ontwikkelaars, data-ontwerpers, dashboardontwikkelaars én datawetenschappers zijn allemaal bezig met datastromen en -kwaliteit. Toch blijkt de communicatie tussen al deze teams in de praktijk vaak stroef te verlopen. Om hier verandering in te brengen biedt DataOps een werkwijze waar de kennis en inspanningen van alle medewerkers worden samengebracht. Op deze manier kunnen bedrijven hun data snel omzetten in betrouwbare inzichten. 

Data-analyse met behulp van augmented analytics 

Automatisatie is tegenwoordig steeds meer het sleutelwoord. Door middel van augmented analytics worden data-analyse, machine learning én natural language processing gecombineerd. Zodoende wordt een groot deel van het analyseproces geautomatiseerd. Voor bedrijven is het vervolgens eenvoudiger om data-analyses te ontwikkelen, delen én interpreteren. Daarnaast biedt augmented analytics ook nog voorspellende inzichten over data van het bedrijf. Het grootste voordeel is echter tijdswinst. Een goede data-analyse volgt namelijk altijd een vijftal stappen, waarbij uit onderzoek blijkt dat maar liefst 80 procent van de tijd doorgaans verloren gaat aan alleen de eerste twee stappen. Dit tijdrovende werk kan door augmented analytics voor een groot deel worden beperkt en vaak met minder fouten worden uitgevoerd. Zodoende kunnen data-analisten zich bezighouden met belangrijkere taken, waar meer strategie en creativiteit voor nodig zijn. 

Automatisering met continuous intelligence 

Continuous intelligence (CI) is een tool dat business intelligence combineert met augmented analytics. Het helpt bedrijven om oudere gegevens in realtime te analyseren en op deze manier hun processen te verbeteren. Traditionele BI-tools schieten hier vaak tekort, omdat deze van oorsprong vertrouwen op het menselijk ingrijpen. CI haalt het menselijke component eruit en zorgt voor automatisering in het analyse- en beslissingsproces. Hoewel de toepassingen voor CI nog volledig in ontwikkeling zijn worden de vele mogelijkheden nu al duidelijk. 

Nieuwe data genereren middels Generative Adversarial Networks 

De laatste belangrijke trend die we u graag voorleggen, draait om Generative Adversarial Networks ofwel GANs. Dit is een specifieke soort machine learning framework, waarmee de ‘big’ uit big data kan worden gehaald. Normaal gesproken zijn er aanzienlijk grote hoeveelheden gegevens nodig om een model te kunnen trainen. Want hoe meer data als input aan het systeem wordt gegeven, hoe beter het model uiteindelijk in staat is om voorspellende analyses uit te voeren. Maar voor veel organisaties is het vaak moeilijk tot zelfs onmogelijk om aan deze grote hoeveelheden data te komen. GANs lossen dit probleem echter op. Met dit machine learning framework is het namelijk mogelijk om op basis van historische gegevens nieuwe data te genereren van dezelfde kwaliteit. Kleinere ondernemingen die dus data-analyses willen uitvoeren, maar niet beschikken over grote hoeveelheden data. Kunnen dus uitstekend gebruikmaken van GANs om toch aan de benodigde data te komen. 

x

Meer informatie

Onze specialisten staan u graag te woord.

  • Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.

x

Demo Dashboard Aanvragen

Onze Demo is 100% vrijblijvend en geeft je gelegenheid om, tijdens een online meeting, kennis te maken met Power BI Dashboards.

"*" geeft vereiste velden aan

Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.

x

ONTVANG ONZE BROCHURE

Vraag nu onze brochure met prijzen en informatie aan en ontdek waarom Data Analytics al meer dan 1000+ succesvolle projecten heeft opgeleverd!