big data


  • Comment mentir avec un graphique

    Comment mentir avec un graphique

    Posted on

    by

    Lorsqu’il s’agit de communiquer des chiffres, qu’ils soient financiers, électoraux, démographiques, sportifs, scientifiques ou bien d’autres choses encore, tout le monde s’accordera pour dire qu’il n’y a rien de mieux qu’un graphique. Il est aujourd’hui difficile de trouver un journal qui ne contienne pas au moins une infographie ou un rapport d’activité quelconque qui ne

    Continue reading→


  • Big data & krakend ijs onder anonimisatie

    Big data & krakend ijs onder anonimisatie

    Posted on

    by

    Inleiding Elk bedrijf bezit wel persoonsgegevens. Denken we maar aan winkels, banken en transportbedrijven. Deze gegevens kunnen interessant zijn voor andere doeleinden dan waarvoor ze initieel verzameld werden. Dit kan binnen het eigen bedrijf zijn, maar gegevens kunnen ook voor externen (bedrijven, onderzoeksinstellingen) waarde hebben. Helaas/gelukkig kunnen deze gegevens omwille van de privacywet niet zomaar

    Continue reading→


  • (bijna) 40 jaar R  – Hype of succes verhaal ?

    (bijna) 40 jaar R  – Hype of succes verhaal ?

    Posted on

    by

    In IT kringen is de programmeertaal  C en zijn varianten al jaren een begrip. Wat weinig mensen weten is dat in de jaren 70 in hetzelfde Bell labs een andere programmeertaal het levenslicht zag. Deze taal was niet bedoeld als all-purpose programmeertaal maar eerder als interactieve toolkit voor statistische data-analyse,  met nadrukkelijke aandacht voor grafische visualisatie

    Continue reading→


  • “Datamining zorgt voor ongelijke behandeling en reduceert controleurs tot aapjes”: een reactie

    “Datamining zorgt voor ongelijke behandeling en reduceert controleurs tot aapjes”: een reactie

    Posted on

    by

    Een artikel in DeMorgen kopt: “Slimme software herleidt belastingcontroleurs ‘tot aapjes’”, en daaronder: “Digitale selectie zorgt voor ongelijke behandeling belastingplichtigen”. We begrijpen uit het artikel dat Financiën zich voor haar controles nu voor 80% baseert op risicoprofielen die door datamining naar voren worden geschoven, en dat dit tot grote frustratie leidt bij inspecteurs en controleurs.

    Continue reading→


  • Big Data Analytics … What’s in a name ?

    Big Data Analytics … What’s in a name ?

    Posted on

    by

    In deze bijdrage proberen we het fenomeen Big Data Analytics te definiëren en te omschrijven. Zonder volledig te willen zijn (zo zijn de ethische en privacy aspecten eigenlijk een discussie op zich) belichten we een aantal algemene aspecten.  Als u dit leest is de kans bijzonder klein dat u nog nooit van Big Data gehoord hebt. Sinds

    Continue reading→


  • Sparklines: trends in tabellen

    Sparklines: trends in tabellen

    Posted on

    by

    Om goede data-analyses te maken is het cruciaal dat men data op een goede, begrijpbare, manier voorstelt. Dit leidt tot betere inzichten en op termijn dus ook tot betere data-driven business beslissingen. In deze blogpost staan we stil bij het belang van het correct presenteren van data en bekijken we een populaire visualisatietechniek: de sparklines! Data analyse &

    Continue reading→


  • Streamlining Analytics

    Streamlining Analytics

    Posted on

    by

    Deze researchnote vat de infosessie ‘Streamlining Analytics’ samen, gepresenteerd in juni 2013. Streamlining Analytics bespreekt drie barrières die het introduceren van analytics in bestaande organisaties bemoeilijken: (1) een trage en complexe architectuur, (2) een niet-optimale aanpak van dataquality-problemen en (3) een atypisch projectkader waarbinnen analyticsprojecten uitgevoerd worden. Voor elk van deze barrières reiken we mogelijke

    Continue reading→


  • Analytics behind the scenes: humans and computers versus big data

    Analytics behind the scenes: humans and computers versus big data

    Posted on

    by

    “Analytics” is een term die in de data-analyse wereld vaak gebruikt wordt, maar waar weinig consensus over de inhoud van deze term bestaat. Zo beschrijft men analytics vaak als een manier  om een antwoord te bieden aan vragen over de inhoud van de data (descriptive analytics) of over toekomstige ontwikkelingen die kunnen voorspeld worden op

    Continue reading→


  • “Data Virtualization” : perspectives et points d’attention

    “Data Virtualization” : perspectives et points d’attention

    Posted on

    by

    L’approche “Data Virtualization” émerge depuis quelques années dans la littérature et sur le marché IT (voir par exemple : R. F. Van der Lans, “Data Virtualization for BI Systems. Revolutionizing Data Integration for Datawarehouse“, Morgan Kaufmann, Elsevier, 2012). A l’heure du “Big Data“, cette approche propose de séparer couches physiques, logiques et conceptuelles, pour faciliter l’accès aux

    Continue reading→


  • “Mapping the World of Data Problems” : la qualité des données vue par la communauté IT

    Posted on

    by

     En novembre 2012, O’Reilly Media a édité un “livre-événement” en matière de “data quality” : Q. E. McCallum, Bad Data Handbook, Mapping the World of Data Problems, O’Reilly Media, 2012, 246 p. Cet ouvrage collectif  sur la qualité des données est inédit car il émane exclusivement de la communauté des web software developpers (Python, Perl script,  Parallel

    Continue reading→