Is het u al opgevallen dat de functie van data scientist helemaal bovenaan alle lijstjes staat van de meest gevraagde functies in data en technologie jobs van 2019? Niet voor niets noemde Harvard School de data scientist ‘The sexiest job of the 21st century’. Daarnaast hebben veel organisaties het moeilijk om goed opgeleide data scientists te vinden.

Onze 10-daagse opleiding ‘Data Science van A tot Z’ is bedoeld voor iedereen die data science in de dagelijkse praktijk wil brengen en een boost wil geven aan zijn of haar carrière.

Statistiek, data blending en datavisualisatie behoren tot de kerncompetenties maar goede communicatieve vaardigheden, het organiseren van BI & data governance, het opstellen van business cases en onvervalste KPI’s, datakwaliteit, privacy en consultancyvaardigheden zijn ook van groot belang.

Doelstellingen

Er wordt veel verwacht van een Data Scientist. Data science 'doen' betekent zoveel meer dan alleen programmeren in R. We benaderen de opleiding via de verschillende stappen die worden uitgevoerd in een Data Science-project:

  • Introductie tot data science
  • De vraag van uw interne klant begrijpen
  • De data zoeken
  • De data opslaan
  • De data opschonen
  • De data verkennen
  • De data analyseren
  • De data visualiseren
  • Het resultaat presenteren

We plaatsen elk onderwerp binnen elke fase in de lijst met de verschillende taken die een Data Scientist uitvoert.

Pluspunten

  • Interactie staat centraal in deze opleiding. Er is voldoende gelegenheid om vragen te stellen en ervaringen met andere deelnemers uit te wisselen. Tijdens deze Data Science opleiding werkt u aan een concrete case (Data Science project) die als rode draad loopt doorheen de 10 dagen opleiding. Hierdoor onstaat de ideale mix tussen theorie en praktijk.
  • De opleiding is in handen van trainers met bakken ervaring die innovatie en kwaliteit hoog in het vaandel dragen. En zij kennen de uitdagingen van een Data Scientist door en door.
  • Na afloop hebt u alles in handen om uw eigen Data Science project vanaf nu zelfstandig en met vertrouwen aan te pakken en uit te voeren.

Uw resultaten

  • De opleiding biedt dé volledige toolbox die u nodig hebt om uw rol als Data Scientist met kennis van zaken aan te pakken.
  • U krijgt de veelgevraagde harde en softe data-science vaardigheden onder de knie: statistische analyse, datamining, R, datavisualisatie & -presentatie, data preprocessing, ...
  • U kunt vragen van de business correct vertalen naar de juiste data-probleemstelling en daarna gefundeerde aanbevelingen doen aan de business op basis van een data science proces. 

 

Bestemd voor

Deze opleiding is een abolute must voor elke professional die een rol als data scientist ambieert. Het is duidelijk dat in een wereld die even turbulent is als degene waarin we ons nu bevinden, deze data scientists uit alle hoeken van de onderneming kunnen komen. Bijvoorbeeld: business managers, business en functionele analisten, data of IT-architecten, BI analisten, data-analisten, proceseigenaars en -analisten, ...

Programma

Dag 1 - voormiddag: Introductie tot Data Science

Wat doet een data scientist nu precies? Uit wat bestaat het takenpakket? Hoe kan deze rol ingevuld worden om maximale waarde aan de organisatie toe te voegen? Hoe kunt u de vraag van de business op een gestructureerde manier begrijpen, de juiste data-oplossing vinden en uw inzichten duidelijk presenteren?

Tijdens deze introductie bieden we een compact overzicht van het domein 'Data Science' en de rol van de Data Scientist binnen dit domein.

  • De geschiedenis van Data Science
  • De 'hard skills' van een Data Scientist:
    • Data en informatie verzamelen
    • Data en informatie modelleren
    • Informatie voorbereiden voor analyse (pre-processing)
    • Datamining algoritmes
    • Klant- en webanalyse
    • Programmeertalen & andere tools
    • Statistiek
    • Analytics
    • Visualiseren van informatie
  • De 'soft skills' van een Data Scientist:
    • De vraag van de business goed begrijpen
    • Duidelijke communicatie van het resultaat aan uw (interne) klant

Dag 1 - namiddag: Uw actieplan opstellen + data verzamelen

Aan de hand van een game tonen we u hoe belangrijk het is om de vraag goed te begrijpen alvorens te beginnen met het verzamelen van gegevens. Vervolgens leren we een methode om de vraag correct te benaderen. Zodra we de vraag begrijpen, moeten we de benodigde gegevens verzamelen om een antwoord op de vraag te vinden.

In het tweede deel beantwoorden we vragen als: Waar kunnen we die gegevens vinden? Hoe kunnen we er toegang toe krijgen? Zijn we vrij om het commercieel te gebruiken?

De case die we zullen uitwerken zal worden geïntroduceerd en de nodige gegevens voor de case zullen worden verzameld.

  • Introductie van het game
  • Hoe structureert u uw data science project?
  • Open Data
  • Google technieken
  • Interne databronnen
  • OCR
  • Web scraping
  • Introductie case

Trainer: Sven Vermeulen 

Dag 2: Databases, BigData & NoSQL: overzicht

In dit gedeelte staan we stil bij de verschillende databasemodellen. In het tweede deel laten we u kennismaken met de complexiteit van de big data-wereld en de manier waarop we ermee omgaan.

Ten slotte bestuderen we het ontwerp van de relationele database die nodig is voor onze case en bekijken we enkele alternatieve NoSQL-indelingen om een deel van de informatie op te slaan.

  • Belang van databases
  • Databasebeheersystemen of DBMS
  • Big Data
  • Data-opslag
  • Verschillende soorten databasemodellen
    • Hiërarchische
    • Netwerk
    • Relationeel (SQL)
    • Object-Oriented
    • Key-Value (NoSQL)
    • Document (NoSQL)
    • Column-Family (NoSQL)
    • Graph (NoSQL)

Trainer: Ann Van Eyken

Dag 3: Pre-processing data

In dit gedeelte leren we u hoe van een vervuilde en onvolledige gegevensset naar een schone dataset kunt gaan die klaar is voor analyse. U leert over het opschonen, integreren, transformeren, reduceren en discretiseren van onbewerkte gegevens, niet alleen in theorie, maar ook in de praktijk.

Gedurende deze dag zullen we voornamelijk de tool - OpenRefine - gebruiken om de ruwe gegevens van onze zaak voor te bereiden.

  • Data in de 'echte' wereld
  • De 5 taken in pre-processing
    • Opschonen
    • Integreren
    • Transformeren
    • Reduceren
    • Discretiseren
  • Reproduceerbaarheid
    • Ruwe data
    • Schone data
    • Codeboek
    • Expliciet en exact
  • Pre-processing in OpenRefine, PowerBI, Excel

Trainer: Ann Van Eyken

Dag 4, 5 en dag 6 - voormiddag: Business Intelligence

In dit gedeelte bespreken we waarom BI waardevol is, wie u nodig heeft in uw team en waar u moet beginnen. We praten over data warehousing en dimensioneel modelleren en waarom ze zo belangrijk zijn.

Tenslotte ontwerpen we een dimensionaal model voor de case en extraheren, laden en transformeren de gegevens die we tot nu toe hebben gevonden en verwerkt in een datawarehouse.

  • Introductie tot Business Intelligence
  • BI-strategie
  • BI-architectuur
  • Waarom is BI nuttig?
  • Wie betrekt u bij een BI-project?
  • Waar begint u?
  • Wat zijn de valkuilen?
  • Data Warehousing
  • Dimensioneel modelleren

Trainer: Ann Van Eyken

Dag 6 - namiddag en dag 7: Data Mining

Data Mining is het proces waarbij patronen in datasets worden herkend. In dit gedeelte onderzoeken we verschillende soorten patronen en passen we ze toe op de business vragen. Bijvoorbeeld: het vinden van verschillende klantengroepen, het voorspellen van churn of het ontdekken van een bepaalde frequentie van sets.

We gebruiken een tool om enkele relevante algoritmes toe te passen op de dataset van onze case.

  • Introductie
    • Definitie
    • Proces
    • Overzicht van de technieken
  • Classificatie
    • OneRule (1R)
    • Beslissingsbomen
  • Regressie
    • Lineaire regressie
    • Logistic regressie
  • Frequente itemset mining
    • Apriori
  • Clustering
    • K-means clustering
    • Hiërarchische clustering

Trainer: Ann Van Eyken

Dag 8: Kennismaking met R

R verwijst naar een open source programmeertaal en softwareomgeving. Onderzoekers, academische wetenschappers en vakmensen gebruiken vaak R voor statistische gegevensverwerking. R is zeer relevant in de context van dataming en statistieken.

In deze dag zetten we u op weg met R. We introduceren de basisbeginselen en laten u een aantal geavanceerde functies zien. We zullen R gebruiken om enkele modellen voor de dataset in onze case te bouwen en proberen ook een aantal voorspellingen te doen.

  • Wat is R?
  • Vectoren
  • Matrixen
  • Factoren
  • Lijsten
  • Dataframes
  • Conditionals en flow controle
  • Loops
  • Functies
  • Toepassen
  • Hulpmiddelen
  • Visualisatie

Trainer: Ann Van Eyken

Dag 9: Datavisualisatie do's en don'ts

De vaardigheid om data te kunnen visualiseren is van het allergrootste belang in de wereld van vandaag. Onbewerkte gegevens kunnen worden gebruikt, maar slagen er niet altijd in de juiste boodschap en gevoel voor urgentie door te geven. In deze dag behandelen we zowel theorie als praktijk voor datavisualisatie en verbeteringen daarvan. Het uiteindelijke doel is om het juiste beeld voor uw boodschap te vinden.

Daarnaast maken we ook visualisaties van de gegevens uit de case.

  • Belang van datavisualisatie
  • Historiek
  • Methodes
  • Visuele designs
  • The Good
  • The Bad
  • The Ugly
  • Workshop + case

Trainer: Sven Vermeulen

Dag 10: Presenteren van uw resultaat

Als u ervoor zorgt dat uw boodschap zorgvuldig is opgebouwd doorheen uw Data Science proces kunt u de desision makers gemakkelijker overtuigen om uw bevindingen om ze zetten naar concrete verbeteringen. Tijdens deze laatste dag bieden we u allerlei tools om uw resultaat & bevindingen om te zetten in een verhaal.

U kunt uw presentatievaardigheden oefenen aan de hand van de case. U krijgt gerichte feedback, zowel op inhoud als formaat.

  • Het verhaal vertellen
    • Simpel
    • Onverwacht
    • Concreet
    • Geloofwaardig
    • Emotioneel
    • Verhalen
  • Het verhaal van Jared
  • Herhaling blijft hangen
  • Tips & tricks
  • Effectieve slides opmaken
  • De uitdaging van storytelling
  • Business case

Trainer: Sven Vermeulen

Docent(en)

d_04014
Ann Van Eyken

Ann Van Eyken heeft een diploma Licenciaat (Master) Wiskunde – Informatica en is een gedreven docent met meer dan 25 jaar relevante ervaring. Momenteel is zij aan de slag als trainer voor The Master Labs. Zij zal alles in het werk stellen om de trainingen die ze geeft en de opleidingsprojecten waarvoor ze verantwoordelijk is tot een goed einde te brengen. Haar lessen zijn zeer interactief en gestructureerd, zij kan vlot inspelen op vragen van de deelnemers en de trainingen aanpassen aan hun niveau en interesses.

Lees meer
d_04016
Sven Vermeulen

Sven Vermeulen is een gemotiveerd business analist met de nodige relevante ervaring en een diploma Master Handelswetenschappen – Management en Informatica. Door de combinatie van zijn ervaring als assistent aan de universiteit Gent en zijn praktijkervaring als business analist, is Sven een van de dedicated lesgevers bij The Master Labs. Hij focust zich hierbij op trainen met voldoende praktische invulling en interactie met cursisten zonder de nodige theoretische elementen naar achter te schuiven.

Lees meer

Praktische informatie

Prijs: 4 051 EUR (excl btw)

De opleidingen komen in aanmerking voor verschillende subsidies. Handig: zo betaalt u zelf maar een deel van het inschrijvingsgeld.

  • Tot 40% subsidie met KMO portefeuille op klassikale opleidingen, live webinars en congressen. Meer info vindt u hier.
Extra:

Gelieve uw laptop mee te brengen naar deze opleiding. Zo garanderen wij u het maximum leerresultaat.

Incompany: Hebben meerdere collega’s behoefte aan deze opleiding? En trekt u liever niet naar een andere plaats? Breng de opleiding naar uw afdeling of onderneming: handig! Bovendien spitst de trainer zich dan toe op uw situatie, op uw sector en op de vragen van uw medewerker. Vraag uw incompany opleiding aan.

Partner

Inschrijven

Data