Voorbeeld deliverables tijdens Data Science project

Tijdens de Data Science opleiding doorloop je een eigen Data Science project, waarin de volgende onderdelen / deliverables aan bod komen:

  • Projectdefinitie: op welk proces en welke uitkomstmaat richt je Data Science project zich? Hoe is dit verbonden met bedrijfsdoelen? Wordt dit intern gezien als een strategisch belangrijk project?
  • Verkenning van data: Welke variabelen zijn beschikbaar? Wat is de kwaliteit van deze variabelen? Welke belangrijke variabelen missen? Hoe zijn de variabelen verdeeld? Welke variabelen hangen sterk met elkaar samen?
  • Voorbereiding analyse: Wat is de analysestrategie? Welke variabelen worden niet meegenomen in de analyse? Welke variabelen worden op een andere manier gedefinieerd? Worden er nieuwe variabelen samengesteld? Hoe wordt er omgegaan met missende datapunten of data van lage kwaliteit?
  • Analyse: Welke performance werd behaald met welke modellen? Hoe is het optimale model gedefinieerd? Wat kan geleerd worden van de goede en foute voorspellingen?
  • Conclusie: Hoe goed is het optimale model? Op welke manier kan het machine learning algoritme het beste worden geïmplementeerd? En hoe groot is dan de verwachte verbetering? Welke adviezen zijn er naast implementatie over data die extra of beter verzameld kunnen worden?
  • Implementatie: Hoe monitor je de uitkomsten? Hoe monitor je de vergelijkbaarheid van de nieuwe procesdata met de data waar het model op werd gebaseerd? Hoe monitor je de kwaliteit van de voorspellingen? Hoe kan het model blijvend worden geüpdatet?

 

Recent Posts