1
Inleiding tot machinaal leren
- Big Data en Machine Learning.
- Algoritmen voor supervised, unsupervised en reinforcement learning.
- De stappen die nodig zijn om een voorspellend model te bouwen.
- Uitschieters detecteren en omgaan met ontbrekende gegevens.
- Hoe kies u het algoritme en de algoritmevariabelen?
Demonstratie
Aan de slag met de Spark-omgeving met Python met behulp van Jupyter Notebook. Bekijk verschillende voorbeelden van de geboden modellen.
2
Modelevaluatieprocedures
- Technieken voor herbemonstering in trainings-, validatie- en testspellen.
- Testen van de representativiteit van trainingsgegevens.
- Prestatiemetingen voor voorspellende modellen.
- Verwarring en kostenmatrix, ROC- en AUC-curven.
Praktisch werk
Evaluatie en vergelijking van de verschillende algoritmen op de geleverde modellen.
3
Voorspellende modellen, de frequentistische benadering
- Statistisch leren.
- Dataconditionering en dimensiereductie.
- Steunvectormachines en kernelmethoden.
- Vectorkwantificering.
- Neurale netwerken en diep leren.
- Ensemble leren en beslisbomen.
- Bandietenalgoritmen, optimisme tegenover onzekerheid.
Praktisch werk
Families van algoritmen implementeren met verschillende gegevenssets.
4
Bayesiaanse modellen en leren
- Principes van Bayesiaans interpreteren en leren.
- Grafische modellen: Bayesiaanse netwerken, Markovelden, inferentie en leren.
- Bayesiaanse methoden: Naive Bayes, Gaussische mengsels, Gaussische processen.
- Markov modellen: Markov processen, Markov ketens, verborgen Markov ketens, Bayesiaanse filtering.
Praktisch werk
Families van algoritmen implementeren met verschillende gegevenssets.
5
Machine Learning in productie
- De bijzonderheden van het ontwikkelen van een model in een gedistribueerde omgeving.
- Inzet van Big Data met Spark en MLlib.
- De cloud: Amazon, Microsoft Azure ML, IBM Bluemix...
- Modelonderhoud.
Praktisch werk
Productielancering van een voorspellend model met integratie in batchprocessen en verwerkingsstromen.