Inleiding tot Machine Learning
- Big Data en Machine Learning.
- Algoritmen voor supervised, unsupervised en reinforcement learning.
- De stappen om een voorspellend model te bouwen.
- Uitschieters detecteren en ontbrekende gegevens verwerken.
- Hoe het algoritme en de variabelen van het algoritme kiezen?
Demonstratie
Aan de slag in de Spark-omgeving met Python met behulp van Jupyter Notebook. Verschillende voorbeelden van verstrekte modellen visualiseren.
Evaluatieprocedures voor modellen
- Resampling-technieken in leer-, validatie- en testspellen.
- Testen van de representativiteit van de leergegevens.
- Meting van de prestaties van voorspellende modellen.
- Verwarringsmatrix, kostenmatrix en ROC- en AUC-curve.
Praktisch werk
Evaluatie en vergelijking van de verschillende algoritmen op de verstrekte modellen.
Voorspellende modellen, de frequentistische benadering
- Statistisch leren.
- Dataconditionering en dimensiereductie.
- Support vector machines en kernelmethoden.
- Vectorkwantisatie.
- Neurale netwerken en Deep Learning.
- Ensemble learning en beslissingsbomen.
- Bandit-algoritmen, optimisme over onzekerheid.
Praktisch werk
Implementatie van algoritmefamilies met behulp van diverse datasets.
Bayesiaanse modellen en leerprocessen
- Principes van Bayesiaanse inferentie en leertechniek.
- Grafische modellen: Bayesiaanse netwerken, Markov-velden, inferentie en leerproces.
- Bayesiaanse methoden: Naive Bayes, mengsels van Gauss-curven, Gaussprocessen.
- Markov-modellen: Markov-processen, Markov-ketens, verborgen Markov-ketens, Bayesiaanse filtering.
Praktisch werk
Implementatie van algoritmefamilies met behulp van diverse datasets.
Machine Learning in productie
- Specifieke kenmerken van de ontwikkeling van een model in een gedistribueerde omgeving.
- Gebruik van Big Data met Spark en MLlib.
- De Cloud: Amazon, Microsoft Azure ML, IBM Bluemix...
- Onderhoud van het model.
Praktisch werk
In productie brengen van een voorspellend model met integratie in batchprocessen en verwerkingsstromen.