Opleiding : Big Data, methoden en praktische oplossingen voor gegevensanalyse

Big Data, methoden en praktische oplossingen voor gegevensanalyse




Deze cursus stelt u in staat om de uitdagingen en voordelen van Big Data te begrijpen, evenals de technologieën om deze te implementeren. U leert hoe u enorme hoeveelheden gestructureerde en ongestructureerde gegevens kunt integreren met behulp van een ETL en vervolgens kunt analyseren met behulp van statistische modellen en dynamische dashboards.


INTER
INTRA
OP MAAT

Praktijkcursus ter plaatse of via klasverband op afstand

Ref. BID
  5d - 35u00
Prijs : Neem contact met ons op




Deze cursus stelt u in staat om de uitdagingen en voordelen van Big Data te begrijpen, evenals de technologieën om deze te implementeren. U leert hoe u enorme hoeveelheden gestructureerde en ongestructureerde gegevens kunt integreren met behulp van een ETL en vervolgens kunt analyseren met behulp van statistische modellen en dynamische dashboards.


Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
De concepten en de bijdrage van Big Data aan zakelijke uitdagingen begrijpen
Het technologische ecosysteem begrijpen dat nodig is voor een Big Data-project
De technische vaardigheden verwerven die nodig zijn om complexe, ongestructureerde en enorme gegevensstromen te beheren
Statistische analysemodellen implementeren om te voldoen aan bedrijfsbehoeften
Leren hoe u een datavisualisatietool gebruikt om dynamische analyses te maken

Doelgroep
Gegevensanalisten, statistische onderzoekers, ontwikkelaars, projectmanagers, business intelligence consultants.

Voorafgaande vereisten
Basiskennis van relationele modellen, statistiek en programmeertalen. Basiskennis van Business Intelligence concepten.

Praktische modaliteiten
Oefening
Een Hadoop-platform en de basiscomponenten ervan opzetten, een ETL gebruiken om gegevens te beheren, analysemodellen en dashboards maken.

Opleidingsprogramma

1
De concepten en uitdagingen van Big Data begrijpen

  • Oorsprong en definitie van Big Data.
  • Belangrijke marktcijfers wereldwijd en in Frankrijk.
  • De uitdagingen van Big Data: ROI, organisatie, vertrouwelijkheid van gegevens.
  • Een voorbeeld van Big Data architectuur.

2
Big Data-technologieën

  • Beschrijving van de architectuur en componenten van het Hadoop-platform.
  • Opslagmodi (NoSQL, HDFS).
  • Werkingsprincipes van MapReduce, Spark, Storm...
  • Belangrijkste marktdistributies (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Een Hadoop-platform installeren.
  • Technologieën voor datawetenschappers.
  • Presentatie van specifieke technologieën voor Big Data (Tableau, Talend, Qlikview, enz.).
Oefening
Installatie van een Big Data Hadoop-platform (via Cloudera QuickStart of een ander platform).

3
Gestructureerde en ongestructureerde gegevens beheren

  • Bedieningsprincipes van het Hadoop Distributed File System (HDFS).
  • Externe gegevens importeren in HDFS.
  • SQL-query's uitvoeren met HIVE.
  • Gebruik PIG om de gegevens te verwerken.
  • Het ETL-principe (Talend, enz.).
  • Beheer van massale datastreaming (NIFI, Kafka, Spark, Storm...)
Oefening
Implementatie van massale gegevensstromen.

4
Technieken en methoden voor big data-analyse

  • Machine Learning, een onderdeel van kunstmatige intelligentie.
  • Ontdek de drie families: Regressie, Classificatie en Clustering.
  • Datavoorbereiding en feature engineering.
  • Genereer modellen in R of Python.
  • Ensemble leren.
  • Ontdek de tools op de markt: Jupyter Notebook, Dataïku, Amazon Machine Learning, enz.
Oefening
Zet analyses op met een van de bestudeerde tools.

5
Datavisualisatie en praktijkvoorbeelden

  • Definieer de behoefte aan datavisualisatie.
  • Gegevensanalyse en visualisatie.
  • Kunnen alle soorten gegevens worden gebruikt in DataViz?
  • DataViz-tools op de markt.
Oefening
Installatie en gebruik van een tool voor gegevensvisualisatie om dynamische analyses te maken.

6
Conclusie

  • Dingen om te onthouden.
  • Samenvatting van best practices.
  • Bibliografie.


Feedback van klanten
4,3 / 5
De feedback van klanten is afkomstig van eindevaluaties na de opleiding. De score wordt berekend op basis van alle evaluaties die minder dan 12 maanden oud zijn. Alleen die met een tekstcommentaar worden weergegeven.


Data en plaats
Selecteer uw locatie of kies voor de les op afstand en kies vervolgens uw datum.
Klas op afstand