Dans un monde de plus en plus axé sur les données, les entreprises ont besoin de professionnels capables de maîtriser les outils et techniques avancées d'analyse, de stockage et de traitement de données massives. Cette formation vous permettra de développer des compétences essentielles en Big Data, Machine Learning, traitement du langage naturel (NLP) et visualisation de données, des domaines en forte demande sur le marché du travail. Vous apprendrez à gérer des bases de données NoSQL, à extraire des informations du web, à comprendre les algorithmes de Machine Learning, et à travailler avec des systèmes distribués à grande échelle. L'expertise acquise dans ces domaines vous ouvrira des opportunités d'emploi dans des secteurs innovants comme la Data Science, l'Intelligence Artificielle, la Business Intelligence, ou encore l'architecture des systèmes de données. Avec une montée en compétence dans ces technologies de pointe, vous pourrez non seulement évoluer dans vos responsabilités mais aussi répondre aux besoins croissants des entreprises en matière de données.

Public

À qui s'adresse la formation Data scientist (Initiation)

Etre en possession d'un master en mathématiques appliquées, statistiques et probabilités, ou finances mathématiques.

Objectifs

Compétences visées pour la formation Data scientist (Initiation)

Les stagiaires seront capables de traiter des fichiers volumineux, d'inventer de nouveaux usages et d'en tirer une valeur informationnelle. Ils connaitront les infrastructures informatiques, le traitement des données, les algorithmes, etc. Ils seront capables d'aider les dirigeants à la prise de décision dans de nombreux domaines d'après le connaissances acquises en matière de traitement de données.

Programme

Les bases de données NoSQL

  1. Concepts des bases de données distribuées
  2. Connaitre le MapReduce
  3. Connaitre les bases de données clef-valeurs
  4. Les différents types de bases de données
  5. Les flux de données

Extraire des informations du web

  1. Reconnaitre des entités nommées
  2. Qu'est ce que la désembiguation
  3. Qu'est ce que la fact extraction
  4. Qu'est ce que le web sémantique

Connaitre les données multimédia

  1. Initiation à l'indexation des images
  2. Initiation à l'indexation des sons
  3. Etudes de cas

Connaitre la théorie et les algorithmes

  1. Les arbres de décision
  2. Les réseaux de neurones
  3. Le support Vector machines
  4. Le boosting, le lasso
  5. L'apprentissage par renforcement

Noyaux et deep learning

  1. L'apprentissage en ligne
  2. L'apprentissage statistique distribué
  3. Les techniques d'échantillonnage
  4. Le traitement des images

L'apprentissage non supervisé

  1. Les variables latentes
  2. Le clustering
  3. L'analyse des affinités
  4. La détection des anomalies

Les réseaux HMM et la rep vectorielle

  1. Chaines cachées de Markov
  2. Représentation vectorielles
  3. Modèles séquentiels

Traiter le langage naturel

  1. Tokeniser
  2. Marquer des parties de discours
  3. Représenter des documents
  4. Word embedding
  5. Word net

Visualiser des données

  1. Techniques de visualisation
  2. Evaluation des systèmes de visualisation
  3. Concevoir des nouveaux outils de visualisat

Stockage à l'échelle du web

  1. SGBD relationnels distribués
  2. Systèmes de fichiers distribués
  3. Stockage à grande échelle
  4. Stockage de type dynamo
  5. Stockage de type BigTable, HBase
  6. Systèmes NewSQL

La formation Data scientist (Initiation) est dispensée sur 21 heures

Durée et montant de la formation

Intitulé Durée Montant HT
Formation Data scientist - Initiation 21 heures 2190.00 €

Demander une convention de formation

Inscription newsletter

Recevez la newsletter ONLYWEB Formation pour vous tenir informé des formations à venir et maintenir vos compétences.

ONLYWEB Formation, s'appuie sur le réseau d'experts EVA - Solutions

coordonnées

© ONLYWEB Formation
6 pl. Dumas de Loire
69009 Lyon
TÉL 09 72 13 00 73
EVA Solutions: La force du réseau