Annulé

Machine learning - ( Clustering, Regression)

CLUSTERING :

Récupérer un (ou plusieurs) jeu(x) de données:

soit sur la bibliothèque scikit-learn ici : [login to view URL]

ou sur le UCI machine learning repository : [login to view URL],

et en réaliser l'analyse. On demande:

un travail de clustering et un autre de classification,

la comparaison de diverses méthodes, l'utilisation de plusieurs métriques,

l'utilisation de techniques de réduction de dimension,

l'écriture d'un notebook détaillé, incluant ce qui précède, à m'envoyer à la fin du module.

REGRESSION :

Les données se trouvent sur [login to view URL] :

soit hebdomadaire : [login to view URL]

soit mensuelles : [login to view URL]

Il vous est demandé de comprendre l'influence des variables explicatives (météorologie, etc.) sur les variables à prédire, puis de mettre en place un outil de prédiction du nombre d'intervention. Pour cela :

Commencer par récolter sur internet des variables explicatives : chez météo France: [login to view URL] , sur le réseau sentinelles (épidémiologique)...

Compléter les éventuelles données manquantes.

Visualisez les données.

Détectez un potentiel outlier au niveau des interventions, et corrigez le fichier.

Rajouter éventuellement d'autres variables explicatives, qui selon vous pourraient faire varier le nombre d'interventions. Par exemple,

en intégrant le niveau d'eau du Doubs ici : [login to view URL]

en utilisant des données de veille sanitaire (grippe, varicelle...) ici :[login to view URL]

Normalisez (ou catégorisez) les données.

Procéder à une sélection de variables :

Etudier les corrélations entre variables explicatives,

Procéder à divers choix de sélections de variables,

Mesurer l'impact des variables explicatives sur la variable à expliquer.

Utiliser un arbre de décision pour prédire le nombre d'interventions.

Utiliser d'autres techniques d'apprentissage supervisé, pour réduire l'erreur quadratique moyenne de prédiction

Le rendu sera un mémoire décrivant votre étude de ce jeu de données, vos conclusion, ainsi qu'une archive zip contenant vos codes et données.

----------------------------------------------------------------------------------------------

Compétences : Machine Learning (ML), Python, Statistiques, Exploitation de Données

en voir plus : machine learning tutorial, classification regression and clustering in machine learning, supervised learning, supervised and unsupervised learning, types of machine learning with examples, types of machine learning ppt, types of machine learning, regression in machine learning, machine learning vancouver, machine learning companies vancouver, machine learning mehreen, machine learning thesis, machine learning freelance, machine learning statistical nlp option, job machine learning, machine learning message board, machine learning outsource, best freelance site machine learning, samiksha mishra machine learning, job machine learning sweden

Concernant l'employeur :
( 0 commentaires ) Belfort, France

Nº du projet : #22536803

2 freelance font une offre moyenne de €30 pour ce travail

Statxn

Bonjour, j'espère que tout va bien - licenciée en mathématiques appliquées; - Ingénieur en statistique et économie appliquée; - Technicienne spécialisée en Microsoft Office (diplômée auprès de la compagnie Microsoft : Plus

%bids___i_sum_sub_35% %project_currencyDetails_sign_sub_36% EUR en 7 jours
(53 Commentaires)
5.2
freeproject800

Bonjour ! J ai 9 ans d expérience dans ce domaine, je peux faire un travail de très bonne qualité . Cordialement

%bids___i_sum_sub_32% %project_currencyDetails_sign_sub_33% EUR en 1 jour
(2 Commentaires)
1.3