Machine learning exercice

Fermé Publié le il y a 4 ans Paiement à la livraison
Fermé Paiement à la livraison

CLUSTERING :

Récupérer un (ou plusieurs) jeu(x) de données:

soit sur la bibliothèque scikit-learn ici : [login to view URL]

ou sur le UCI machine learning repository : [login to view URL],

et en réaliser l'analyse. On demande:

un travail de clustering et un autre de classification,

la comparaison de diverses méthodes, l'utilisation de plusieurs métriques,

l'utilisation de techniques de réduction de dimension,

l'écriture d'un notebook détaillé, incluant ce qui précède, à m'envoyer à la fin du module

REGRESSION :

Les données se trouvent sur [login to view URL] :

soit hebdomadaire : [login to view URL]

soit mensuelles : [login to view URL]

Il vous est demandé de comprendre l'influence des variables explicatives (météorologie, etc.) sur les variables à prédire, puis de mettre en place un outil de prédiction du nombre d'intervention. Pour cela :

Commencer par récolter sur internet des variables explicatives : chez météo France: [login to view URL] , sur le réseau sentinelles (épidémiologique)...

Compléter les éventuelles données manquantes.

Visualisez les données.

Détectez un potentiel outlier au niveau des interventions, et corrigez le fichier.

Rajouter éventuellement d'autres variables explicatives, qui selon vous pourraient faire varier le nombre d'interventions. Par exemple,

en intégrant le niveau d'eau du Doubs ici : [login to view URL]

en utilisant des données de veille sanitaire (grippe, varicelle...) ici :[login to view URL]

Normalisez (ou catégorisez) les données.

Procéder à une sélection de variables :

Etudier les corrélations entre variables explicatives,

Procéder à divers choix de sélections de variables,

Mesurer l'impact des variables explicatives sur la variable à expliquer.

Utiliser un arbre de décision pour prédire le nombre d'interventions.

Utiliser d'autres techniques d'apprentissage supervisé, pour réduire l'erreur quadratique moyenne de prédiction

Le rendu sera un mémoire décrivant votre étude de ce jeu de données, vos conclusion, ainsi qu'une archive zip contenant vos codes et données.

----------------------------------------------------------------------------------------------

Machine Learning (ML) Python

Nº du projet : #23139446

À propos du projet

1 proposition Projet à distance Actif il y a 4 ans

1 freelance fait une offre moyenne de €20 pour ce travail

varunsood189

1. Je viens d'obtenir mon diplôme il y a quelques mois, ce qui me rend parfait pour ce travail. Ce qui me manque d'expérience. Je peux me rattraper en faisant le devoir. Merci pour la mission. Pour d'autres questions / Plus

€20 EUR en 7 jours
(0 Commentaires)
0.0