Machine learning - ( Clustering, Regression)
Budget €8-30 EUR
- Freelancer
- Emplois
- Machine Learning (ML)
- Machine learning - ( Clustering, Regression)
CLUSTERING :
Récupérer un (ou plusieurs) jeu(x) de données:
soit sur la bibliothèque scikit-learn ici : [login to view URL]
ou sur le UCI machine learning repository : [login to view URL],
et en réaliser l'analyse. On demande:
un travail de clustering et un autre de classification,
la comparaison de diverses méthodes, l'utilisation de plusieurs métriques,
l'utilisation de techniques de réduction de dimension,
l'écriture d'un notebook détaillé, incluant ce qui précède, à m'envoyer à la fin du module.
REGRESSION :
Les données se trouvent sur [login to view URL] :
soit hebdomadaire : [login to view URL]
soit mensuelles : [login to view URL]
Il vous est demandé de comprendre l'influence des variables explicatives (météorologie, etc.) sur les variables à prédire, puis de mettre en place un outil de prédiction du nombre d'intervention. Pour cela :
Commencer par récolter sur internet des variables explicatives : chez météo France: [login to view URL] , sur le réseau sentinelles (épidémiologique)...
Compléter les éventuelles données manquantes.
Visualisez les données.
Détectez un potentiel outlier au niveau des interventions, et corrigez le fichier.
Rajouter éventuellement d'autres variables explicatives, qui selon vous pourraient faire varier le nombre d'interventions. Par exemple,
en intégrant le niveau d'eau du Doubs ici : [login to view URL]
en utilisant des données de veille sanitaire (grippe, varicelle...) ici :[login to view URL]
Normalisez (ou catégorisez) les données.
Procéder à une sélection de variables :
Etudier les corrélations entre variables explicatives,
Procéder à divers choix de sélections de variables,
Mesurer l'impact des variables explicatives sur la variable à expliquer.
Utiliser un arbre de décision pour prédire le nombre d'interventions.
Utiliser d'autres techniques d'apprentissage supervisé, pour réduire l'erreur quadratique moyenne de prédiction
Le rendu sera un mémoire décrivant votre étude de ce jeu de données, vos conclusion, ainsi qu'une archive zip contenant vos codes et données.
----------------------------------------------------------------------------------------------
2 freelances font une offre moyenne de 30 € pour ce travail
Bonjour, j'espère que tout va bien - licenciée en mathématiques appliquées; - Ingénieur en statistique et économie appliquée; - Technicienne spécialisée en Microsoft Office (diplômée auprès de la compagnie Microsoft : Plus
Bonjour ! J ai 9 ans d expérience dans ce domaine, je peux faire un travail de très bonne qualité . Cordialement