- Desarrollamos un proyecto de machine learning, para determinar la calidad del agua y su potabilidad, con la columna target IS_SAFE, sobre si el agua se considera segura o no. El proyecto en principio se hará con aprendizaje supervisado de clasificacion, al ser nuestro target un clasificador binario (segura o no segura). Usaremos tanto modelos normales (regresion logistica, SVM..) como modelos con técnicas de más complejas de ensembles (XGBOOST, RANDOM FOREST...).
- Utilizaremos un dataset sobre la calidad del agua, con columnas de las concentraciones de distintas sustancias que pueden ser contaminantes.
- Dado el desbalance del target, haremos modelos con oversampling y sin balancear, y los compararemos.
- Buscaremos los parametros óptimos de nuestros mejores modelos, con gridsearch y cross value.
- Keywords(Python, kaggle, Data Cleaning, Visualización, aprendizaje supervisado)
-
Notifications
You must be signed in to change notification settings - Fork 0
Repositorio creado para mi primer proyecto de Machine Learning, hecho durante mi tiempo en el bootcamp de Data Science de The Bridge. Estudio sobre la calidad del agua, con aprendizaje supervisado
cris-jimenez89/MACHINE_LEARNING_CALIDAD_DEL_AGUA_SUPERVISADO
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
Repositorio creado para mi primer proyecto de Machine Learning, hecho durante mi tiempo en el bootcamp de Data Science de The Bridge. Estudio sobre la calidad del agua, con aprendizaje supervisado
Topics
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published