Skip to content

Latest commit

 

History

History
91 lines (61 loc) · 8.5 KB

sugerencias_proyecto.md

File metadata and controls

91 lines (61 loc) · 8.5 KB

Sugerencia de datasets para el proyecto

  • El dataset debe permitirles desarrollar un proceso de Minería de Datos donde se planteen preguntas, apliquen métodos descriptivos, predictivos, interpreten los resultados, etc.

  • Lo ideal es que sea un volumen grande (muchas filas) y de alta dimensionalidad (varias decenas de columnas).

  • Si es un dataset de una competencia nos gustaría que planteen otras tareas alternativas con los datos y no sólo lo que se propone en la competencia. Un objetivo del proyecto es que ustedes puedan extraer conocimiento de los datos y no sólo maximizar "a ciegas" una tasa de aciertos. En caso de datasets con análisis públicos (como notebooks) demás está decir que su trabajo debe ser diferente.

  • Una parte importante del proyecto y de manera general en la Minería de Datos es la reproducibilidad. En ese sentido en sus informes, reportes y presentaciones deben incluir referencias al dataset utilizado (links) siempre que sea posible.

Algunas ideas

Otros temas sugeridos

Más temas sugeridos (pedir al cuerpo docente)

  • Tweets de Ataques Terroristas de Manchester y Westminster, ambos ocurridos el 2017.
  • Tweets de Chile geo-etiquetados del 2012 al 2017.

Otros datasets disponibles

Chile:

APIs:

Otros:

Pidiendo acceso: