El creciente y sistemático aumento de los volúmenes de información que se generan cada día ha abierto la necesidad de nuevas y más eficientes técnicas para recolectar, procesar, analizar y presentar la información en especial en ámbitos científicos. El presente curso es una introducción a este nuevo campo denominado Datascience.
El alumno al finalizar el curso deberá ser capaz de:
- Conocer que es y donde se puede aplicar las técnicas y metodologías de Datascience.
- Construir un entorno de análisis de datos sobre Python.
- Entender y usar el entorno interactivo de desarrollo y análisis IPython.
- Recolectar, transformar y analizar fuentes de datos con el fin de obtener la información que desea.
- Entender, configurar y usar la librería de análisis estadístico Pandas de Python.
- Entender, configurar y usar la librería para gráficos Matplotlib de Python.
- Entender, configurar y usar la librería de Machine Learning Scikit-Learn de Python.
Semana 6 – 25 % nota final
Taller individual: Crear un notebook de IPython que incluya las siguientes operaciones: Leer archivos, operaciones matemáticas básicas
Semana 14 – 25 % nota final
Control de lectura.
Semana 16 – 50 % nota final.
Taller grupal: Desarrollo un análisis estadístico descriptivo de una determinada fuente de datos. El análisis debe permitir responder una serie de preguntas. El análisis de debe desarrollar usando las librerías Pandas y Matplotlib y debe entregar un notebook de IPython con los resultados.