Principal >
Cursos >
Ciencia de Datos > Actividades y Material de Apoyo
Actividades y Material de Apoyo
Sesión 1:
"Introducción a Ciencia de Datos"
"Definición y Conceptos"
- Conceptos de Ciencia de Datos (presentación en PDF y PowerPoint).
- Habilidades de un Científico de Datos (presentación en PDF y PowerPoint).
- Herramientas para Ciencia de Datos (presentación en PDF y PowerPoint).
Python (Conceptos)
Python (Práctica)
Sesión 2:
Python
Formatos de Datos (Teórico/Práctico)
Archivos y Enlaces de Ejemplo:
- Poesía "En Paz", de Amado Nervo (archivo TXT, texto_007_poesia_en_paz_amado_nervo.txt)
- "Información referente a casos COVID-19 en México" https://datos.gob.mx/busca/dataset/informacion-referente-a-casos-covid-19-en-mexico.
EJERCICIOS (Parte 1):
Hacer los siguiente programas en Python:
- Leer un archivo de texto e imprimirlo en pantalla.
- Leer un archivo en formato "csv" de datos de Covid19 en México.
- Leer una hoja de cálculo e imprimir su cantidad de filas y columnas.
Respuestas a los Ejercicios (Parte 1):
- Leer un archivo de texto externo que está en unicode (codigo python, python_datos_texto_abrir_unicode.py).
- Lee el archivo oficial de casos de Covid19 del Gobierno de México (codigo python, python_datos_csv_covid.py).
- Leer un archivo XLS e imprimir el número de filas, de columnas y el contenido (codigo python, python_excel_01_filas_columnas_contenido.py).
Sesión 3:
Formatos de Datos (Teórico/Práctico)
Archivos y Enlaces de Ejemplo:
- Factura del SAT en formato XML (archivo XML, texto_006_xml_factura.xml)
- Lista de "lenguajes" de programación en un archivo JSON (archivo JSON, texto_004_json_lenguajes.json)
- Página de ejemplo para extraer su información http://sagitario.itmorelia.edu.mx/~rogelio/hola.htm.
EJERCICIOS (Parte 2):
Hacer los siguiente programas en Python:
- Leer una factura e imprimir su información.
- Leer un archivo en formato "json" e imprimir su información.
- Leer una página Web e imprimir algunas de sus etiquetas.
Respuestas a los Ejercicios (Parte 2):
- Leer una factura en formato XML y extraer sus datos (codigo python, python_datos_xml_factura.py).
- Leer un archivo de texto externo en formato JSON y extraer sus datos (codigo python, python_datos_json_extraer.py).
- Lee la página de "xumarhu" y extrae los 3 títulos y fotos mas importantes (codigo python, python_data_science_leer_xumarhu_titulos_fotos.py).
TAREA 1: Dataset Covid
- Ir al sitio: https://datos.gob.mx/busca/dataset/informacion-referente-a-casos-covid-19-en-mexico
- Hacer click en "Descargar" para obtener el archivo CSV sobre casos de COVID en México.
- Del paso anterior se descargará el archivo "datos_abiertos_covid19.zip".
- Descomprimir el archivo anterior y obtendremos el archivo "COVID19MEXICO.csv" (163.8 MB, 8/agosto/2023)
- Los Metadatos del dataset anterior se pueden descargar de este enlace: https://datosabiertos.salud.gob.mx/gobmx/salud/datos_abiertos/diccionario_datos_covid19.zip
- Hacer un programa en Python que lea el CSV del Covid y realice los cálculos necesarios para contestar las siguientes preguntas, las cuales deberá imprimir el programa en pantalla:
- ¿Cuál es el promedio de Edad de todos los pacientes?
- ¿Cuál es la cantidad de Hombres y Mujeres?
- ¿Cuántos pacientes eran de Michoacán?
- ¿Cuántos pacientes eran de Morelia?
- ¿Cuántos pacientes eran "diabéticos" y tenían "hipertensión" al mismo tiempo?
- Subir el programa en Python a la plataforma GitHub Classroom (se les enviará al su correo electrónico institucional el enlace para accesar al repositorio GitHub especial para subir sus tareas del curso).
Estadística (Teórico/Práctica)
- Conceptos básicos de Estadística (presentación en PDF y PowerPoint).
Archivos y Enlaces de Ejemplo:
- Resultados del Examen de Admisión al ITM 2023 (archivo PDF, archivo_002_lista_de_aceptados_2023.pdf)
- I Love PDF https://www.ilovepdf.com/es.
EJERCICIOS (Parte 3):
Hacer los siguiente programas en Python:
- Leer un archvo externo e imprimir su datos estadísticos descriptivos.
Respuestas a los Ejercicios (Parte 3):
- Leer los resultados de admisión al ITM del área de Sistemas e imprime sus datos descriptivos (codigo python, python_estadistica_nuevo_ingreso.py).
TAREA 2: Lista de Aceptados
- Descargar el archivo "RESULTADOS DEL EXAMEN DE ADMISIÓN 2023", que se encuentra en el siguiente enlace: archivo_002_lista_de_aceptados_2023.pdf
- De la lista de alumnos aceptados que aparecen en el archivo anterior, se deberá seleccionar las listas de 2 carreras diferentes, las que ustedes decidan (están marcadas en color verde).
- Con las 2 carreras seleccionadas anteriormente, hacer un programa en Python que lea el archivo anterior y realice los cálculos necesarios para contestar las siguientes preguntas, las cuales deberán imprimirse en pantalla:
- ¿Cuál es el promedio mas alto? (imprimir los promedios de ambas carreras)
- ¿Cuál carrera tiene la mayor dispersión con respecto a la calificación obtenida? (imprimir ambas desviaciones estándar)
- ¿Cuál es es la calificación más alta y cuál la mas baja de cada carrera? (imprimir el nombre completo del alumno y su calificación obtenida)
- ¿Cuáles son las 5 calificaciones más altas contando ambas carreras? (imprimir el nombre completo del alumno, la carrera y su calificación obtenida)
- Subir el programa en Python a la plataforma GitHub Classroom (se les enviará a su correo electrónico institucional el enlace para accesar al repositorio GitHub especial para subir las tareas del curso).
- RECOMENDACIONES: Se puede extraer de manera manual los datos necesarios (copiar las listas verdes) y pegarlas a una hoja de Excel(XLS) ó a un editor de texto para crear un archivo nuevo (CVS), y hacer el procesamiento en este nuevo archivo por medio de Python, para evitar leer directamente el archivo PDF (el cual resulta mas complicado). En caso de crear un archivo nuevo, también hay que subirlo al GitHub Classroom.
Sesión 4:
Estadística (Teórico/Práctica)
- Ejemplo de una Regresión Lineal (presentación en PDF y PowerPoint).
EJERCICIOS (Parte 4):
Hacer los siguiente programas en Python:
- Hacer una gráfica de dispersión de edades y pesos que se obtienen de una lista.
Respuestas a los Ejercicios (Parte 4):
- Diagrama de dispersión de edades y pesos que se obtienen de una lista (código python, python_estadistica_diagrama_dispersion.py).
Probabilidad (Teórico/Práctica)
- Conceptos básicos de probabilidad (presentación en PDF y PowerPoint).
EJERCICIOS (Parte 5):
Hacer los siguiente programas en Python:
- Lanzar n veces una moneda
Respuestas a los Ejercicios (Parte 5):
- Lanzar una moneda 100,000 veces e imprimir el resultado (codigo python, python_probabilidad_ley_grandes_numeros.py.py).
Machine Learning
EJERCICIOS (Parte 6):
Hacer los siguiente programas en Python:
- Predecir temperaturas (Regresión Lineal).
Respuestas a los Ejercicios (Parte 6):
- Regresión Lineal: Predecir la temperatura promedio para el mes de julio del año 2023 en Nueva York (código python, python_data_science_predecir_temperatura.py).
Sesión 5:
EJERCICIOS (Parte 6):
Hacer los siguiente programas en Python:
- Predecir SI una persona es Diabética o NO es Diabética (SVM).
- Clasificar 10 puntos en 2 clases usando (K-Means).
- Dados 10 puntos etiquetados en 2 Clusters predice a qué categoría pertenece un nuevo punto (KNN)
Respuestas a los Ejercicios (Parte 6):
- Predice SI una persona es Diabética o NO es Diabética (codigo python, python_ml_diabetes.py).
- Clasifica 10 puntos en 2 clases usando K-Means (código python, python_ml_kmeans.py).
- Dados 10 puntos etiquetados en 2 Clusters predice a qué categoría pertenece un nuevo punto usando KNN (código python, python_ml_knn.py).
TAREA 3: Temperatura de Morelia
- Descargar el siguiente archivo que contiene las temperatura de Morelia desde el 2012 hasta la actualidad (agosto 2023):
- Hacer un programa en Python que lea el archivo anterior y realice los cálculos necesarios (utilizando todos los registros del archivo) para contestar las siguientes preguntas, las cuales deberán imprimirse en pantalla:
- Promedio de temperatura (con fecha y hora de esa temperatura).
- Temperatura Máxima (con fecha y hora de esa temperatura).
- Temperatura Mínima (con fecha y hora de esa temperatura).
- Filtre todos los datos para tener solamente temperaturas del mes de septiembre (de todos los años), y con esa información calcular e imprimir lo siguiente:
- Utilizando "Regresión Lineal", predecir la temperatura de Morelia para el mes de septiembre del 2023 (próximo mes).
- Subir el programa en Python a la plataforma GitHub Classroom (se les enviará a su correo electrónico institucional el enlace para accesar al repositorio GitHub especial para subir las tareas del curso).
Material Adicional Recomendado:
Trabajo Actual y Tendencias:
- Proyectos de IoT en el ITM - Cluster con Legos y Raspberrys (presentación en PDF y PowerPoint).
- Proyectos de Ciencia de Datos en el ITM (presentación en PDF y PowerPoint).
- Tendencias en Ciencia de Datos (presentación en PDF y PowerPoint).
- Aplicaciones Prácticas de Inteligencia Artificial (acetatos en PDF y PowerPoint).
Documentales Completos:
Documentales (Trailers):
Películas (Trailers):
Usted se encuentra Aquí >
Principal >
Cursos >
Ciencia de Datos > Bibliografía
Portal de Tecnología desarrollado por: Rogelio Ferreira Escutia