Aprende Python haciendo scraping con la web de Menéame
15 de febrero del 2019 / Almería
DESCRIPCIÓN
El objetivo de este taller es aprender a programar en Python haciendo web scraping (extracción de datos de páginas web). Para ello explicaremos unas nociones básicas de scraping y realizaremos varios ejercicios con la web de Menéame. Utilizaremos listas, ordenación, funciones, objetos, etc… y las librerías Requests para hacer peticiones y Beautiful Soup para parsear y extraer datos de documentos HTML. Todo ello dentro de un notebook Jupyter
El taller consistirá en:
- Preparar entorno con Jupyter y cargar notebook del taller
- Qué es el web scraping y cómo lo podemos hacer con Python
- Realizar ejercicios propuestos
¿Qué vas a necesitar?
Cada asistente necesitará un portátil con sistema GNU/Linux, Windows o Mac OS.
¿Qué tienes que instalar?
- Vagrant y Virtual Box
- La imagen de Vagrant que usaremos en el taller y que está disponible en GitHub
- Por favor, para evitar colapsar la red local del Workspace Coworking instala y arranca la imagen de vagrant en tu portátil previamente.
Conocimientos previos
- Programación y HTML
¿DE QUÉ HABLAREMOS?
De Python y web scraping (peticiones http, parseo y extracción de datos de documentos HTML).
PROGRAMA
17:30-18:00 | Ayuda a quien lo necesite para instalar vagrant y el notebook de Jupyter |
18:00-18:15 | Qué es el web scraping y qué herramientas usaremos en el taller |
18:15-20:30 | Resolución de ejercicios propuestos |
LOCALIZACIÓN
Lugar: Workspace Coworking, Plaza de la Administración 1, 1º Izquierda, Almería.
Fecha: 15 de febrero del 2019
Hora: de 17:30 a 20:30