El repositorio actual contiene la Práctica 1 (Web Scraping) de la asignatura Tipología y ciclo de vida de los datos del Máster en Ciencia de Datos de la UOC.
Los miembros del proyecto son Ferran Valverde Parera y Alejandro González Barberá.
El proyecto está construido con Python 3.7.11 con las siguiente librerías:
- Python: 3.7.11
- Request version: 2.27.1
- BeautifulSoup version: 4.11.1
- csv version: 1.0
- Pandas version: 1.3.5
- ./data/*: csv intermedios que contienen las estadísticas de las monedas en cada momento.
- ./dataset/CoinGecko.csv: contiene las 100 mejores monedas junto a algunos atributos tomados en el momento de ejecución.
- ./dataset/coins_dataset.csv: resultado del notebook Merge_csv.ipynb.
- ./source/Merge_csv.ipynb: notebook para juntar los csv del directorio data/ en uno.
- ./source/coins_dataset.csv: resultado del notebook Merge_csv.ipynb.
- ./source/web-scraping-full.ipynb: notebook que contiene la implementación del web scraping y del guardado de los csv.
- ./source/web-scraping-test.ipynb: notebook que contiene paso a paso la implmentación del anterior.
El dataset también se puede encontrar en el siguiente repositorio de Zenodo