WebScraping Python + Inteligencia Artificial – UABC

Material disponible para el público general y asistentes del taller de Web Scraping Python + Inteligencia Artificial de UABC FCAyS (Abril, 2024)

El web scraping es una técnica utilizada para extraer información de páginas web de forma automática. En lugar de copiar y pegar datos manualmente, el web scraping permite a los usuarios recopilar grandes cantidades de datos de manera eficiente. En el documento adjunto encontraremos referencias a diversos aspectos introductorios sobre el web scraping, entre ellos los siguientes:

El Arte del Web Scraping
En este resumen ejecutivo del taller, exploramos el emocionante mundo del web scraping y su importancia en el acceso y extracción de datos valiosos de sitios web. A través del material y durante el evento, se identificaron varios puntos clave que resumen este fascinante campo:

Importancia del Web Scraping
El web scraping es una técnica esencial para obtener datos de la web de manera eficiente y efectiva. Permite a las empresas, investigadores y desarrolladores acceder a información valiosa para análisis, investigación, toma de decisiones y desarrollo de aplicaciones.

Herramientas Clave
Identificamos herramientas clave para el web scraping, como Python, Beautiful Soup, y APIs como la de Wikipedia. Estas herramientas ofrecen funcionalidades poderosas para realizar solicitudes web, analizar HTML y JSON, para así extraer datos estructurados de manera eficiente.

Ética y Buenas Prácticas
Subrayamos la importancia de practicar el web scraping de manera ética y respetuosa. Esto incluye cumplir con las políticas del sitio web objetivo, respetar los términos de servicio y la privacidad de los usuarios, y evitar sobrecargar los servidores con solicitudes excesivas.

Potencial y Aplicaciones
Destacamos el amplio potencial del web scraping en una variedad de aplicaciones, incluyendo análisis de mercado, investigación académica, desarrollo de productos, vigilancia competitiva y más. Con las herramientas y técnicas adecuadas, podemos desbloquear un tesoro de información valiosa en la web.

Introducción al web scraping con Python

WebScrapingPython

Las prácticas desarrolladas durante el taller se comparten a continuación (lamentablemente no se grabaron las explicaciones sobre el uso de ChatGPT para optimizar el armado de scripts de web scraping), se buscará facilitar algo similar a este segmento más adelante.

https://colab.research.google.com/drive/16sBJUm7cWgPO9zsPAOphPhkh-EtkFrca?usp=sharing

Por último siéntete libre de dejar tus comentarios o dudas en esta entrada. ¡Gracias por leer! ¡Recuerda compartir el conocimiento!

Foto al finalizar el evento: