Header Ads Widget

Ticker

6/recent/ticker-posts

Python vs. Herramienta de raspado web para rastrear proyecciones de Fantasy Football

 Fantasy Football es un juego nerd. Al decir eso, no hay forma de que puedas ganar el campeonato sin estudiarlo. Así es como el web scraping resulta útil. En este tutorial, aprenderá a crear una herramienta de raspado web para realizar el trabajo.

Ahora puede recopilar datos valiosos automáticamente en una hoja de cálculo rápidamente. En lugar de buscar las estadísticas de varias fuentes copiando y pegando, esto es mucho más fácil y rápido.

¿Por qué Web Scraping?

Según el informe, los jugadores promedio dedicarán 3 horas a la semana a administrar sus equipos, y 9 horas adicionales leerán sobre tendencias. Alrededor del 30% de los jugadores gestionan sus equipos durante sus trabajos diarios.

Hay toneladas de información al alcance de su mano. Hacer una predicción precisa del rendimiento de los jugadores del equipo es difícil. ¿Cómo puedes elegir a los jugadores de segundo nivel y lograr un resultado de primer nivel? Necesitas rastrear las estadísticas del juego y encontrar valores ocultos.

¿Qué es Web Scraping?

El web scraping es la técnica para automatizar el proceso de extracción de datos de los sitios web. Tradicionalmente, necesitará un programador para realizar el script.

Por ahora, una herramienta de raspado web sustituye el trabajo de codificación. Scraping ya no es un privilegio del programador. Cualquiera puede extraer información valiosa de Internet y guardarla en el almacenamiento local o en la nube.

En este artículo, te explicaré cómo extraer puntos de proyección de fútbol de fantasía de sitios web deportivos como fantasypros.com con una herramienta de raspado web.

No es necesario documentar toda la página. Puede ser aún más creativo y obtener una ventaja al hacer una comparación lado a lado con los equipos del oponente para un análisis completo.

Luego lo comparamos con el script de Python. Así tendrás una idea de lo fácil que es para todos nosotros, especialmente para los jugadores de fútbol Fantasy, realizar un seguimiento de las estadísticas.

Descargo de responsabilidad : Soy nuevo en Fantasy Football. Este artículo no proporciona asesoramiento profesional sobre estrategias de borrador. En cambio, se trata de compartir conocimientos desde una perspectiva estadística.

Web Scraping con Octoparse

Requisito previo:

Octoparse, una herramienta de raspado web muy intuitiva. Me ayuda a superar muchos obstáculos en proyectos de análisis de datos. Es el mejor del mercado. Puedes descargarlo aquí.

Crea un proyecto:

Abra Octoparse y haga clic en el pequeño signo más para crear una nueva tarea con el modelo avanzado. Ingrese la URL y Octoparse abrirá la página web con el navegador incorporado. Podemos interactuar y extraer los datos haciendo clic en la página.

Primero , haz clic en el jugador de la primera fila. Tenga en cuenta que Octoparse analiza el sitio web en elementos individuales. Encontró elementos similares y los resaltó en rojo.

Esto es genial. Siga la sugerencia de acción y haga clic en "seleccionar todos los subelementos". Se ha seleccionado toda la fila. Octoparse luego le recordará que encontró filas similares que están listas para ser seleccionadas. Siga la guía, haga clic en "Seleccionar todo".

Observe que ahora todas las filas se seleccionan correctamente y se resaltan en verde.

A continuación, haga clic en "Extraer datos en el ciclo". ¡Felicidades! Completas un rastreador. Descarga el rastreador ]

 Por último, pero no menos importante , guarde la tarea y comience la extracción en sus opciones de tipos de extracción. Puede extraer localmente, en la nube o establecer un horario. En este caso, recomiendo encarecidamente establecer un horario. El rastreador raspará los sitios web de manera oportuna. Así que siempre estás actualizado.

Los datos extraídos se entregarán en forma de formatos estructurados, incluidos Excel, txt y JSON. Como necesitamos analizar los puntos, los exporto a Excel y se ve así.

Web Scraping con Python

Puedes leer el trabajo completo de Python aquí . Desglosé el proceso en unos pocos pasos:

  • Navegue hasta la página deseada y copie la URL para usarla más adelante.
  • Utilice las solicitudes de Python y los paquetes bs4 ( Beautiful Soup ) para obtener toda la página web en formato de sintaxis HTML.
1
2
3
4
5
import re
import requests
def get_html_data(url):
    response = requests.get(url)
    return BeautifulSoup(response.content, "html5lib")
  • Examine el código HTML detenidamente para encontrar dónde están los datos que desea extraer. En este caso, buscamos "TR" (fila de tabla)
  • Busque qué identificadores únicos como enlaces href, nombres de clases, filas de tablas y datos de tablas rodean los datos que desea.
  • Intente extraer diferentes campos de una sola fila de datos
  • Realice algunas iteraciones de prueba y error.
  • Regular los formatos de datos (a medida que extraemos datos sin procesar, es posible que los datos se vean raros con formatos extraños. Necesita limpiar los formatos de caracteres y hacerlos consistentes y legibles).

En conclusión

Las proyecciones deportivas de web scraping son rápidas y fáciles. Sin embargo, con una herramienta de raspado web, logras todo el proceso con simples clics. Pasé 1 hora leyendo la documentación de Beautiful Soup, experimentando cómo ubicar los campos precisos y escribiendo código Python.

Sin embargo, dediqué menos de 10 minutos a configurar la extracción con Octoparse. La mejor parte es que una vez que tienes el rastreador en la mano, puedes establecer un horario y permitirte automatizar las extracciones.

Para los jugadores, puede monitorear diferentes fuentes del sitio al mismo tiempo configurando rastreadores de extracción mucho más fácilmente:

  • Accuscore
  • CBS - Jamey Eisenberg
  • CBS - Dave Richard
  • CBS - Promedio
  • ESPN
  • FantasyPros
  • FantasySharks
  • FFhoday
  • Deportes FOX
  • com
  • Yahoo

Publicar un comentario

0 Comentarios