DEV Community

Cover image for 4 Formas de Extraer Datos del Sitio Web a Excel
Octoparse Español
Octoparse Español

Posted on

4 Formas de Extraer Datos del Sitio Web a Excel

Probablemente sepas cómo usar funciones básicas en Excel. Es fácil hacer cosas como ordenar, aplicar filtros, hacer gráficos y delinear datos con Excel. Incluso puedes realizar análisis de datos avanzados utilizando modelos de pivote y regresión. Se convierte en un trabajo fácil cuando los datos en vivo se convierten en un formato estructurado.

El problema es, ¿Cómo podemos extraer datos y ponerlos en Excel? Esto puede ser tedioso si lo haces manualmente escribiendo, buscando, copiando y pegando repetidamente. En cambio, puedes lograr la extracciñon automática de datos de la web para sobresalir.

En este artículo, te presentaré varias formas de ahorrar tiempo y energía, scrapear datos web en Excel.

Descargo de responsabilidad: Hay muchas otras formas de scrapear datos desde una web utilizando lenguajes de programación como PHP, Python, Perl, Ruby, etc. Aquí solo hablamos sobre cómo obtener datos de una web en Excel para no codificadores.

Tabla de contenidos

Obtener datos web utilizando Excel Web Queries

Obtener datos de la web usando Excel VBA

Utilizar herramientas de web scraping automatizadas

Subcontratar tu proyecto de web scraping

Obtener datos web utilizando Excel Web Queries
Excepto para transformar manualmente los datos de una página web copiando y pegando, Excel Web Queries se utiliza para recuperar rápidamente datos de páginas web estándar en hojas de cálculo de Excel. Puede detectar automáticamente tablas incrustadas en el HTML de la página web. Excel Web queries también se pueden usar en situaciones en las que es difícil crear o mantener una conexión estándar ODBC (Open Database Connectivity). Puede scrapear directamente una tabla desde cualquier sitio web utilizando Excel Web Queries.

El proceso se reduce a varios pasos simples (consulta este artículo):

  1. Ir a Datos> Obtener datos externos> Dar la web

  2. Aparecerá una ventana del navegador llamada "New Web Query"

  3. Escribir la dirección web en la barra de direcciones.
    Alt Text

  4. Se cargará y mostrará iconos amarillos contra datos/tablas en la página.

  5. Seleccionar uno apropiado

  6. Presionar el botón Importar.

Ahora has scrapeado los datos de la web en una hoja de cálculo de Excel, perfecta permutación en filas y columnas como desees.
Alt Text

Obtener datos de la web usando Excel VBA
La mayoría de nosotros usaría fórmulas en Excel (p. Ej. = Avg (...), = sum (...), = if (...), etc.) mucho, pero menos familiarizado con el lenguaje incorporado: Visual BasicVisual Basic for Application a.k.a VBA. Se conoce comúnmente como "Macros" y dichos archivos de Excel se guardan como a **.xlsm.

Antes de usarlo,

Primero debes habilitar la pestaña la pestaña Desarrollador en la barra (hacer clic con el botón derecho en Archivo -> Personalizar barra -> verificar la pestaña Desarrollador),

Luego configura tu diseño. En esta interfaz de desarrollador, puedes escribir código VBA adjunto a varios eventos. Haz clic AQUÍ (https://msdn.microsoft.com/en-us/library/office/ee814737(v=office.14).aspx) para comenzar a utilizar VBA en Excel 2010.
Alt Text
Usar Excel VBA va a ser un poco técnico, esto no es muy amigable para quienes no son programadores entre nosotros. VBA funciona ejecutando macros, procedimientos paso a paso escritos en Excel Visual Basic. Para scrapear datos de sitios web a Excel usando VBA, necesitamos construir u obtener un script VBA para enviar alguna solicitud a las páginas web y obtener datos devueltos de estas páginas web. Es común usar VBA con XMLHTTP y expresiones regulares para analizar las páginas web. Para Windows, puedes usar VBA con WinHTTP o InternetExplorer para scrapear datos de sitios web a Excel.

Con un poco de paciencia y práctica, te convendría aprender algo de código Excel VBA y algo de conocimiento HTML para que tu Web scraping en Excel sea mucho más fácil y eficiente para automatizar el trabajo repetitivo. Hay una gran cantidad de material y foros para que aprendas a escribir código VBA.

Utilizar herramientas de web scraping automatizadas
Para alguien que está buscando una herramienta rápida para scrapear datos de las páginas a Excel y no quiere configurar el código VBA tú mismo, te recomiendo encarecidamente herramientas de web scraping automatizadas como Octoparse para scrapear datos para tu hoja de cálculo de Excel directamente o mediante API.

No hay necesidad de aprender a programar. Puedes elegir uno de esos programas gratuitos de web scraping de la lista y comenzar a extraer datos de sitios web de inmediato y exportarlos a Excel. Las diferentes herramientas de web scraping tienen sus ventajas y desventajas, y puedes elegir la perfecta para tus necesidades.

Echa un vistazo a esta publicación y prueba estas TOP 30 herramientas gratuitas de web scraping.

Subcontratar tu proyecto de web scraping
Si el tiempo es tu activo más valioso y deseas enfocarte en tus negocios principales, la mejor opción sería subcontratar un trabajo tan complicado de scrapear de contenido web a un equipo competente de scrapear de contenido web que tenga experiencia y conocimientos.

Es difícil scapear datos de sitios web debido al hecho de que la presencia de bots anti-scrape restringirá la práctica del web scraping. Un equipo competente de web scraping te ayudaría a obtener datos de los sitios web de manera adecuada y a entregarte datos estructurados en una hoja de Excel o en cualquier formato que necesites.

Octoparse proporciona todo lo que necesitas para la extracción automática de datos. Puedes scrapear los datos web rápidamente sin codificar y convierte las páginas web en datos estructurados con clics, o simplemente relájate y déjanos el trabajo a nosotros, ofrecemos servico de datos que nuestro equipo de datos se reunirá contigo para analizar el rastreo web y los requisitos de procesamiento de datos.

Top comments (0)