Intuitivo potente visual Web Scraper. WebHarvy puede raspar automáticamente texto, imágenes, URL y correos electrónicos de sitios web y guardar el contenido eliminado en varios formatos.
- Increíblemente fácil de usar, comience a raspar en cuestión de minutos
- Extraer datos de varias páginas / categorías / palabras clave
- Guardar datos extraídos en un archivo o base de datos
- Programador incorporado y soporte de proxy
Apuntar y hacer clic en interfaz
WebHarvy es un raspador web visual. No hay absolutamente ninguna necesidad de escribir ningún script o código para raspar datos. Utilizará el navegador incorporado de WebHarvys para navegar por las páginas web. Puede seleccionar los datos que se van a raspar con clics del mouse. ¡Así de fácil!
Raspar patrones de datos Detección automática de patrones
WebHarvy identifica automáticamente los patrones de datos que ocurren en las páginas web. Entonces, si necesita raspar una lista de elementos (nombre, dirección, correo electrónico, precio, etc.) desde una página web, no necesita realizar ninguna configuración adicional. Si los datos se repiten, WebHarvy lo raspará automáticamente.
Exportar datos recortados Exportar datos a archivo / base de datos
Puede guardar los datos extraídos de las páginas web en una variedad de formatos. La versión actual de WebHarvy Web Scraper le permite exportar los datos recortados como un archivo XML, CSV, JSON o TSV. También puede exportar los datos raspados a una base de datos SQL.
Raspe los datos de varias páginas Raspe de varias páginas
A menudo, las páginas web muestran datos tales como listados de productos en varias páginas. WebHarvy puede rastrear y extraer automáticamente datos de varias páginas. Simplemente señale el enlace a la página siguiente y WebHarvy Web Scraper raspará automáticamente los datos de todas las páginas.
Palabra clave basada en raspado Palabra clave basada en raspado
Raspe los datos al enviar automáticamente una lista de palabras clave de entrada a los formularios de búsqueda. Se puede enviar cualquier cantidad de palabras clave de entrada a múltiples campos de texto de entrada para realizar búsquedas. Se pueden extraer los datos de los resultados de búsqueda para todas las combinaciones de palabras clave de entrada.
Raspar a través del servidor proxy Servidores Proxy / VPN
Para raspar de forma anónima y evitar que los servidores web bloqueen el software de raspado web, tiene la opción de acceder a los sitios web objetivo a través de servidores proxy o VPN. Se puede usar una sola dirección de servidor proxy o una lista de direcciones de servidor proxy.
Categoría Raspado Categoría Raspado
WebHarvy Web Scraper le permite raspar datos de una lista de enlaces que conduce a páginas / listados similares dentro de un sitio web. Esto le permite raspar categorías y subcategorías dentro de sitios web usando una sola configuración.
Expresiones regulares
WebHarvy le permite aplicar expresiones regulares (RegEx) en fuentes de texto o HTML de páginas web y raspar la parte correspondiente. Esta poderosa técnica te ofrece más flexibilidad al raspar datos.
Ejecutar javascript
Ejecute su propio código de JavaScript en el navegador antes de extraer datos. Esto se puede usar para interactuar con elementos de página o invocar funciones de JavaScript ya implementadas en la página de destino.
Descargar imágenes
Las imágenes se pueden descargar o se pueden extraer URL de imágenes. WebHarvy puede extraer automáticamente múltiples imágenes que se muestran en las páginas de detalles del producto de los sitios web de comercio electrónico.
Automatiza la interacción del navegador
WebHarvy se puede configurar fácilmente para realizar tareas como Hacer clic en Enlaces, Seleccionar Opciones de lista / desplegable, Ingresar texto en un campo, Página de desplazamiento, etc.
Requiere Windows
WebHarvy requiere que se ejecute el sistema operativo Windows. Si desea ejecutar WebHarvy en su Mac, debe instalar Windows a través de BootCamp o ejecutar WebHarvy a través de Parallels. OS X / macOS actualmente no es compatible.
Notas de lanzamiento:
Cambios menores
- Para raspar datos de sitios que requieren inicio de sesión, los pasos se han simplificado. Ya no es necesario que inicie sesión en el sitio web por separado de IE.
- Se ha eliminado la opción del menú Opciones de Internet en el menú Editar. En su lugar, se ha agregado una nueva pestaña de opciones del navegador en la ventana Configuración.
- Ejecutar archivos de configuración creados con la versión anterior que se basó en IE en esta nueva versión basada en Chrome
- Los archivos de configuración creados con la versión anterior normalmente deberían funcionar correctamente con la nueva versión, que está basada en Chrome, pero habrá excepciones. En tales casos, le recomendamos que cree una nueva configuración con la última versión.
- Código:
-
https://uploadgig.com/file/download/b881e0eF4de1C507/WebHarvy.5.0.1.148.rar
https://rapidgator.net/file/021c7d7bb9f4c98711ca9af511014154/WebHarvy.5.0.1.148.rar.html