Pregunta:
¿Puedo extraer direcciones de correo electrónico de una serie de sitios web sin similitudes? ¿Hay algo como los caracteres comodín que admite Octoparse?
Responder:
Es posible scrape el correo electrónico de diferentes sitios web, pero este puede no ser el caso, porque la XPath de la dirección de correo electrónico puede ser diferente.
Solo podemos scrape texto de correo electrónico con hipervínculos a otro dirección de correo electrónico, como este:
Si es posible, también puede usar el XPath a continuación:
//a[contains(@href,'mailto')]
De: http://www.octoparse.es/tutorial-7/extraer-email-de-una-serie-pagina-web
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.