es.phhsnews.com


es.phhsnews.com / Cómo extraer enlaces de cualquier página web con PowerShell

Cómo extraer enlaces de cualquier página web con PowerShell


PowerShell 3 tiene muchas funciones nuevas, incluidas algunas funciones nuevas y potentes relacionadas con la web. Simplificaron enormemente la automatización de la Web, y hoy vamos a mostrar cómo puede extraer cada enlace de una página web y, opcionalmente, descargar el recurso si lo desea.

Raspar la Web con PowerShell

Hay dos nuevos cmdlets que facilitan la automatización de la web, Invoke-WebRequest que facilita el análisis de contenido legible por humanos, e Invoke-RestMethod que hace que el contenido legible por máquina sea más fácil de leer. Como los enlaces son parte del HTML de una página, forman parte de las cosas legibles para los humanos. Todo lo que tienes que hacer para obtener una página web es usar Invoke-WebRequest y darle una URL.

Invoke-WebRequest -Uri '//phhsnews.com'

Si te desplazas hacia abajo verás que la respuesta ha sido una propiedad de enlaces, podemos usar la función de enumeración de miembros nuevos de PowerShell 3 para filtrarlos.

(Invoke-WebRequest -Uri '//phhsnews.com'). Enlaces

Como puede ver, obtiene mucho de enlaces hacia atrás, aquí es donde necesita usar su imaginación para encontrar algo único para filtrar los enlaces que está buscando. Supongamos que queremos una lista de todos los artículos en la página principal.

((Invoke-WebRequest -Uri '//phhsnews.com') .Links | Where-Object {$ _. Href -like "http * "} | Donde clase -eq" título "). Título

Otra gran cosa que puedes hacer con los nuevos cmdlets es automatizar las descargas diarias. Veamos cómo raspa automáticamente la imagen del día fuera del sitio web de Nat Geo, para ello combinaremos los nuevos cmdlets web con Start-BitsTransfer.

$ IOTD = ((Invoke-WebRequest -Uri ' // photography.nationalgeographic.com/photography/photo-of-the-day/').Links | Where innerHTML -like "* Descargar Wallpaper *"). href
Start-BitsTransfer-Source $ IOTD -Destination C: IOTD

Eso es todo lo que hay que hacer. ¿Tienes algunos buenos trucos propios? Háganos saber en los comentarios.


¿Qué es RSS y cómo puedo beneficiarme de su uso?

¿Qué es RSS y cómo puedo beneficiarme de su uso?

Si intenta mantenerse al día con las noticias y el contenido en múltiples sitios web, se enfrenta al interminable tarea de visitar esos sitios para buscar contenido nuevo. Siga leyendo para obtener información sobre RSS y cómo puede entregar el contenido directamente en su puerta digital. En muchos sentidos, el contenido en Internet está bellamente vinculado y accesible, pero a pesar de la interconectividad de todo esto, con frecuencia nos encontramos visitando este sitio, luego ese sitio, luego otro sitio, todo en un esfuerzo por buscar actualizaciones y obtener el contenido que queremos.

(how-to)

Cómo ver varias zonas horarias en el reloj de la bandeja del sistema en Windows 8.1

Cómo ver varias zonas horarias en el reloj de la bandeja del sistema en Windows 8.1

Outlook le permite agregar una segunda zona horaria a su calendario, pero dos zonas horarias, incluida su zona horaria local, es todo lo que puedes ver en Outlook. Sin embargo, hay una forma de evitar esta limitación. RELACIONADO: Cómo agregar una segunda zona horaria a su calendario en Outlook Si se reúne prácticamente con personas en más de dos zonas horarias, es posible que necesite más zonas horarias que Outlook puede proporcionar.

(how-to)