es.phhsnews.com


es.phhsnews.com / Cómo extraer enlaces de cualquier página web con PowerShell

Cómo extraer enlaces de cualquier página web con PowerShell


PowerShell 3 tiene muchas funciones nuevas, incluidas algunas funciones nuevas y potentes relacionadas con la web. Simplificaron enormemente la automatización de la Web, y hoy vamos a mostrar cómo puede extraer cada enlace de una página web y, opcionalmente, descargar el recurso si lo desea.

Raspar la Web con PowerShell

Hay dos nuevos cmdlets que facilitan la automatización de la web, Invoke-WebRequest que facilita el análisis de contenido legible por humanos, e Invoke-RestMethod que hace que el contenido legible por máquina sea más fácil de leer. Como los enlaces son parte del HTML de una página, forman parte de las cosas legibles para los humanos. Todo lo que tienes que hacer para obtener una página web es usar Invoke-WebRequest y darle una URL.

Invoke-WebRequest -Uri '//phhsnews.com'

Si te desplazas hacia abajo verás que la respuesta ha sido una propiedad de enlaces, podemos usar la función de enumeración de miembros nuevos de PowerShell 3 para filtrarlos.

(Invoke-WebRequest -Uri '//phhsnews.com'). Enlaces

Como puede ver, obtiene mucho de enlaces hacia atrás, aquí es donde necesita usar su imaginación para encontrar algo único para filtrar los enlaces que está buscando. Supongamos que queremos una lista de todos los artículos en la página principal.

((Invoke-WebRequest -Uri '//phhsnews.com') .Links | Where-Object {$ _. Href -like "http * "} | Donde clase -eq" título "). Título

Otra gran cosa que puedes hacer con los nuevos cmdlets es automatizar las descargas diarias. Veamos cómo raspa automáticamente la imagen del día fuera del sitio web de Nat Geo, para ello combinaremos los nuevos cmdlets web con Start-BitsTransfer.

$ IOTD = ((Invoke-WebRequest -Uri ' // photography.nationalgeographic.com/photography/photo-of-the-day/').Links | Where innerHTML -like "* Descargar Wallpaper *"). href
Start-BitsTransfer-Source $ IOTD -Destination C: IOTD

Eso es todo lo que hay que hacer. ¿Tienes algunos buenos trucos propios? Háganos saber en los comentarios.


OTT explica: por qué los ISP asignan direcciones IP dinámicas vs estáticas

OTT explica: por qué los ISP asignan direcciones IP dinámicas vs estáticas

Si alguna vez ha buscado encontrar su dirección IP pública, puede haber notado que cambia cada cierto tiempo. Esto se llama una dirección IP dinámica porque puede cambiar en un momento dado. La mayoría de los ISP asignarán direcciones IP dinámicas a sus clientes consumidores por una variedad de razones. Si de

(How-to)

¿Cómo se desactiva permanentemente el panel táctil en un portátil?

¿Cómo se desactiva permanentemente el panel táctil en un portátil?

Un panel táctil puede ser extremadamente útil para la mayoría de las personas, pero hay veces en que es poco más que una irritación, ¿cómo se puede hacer? ¿Deshabilita permanentemente un touchpad si no lo quiere o no lo necesita? La publicación de preguntas y respuestas SuperUser de hoy tiene las respuestas para ayudar a un lector frustrado.

(how-to)