Rapto místico o cómo descargar PDFs desde google

Quizá como se acerca fin de año y comenzamos a preguntarnos sobre nuestro futuro fue que tuve un rapto místico y comencé a indagar en textos esotéricos. Y como siempre quise sentirme parte de algo grande y secreto fue que termine dando con el sitio de la Order of the Golden Dawn.

Mi rapto místico disminuyó sensiblemente cuando me percaté que tenía que pagar o registrarme en el sitio para acceder a sus textos. Mi pereza era mucha pero mi curiosidad también, entonces opté por indagar con mi amigo google que pdf tenía el sitio web de la orden y descargar esos textos usando un script en python. Acá el script y los resultados.

# -*- coding: utf-8 -*-
import re
import requests
from BeautifulSoup import BeautifulSoup
import os

d=0
i=0


links=""
while i<60:
        r=requests.get('https://www.google.com/xhtml?q=site%3Awww.golden-dawn.com%2Feu%2FUserFiles%2Fen%2Ffile%2F+filetype%3Apdf&start='+str(i)+'&gws_rd=gws_rd&filter=0&biw=1440&bih=803')
        data=r.text
        soup = BeautifulSoup(data)
        for link in soup.findAll('a', attrs={'href': re.compile("https")}):
                links+=link.get('href')
        i=i+10

patron=re.compile('https:\/\/www\.golden-dawn\.com\/eu\/UserFiles\/en\/file\/pdf\/\w+.pdf')
matcher=re.findall(patron,links)

lista_nueva = []
for i in matcher:
        if i not in lista_nueva:
                lista_nueva.append(i)


for z in lista_nueva:
        os.system("wget "+z+" --user-agent='Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0' -O "+str(d)+'.pdf')
        d=d+1

No sé qué tantos secretos guardará la Golden Dawn pero mi vudú informático me permitió acercarme a algunos de esos textos.

Al terminar la descarga de una veintena de textos me di cuenta que nunca voy a leer ese material porque mi rapto místico había desaparecido.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *