使用wget获取使用JavaScript链接到的视频

使用wget获取使用JavaScript链接到的视频,javascript,wget,Javascript,Wget,我住在一个农村地区,有一个非常不稳定的无线ISP,所以流媒体内容,特别是数小时的视频教程是一个痛苦的过程。我希望能够在睡觉的时候把视频拿出来,第二天再看。因此,我尝试使用wget从links.txt获取文件,将它们存储在本地,然后简单地使用cron作业为我安排时间。不幸的是,出现了一个小问题: wget --save-cookies cookies.txt --post-data 'username=user&password=pwd' \ -erobots=off --secure-

我住在一个农村地区,有一个非常不稳定的无线ISP,所以流媒体内容,特别是数小时的视频教程是一个痛苦的过程。我希望能够在睡觉的时候把视频拿出来,第二天再看。因此,我尝试使用wget从links.txt获取文件,将它们存储在本地,然后简单地使用cron作业为我安排时间。不幸的是,出现了一个小问题:

wget --save-cookies cookies.txt --post-data 'username=user&password=pwd' \ 
-erobots=off --secure-protocol=SSLv3 --no-check-certificate \
https://www.domain.com/login.aspx

wget --load-cookies cookies.txt --content-disposition 
--user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) \
Gecko/2008092416 Firefox/3.0.3" -l1 -H -t1 -nd -N -np -r -A.mp4 \
-erobots=off -w5 -i ../links.txt 
第一个命令成功获取网站cookie信息并将其记录在相应的cookies.txt中。后者使我能够成功登录网站并开始获取内容;但是,它只是检索page.html,然后根据预期的-ra.mp4标志将其丢弃。不幸的是,它没有解析page.html中的动态链接以获取我需要的RandomGeneratedFilename.mp4内容。有什么我遗漏的吗

即使在我让它获取page.html文件时,该链接在href=a/dynamic/path中也没有文件名/扩展名,因此它无法保存.mp4也是有道理的。但是,如何让wget递归地跟随href来确定适当的文件名并保存它呢

谢天谢地,StackOverflow和Google已经让我了解到目前为止要通过的正确标志以及如何成功进行身份验证,但我还没有弄清楚最后一步。我猜我将不得不编写一个bash脚本,并使用awk和sed的组合来实现这一点,但我真的不确定

目前我正在使用一个浏览器插件来实现这一点,这是一个非常手动的过程。我不妨将视频流式传输并通过网站观看,如上所述,这在我的情况下并不太实际


我真的很感激你们所有人可能提供的任何时间和见解,因为这将是一个巨大的恩惠!提前感谢。

好吧,在使用检查和查看源代码之后,很明显他们混淆链接是有原因的;因此,我做了尽职调查并阅读了TOS。做我想做的事违反了TOS,所以我现在就放弃这个问题。他们正在为CDN及其资源付费,所以他们不希望它被滥用,尽管这不是我的本意。尽管如此,这是违法的,所以这是沉默点。我仍然有兴趣找出如何为其他网站做到这一点,但我会等到找到一个网站,不禁止它之前,再深入挖掘。