从MATLAB web浏览器保存html页面

从MATLAB web浏览器保存html页面,matlab,save,Matlab,Save,接下来,我在检索到的页面上收到一条消息,“您的浏览器不支持JavaScript,因此可能缺少某些功能!” 如果我在MATLAB web浏览器中使用web(url)打开此页面并接受证书(每个会话一次),则页面将正确打开 如何使用脚本从浏览器保存页面源?还是从系统浏览器?或者有没有一种方法可以在没有浏览器的情况下获取该页面 url='https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525'; 据我所知,页面

接下来,我在检索到的页面上收到一条消息,“您的浏览器不支持JavaScript,因此可能缺少某些功能!

如果我在MATLAB web浏览器中使用
web(url)
打开此页面并接受证书(每个会话一次),则页面将正确打开

如何使用脚本从浏览器保存页面源?还是从系统浏览器?或者有没有一种方法可以在没有浏览器的情况下获取该页面

url='https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525';

据我所知,页面源代码下载得很好,只要确保在本地打开保存的页面时让Javascript运行即可

[...]
<script type='text/javascript' src='../js/hgTracks.js'></script>
<noscript><b>Your browser does not support JavaScript so some functionality may be missing!</b></noscript>
[...]

如果您使用的是Windows计算机,则始终可以从GnuWin32项目或其中一个项目获取wget。

保存cookie是否足以解决您的问题?wget可以通过--保留会话cookies和--保存cookies文件名来实现这一点;然后使用--load cookies filename在后续请求中恢复cookies。类似于以下内容(注意,我没有从Matlab对此进行测试,因此引用等可能并不完全正确,但我确实在其他上下文中使用了类似的shell结构):


如果您没有任何post数据,但后续get会更新cookies,您只需在后续get请求中使用keep和save即可。

问题是我需要选择一些其他曲目。然后保存这些设置。浏览器的缓存或cookie,或会话(传递了某些会话id),不确定。我可以用浏览器设置它。但是我怎样才能做到一页接一页呢?我不确定我是否理解这个问题。。您是否正在尝试传递POST数据并使用Cookie/会话Cookie?如果是这样的话,请查看手册:感谢您花时间回答这个老问题。现在我几乎记不起来了,我确实解决了这个问题。不管怎样,说得对。
url = 'https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525';
command = ['wget --no-check-certificate --page-requisites ' url];
system( command );
command_init = ['wget --no-check-certificate \
                      --page-requisites \
                      --keep-session-cookies \
                      --save-cookies cookie_file.txt \
                      --post-data \'user=X&pass=Y&whatever=TRUE\'' \
                      init_url];
command_get  = ['wget --no-check-certificate \
                      --page-requisites \
                      --load-cookies cookie_file.txt' \
                      url];