Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/tensorflow/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Android 如何从网络视图中获取网页内容?_Android_Android Webview - Fatal编程技术网

Android 如何从网络视图中获取网页内容?

Android 如何从网络视图中获取网页内容?,android,android-webview,Android,Android Webview,在Android上,我有一个显示页面的WebView 如何在不再次请求页面的情况下获取页面源 似乎WebView应该有某种返回字符串的getPageSource()方法,但遗憾的是它没有 如果我启用JavaScript,那么在这个调用中放入什么合适的JavaScript来获取内容 webview.loadUrl("javascript:(function() { " + "document.getElementsByTagName('body')[0].style.color = '

在Android上,我有一个显示页面的
WebView

如何在不再次请求页面的情况下获取页面源

似乎
WebView
应该有某种返回字符串的
getPageSource()
方法,但遗憾的是它没有

如果我启用JavaScript,那么在这个调用中放入什么合适的JavaScript来获取内容

webview.loadUrl("javascript:(function() { " +  
    "document.getElementsByTagName('body')[0].style.color = 'red'; " +  
    "})()");  

我知道这是一个迟来的答案,但我发现这个问题,因为我有同样的问题。我想我在lexandera.com上找到了答案。下面的代码基本上是从站点剪切粘贴的。这似乎奏效了

final Context myApp = this;

/* An instance of this class will be registered as a JavaScript interface */
class MyJavaScriptInterface
{
    @JavascriptInterface
    @SuppressWarnings("unused")
    public void processHTML(String html)
    {
        // process the html as needed by the app
    }
}

final WebView browser = (WebView)findViewById(R.id.browser);
/* JavaScript must be enabled if you want it to work, obviously */
browser.getSettings().setJavaScriptEnabled(true);

/* Register a new JavaScript interface called HTMLOUT */
browser.addJavascriptInterface(new MyJavaScriptInterface(), "HTMLOUT");

/* WebViewClient must be set BEFORE calling loadUrl! */
browser.setWebViewClient(new WebViewClient() {
    @Override
    public void onPageFinished(WebView view, String url)
    {
        /* This call inject JavaScript into the page which just finished loading. */
        browser.loadUrl("javascript:window.HTMLOUT.processHTML('<head>'+document.getElementsByTagName('html')[0].innerHTML+'</head>');");
    }
});

/* load a web page */
browser.loadUrl("http://lexandera.com/files/jsexamples/gethtml.html");
final Context myApp=this;
/*此类的实例将注册为JavaScript接口*/
类MyJavaScriptInterface
{
@JavascriptInterface
@抑制警告(“未使用”)
公共空处理html(字符串html)
{
//根据应用程序的需要处理html
}
}
最终WebView浏览器=(WebView)findViewById(R.id.browser);
/*显然,如果您想让JavaScript正常工作,就必须启用它*/
browser.getSettings().setJavaScriptEnabled(true);
/*注册一个名为HTMLOUT的新JavaScript接口*/
addJavascriptInterface(新的MyJavaScriptInterface(),“HTMLOUT”);
/*在调用loadUrl之前必须设置WebViewClient*/
setWebViewClient(新的WebViewClient(){
@凌驾
公共void onPageFinished(WebView视图,字符串url)
{
/*这个调用将JavaScript注入到刚刚完成加载的页面中*/
browser.loadUrl(“javascript:window.HTMLOUT.processHTML(“”+document.getElementsByTagName('html')[0]。innerHTML+“”);”;
}
});
/*加载网页*/
browser.loadUrl(“http://lexandera.com/files/jsexamples/gethtml.html");
根据,布伦德尔的答案崩溃(至少在我的2.3虚拟机上)。相反,我截获了一个带有特殊前缀的对console.log的调用:

// intercept calls to console.log
web.setWebChromeClient(new WebChromeClient() {
    public boolean onConsoleMessage(ConsoleMessage cmsg)
    {
        // check secret prefix
        if (cmsg.message().startsWith("MAGIC"))
        {
            String msg = cmsg.message().substring(5); // strip off prefix

            /* process HTML */

            return true;
        }

        return false;
    }
});

// inject the JavaScript on page load
web.setWebViewClient(new WebViewClient() {
    public void onPageFinished(WebView view, String address)
    {
        // have the page spill its guts, with a secret prefix
        view.loadUrl("javascript:console.log('MAGIC'+document.getElementsByTagName('html')[0].innerHTML);");
    }
});

web.loadUrl("http://www.google.com");

这是基于,, 但我认为如下更改Javascript更好、更简单

browser.loadUrl("javascript:HTMLOUT.processHTML(document.documentElement.outerHTML);");

您是否考虑过单独获取HTML,然后将其加载到webview中

String fetchContent(WebView view, String url) throws IOException {
    HttpClient httpClient = new DefaultHttpClient();
    HttpGet get = new HttpGet(url);
    HttpResponse response = httpClient.execute(get);
    StatusLine statusLine = response.getStatusLine();
    int statusCode = statusLine.getStatusCode();
    HttpEntity entity = response.getEntity();
    String html = EntityUtils.toString(entity); // assume html for simplicity
    view.loadDataWithBaseURL(url, html, "text/html", "utf-8", url); // todo: get mime, charset from entity
    if (statusCode != 200) {
        // handle fail
    }
    return html;
}

我使用@jluckyiv的答案中的代码成功地实现了这一点,但我必须在MyJavaScriptInterface中的processHTML方法中添加@JavascriptInterface注释

class MyJavaScriptInterface
{
    @SuppressWarnings("unused")
    @JavascriptInterface
    public void processHTML(String html)
    {
        // process the html as needed by the app
    }
}

如果targetSdkVersion大于等于17,则还需要使用@JavascriptInterface注释该方法-因为SDK 17中有新的安全要求,即所有javascript方法都必须使用@JavascriptInterface注释。否则您将看到错误,如:Uncaught TypeError:Object[Object Object]在null:1处没有“processHTML”方法。如果您正在使用kitkat及以上版本,您可以使用chrome远程调试工具查找进出Web视图的所有请求和响应,以及所查看页面的html源代码


请注意,这可能不是页面的原始HTML;在执行
onPageFinished()
之前,页面内容可能已通过JavaScript动态更改。这很好,但在
onPageFinished
中调用方法
browser.loadUrl
将导致再次调用
onPageFinished
。在调用
browser.loadUrl
之前,您可能需要检查这是否是
onPageFinished
的第一次调用。谢谢@blondell它对我有效。我想知道如何将其作为服务实现。因为是一个没有布局和webview来存储结果的服务。有没有一种方法可以将数据放在与webView不同的其他对象中,这样我们就可以使用javascript来获取生成的html代码?@Totalys这更容易
String html=new Scanner(new DefaultHttpClient().execute(new HttpGet(“www.the url”)).getEntity().getContent(),“UTF-8”).usedimiter(“\\a”).next()(缩写为适合注释:-)不要忘记将runOnUiThread(new Runnable(){…插入到public void processHTML中。使用jquery脚本和js接口从webview window.interface.processHTML($(\“body\”).html()中获取html内容;您显然可以使用HTTP请求获得HTML响应,但如果某些页面需要加载post数据(例如用户凭据等),这种方法完全失败了。我认为这是应该的,因为如果你能做到的话,你可能会为任何网站制作自己的android应用程序,这会很糟糕!这不会带来cookies。这种方法会触发验证码对话框。问题将以编程方式访问。请你解释一下你的帖子是如何有用的?