Javascript 如何获取具有所有属性的网页正文
我想从网页中提取动态内容,与网页中的内容完全相同,而不是纯文本。 我使用下面的块,给纯文本,但我需要像attributed文本Javascript 如何获取具有所有属性的网页正文,javascript,html,Javascript,Html,我想从网页中提取动态内容,与网页中的内容完全相同,而不是纯文本。 我使用下面的块,给纯文本,但我需要像attributed文本 function getDocumentTranslatedText() { return document.body.innerText; } 任何建议都会更有帮助。用于获取HTML字符串,而不是从中获取的纯文本字符串 如果您也需要标记,请使用而不是innerText,如果您试图获得RTF,那么您就不走运了。它是纯文本或HTML。@Archer我在找
function getDocumentTranslatedText() {
return document.body.innerText;
}
任何建议都会更有帮助。用于获取HTML字符串,而不是从中获取的纯文本字符串
如果您也需要标记,请使用而不是
innerText
,如果您试图获得RTF,那么您就不走运了。它是纯文本或HTML。@Archer我在找RTF。那么你就有答案了。您需要软件将HTML转换为RTF。您没有在浏览器中执行此操作。
return document.body.innerHTML;