Python Web刮片打印机EWS输出不正确
我正试图刮我的打印机嵌入式网络服务器,以获得当前的打印计数,并将它们写入一个文件。我对这个很陌生,我试图打印整个html,看看到目前为止我是否正确地设置了脚本,并且输出是基本的。这是我的密码:Python Web刮片打印机EWS输出不正确,python,python-3.x,web-scraping,beautifulsoup,embeddedwebserver,Python,Python 3.x,Web Scraping,Beautifulsoup,Embeddedwebserver,我正试图刮我的打印机嵌入式网络服务器,以获得当前的打印计数,并将它们写入一个文件。我对这个很陌生,我试图打印整个html,看看到目前为止我是否正确地设置了脚本,并且输出是基本的。这是我的密码: from urllib.request import urlopen as uReq from bs4 import BeautifulSoup as soup myAddress = "http://10.0.0.199/#hId-UsageReportPage" uClient = uReq(myA
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
myAddress = "http://10.0.0.199/#hId-UsageReportPage"
uClient = uReq(myAddress)
pageHTML = uClient.read()
uClient.close()
pageSoup = soup(pageHTML, "lxml")
print(pageSoup.prettify())
input()
这是我的输出:
<html>
<body>
<p>
‹ TQoÚ0~ĸú©}p¼ª/SI6hÕMíŠVªn&9ˆiˆ=û( iÿ}v%€ºõÉÎù»ï¾Üùsr2¸ï~¯ y ÃÇÏ·_úÀ¸O}!£ü¸ÝÝÂyüȪŒ„¸úÆ"`‘¹b¹\ÆË‹XÛ©}«@sò6[îê¤8§œõ¢$Ä‚2ïE ÉIB`âøk¡^RÖ×aE|´6È k¾RF¸"’»Ò:¤ôqtÍ?25ˬ2ä³6à™|‘M”ÄÄÊ9>iû|?žA
y/j•w6K™¨Y—žu·‹gŽ½%nÇÔ T¥ªž¡ðÅÓ£Âe½Ä™ódË”9Z—è
DÚc¯¢×9–v@Æ€ö]â:Q"š©EÉXçk?DUÿ¨
<ef:>
Ç®Æ!W¦õ³ÂÍò^²Ð\½¼+솢
.e5]ø¡s8¿ô:‡ ±¬*´o“6ÜÈ
ß(*÷*¼ÊÈJé\
×\ªºÎ‘HœÐA…?H´Ûk`›#kl3Ú±ªp£·›yV¢´G HN8‡xO:p~Üâ‰ÖôîËqrûíùŸ—…h|ã…óä‘šœú)ÀI
ËÉ™¯á?ãRg’”®b‹þ:dxwÑ`°³nÔrqRéí~Oc¥ùÌñ #¼_¦÷Õkyh*çmèŸ-‹¹¯ 2ËÐ9 oðFsŠ0N„
ܦ7ôtXÉq‰Ð"Ñþ@ÂØê¥ó}¤Bz».ŒÑ–\Ùpmº”ˆ–\±1¤h^׿0…ÔáÔ
</ef:>
</p>
</body>
</html>
èTQoÚ0~ĸúp¼ª/SI6hÕMíŠVªn&;9月9日的维维卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自|kÖRÖX aE|6Èk¾RF¸™|‘M“ÄÄÊ9i||žA
y/j•w6K™¨Y-žu·ŽgŽ½%nžTže½196)™ódË“9Zè
DÚcèXè9–vÆÆèèèèk?DUÿ
俎俎俎俎俎俎俎俎俎俎俎俎俎俎俎俎俎俎俎
.e5]øs8:——“o”6Ü
ß(*÷*¼ÊÈJé\
×\xmlopen'HœÐA.?HÛk›kl3Úp·›yV、G HN8‡xO:p~220;îqrù376;-…H||…äïœI
ËÉ™āRgþbþnÔrqRíOcùùùùùùùùùùùùùùùùùùùùùùùùù24
Ü7ôtXÉqÐþØØØØØÙBz.ŒÙÙpm:ˆØØØÙØÙÙØÙÙØ
我不知道为什么会这样。
我正在使用python 3.6.0和BeautifulSoup4。
另外,我的打印机是HP Photosmart D110a(如果有帮助的话)
(更新)
以下是HTML:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<script type="text/javascript">
frameWorkObj = {};
frameWorkObj.pageMgrDataPathPrefix = "/webApps/Layout/";
</script>
<script src="/framework/framework.js" type="text/javascript"></script>
<link href="/webApps/Layout/layout.css" rel="stylesheet" type="text/css" />
<script src="/webApps/Layout/header.js" type="text/javascript"></script>
</head>
<body>
<iframe id="pgm-history-iframe" src="/framework/HistoryFrame.html" style="display: none;"></iframe>
<iframe src="/framework/cookie/cookie.html" style="display: none;"></iframe>
<div id="pgm-language-div"></div>
<div id="pgm-banner"></div>
<div id="pgm-top-pane"></div>
<div id="pgm-title-div"></div>
<div class="pgm-container">
<div id="pgm-left-pane"></div>
<div class="outerContentPane">
<div id="contentPane" class="contentPane"></div>
</div>
<div class="clear"></div>
</div> <!-- .pgm-container -->
<div id="pgm-footer"></div>
<div id="pgm-page-ts-div"></div>
<script type="text/javascript">
// frame buster
if(top != self)
top.location.replace(self.location.href);
</script>
<noscript>
<div id="pgm-no-js-text">
<p>JavaScript is required to access this website.</p>
<p>Please enable JavaScript or use a browser that supports JavaScript.</p>
</div>
</noscript>
</body>
</html>
frameworkbj={};
frameworkabj.pageMgrDataPathPrefix=“/webApps/Layout/”;
//定格器
如果(顶部!=自身)
top.location.replace(self.location.href);
访问此网站需要JavaScript
请启用JavaScript或使用支持JavaScript的浏览器
可能有unicode字符。你能分享原始的html吗?是的,我现在出去走走,但回家后我会添加html