Python Web刮片打印机EWS输出不正确_Python_Python 3.x_Web Scraping_Beautifulsoup_Embeddedwebserver

Python Web刮片打印机EWS输出不正确

python python-3.x web-scraping

Python Web刮片打印机EWS输出不正确,python,python-3.x,web-scraping,beautifulsoup,embeddedwebserver,Python,Python 3.x,Web Scraping,Beautifulsoup,Embeddedwebserver,我正试图刮我的打印机嵌入式网络服务器，以获得当前的打印计数，并将它们写入一个文件。我对这个很陌生，我试图打印整个html，看看到目前为止我是否正确地设置了脚本，并且输出是基本的。这是我的密码： from urllib.request import urlopen as uReq from bs4 import BeautifulSoup as soup myAddress = "http://10.0.0.199/#hId-UsageReportPage" uClient = uReq(myA

我正试图刮我的打印机嵌入式网络服务器，以获得当前的打印计数，并将它们写入一个文件。我对这个很陌生，我试图打印整个html，看看到目前为止我是否正确地设置了脚本，并且输出是基本的。这是我的密码：

from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup

myAddress = "http://10.0.0.199/#hId-UsageReportPage"
uClient = uReq(myAddress)
pageHTML = uClient.read()
uClient.close()

pageSoup = soup(pageHTML, "lxml")

print(pageSoup.prettify())

input()

这是我的输出：

<html>
 <body>
  <p>
   ‹     TQoÚ0~Ä¸ú©}p¼ª/SI6hÕMíŠVªn&amp;9ˆiˆ=û( iÿ}v%€ºõÉÎù»ï¾Üùsr2¸ï~¯  y        ÃÇÏ·_úÀ¸O}!£ü¸ÝÝÂyüÈªŒ„¸úÆ"`‘¹b¹\ÆË‹XÛ©}«@sò6[îê¤8§œõ¢$ÄÂ‚2ïE ÉIB`âøk¡^RÖ×aE|´6È k¾RF¸"’»Ò:¤ôqtÍ?25Ë¬2ä³6à™|‘M”ÄÄÊ9&gt;iû|?žA
y/j•w6K™¨Y—žu·‹gŽ½%nÇÔ  T¥ªž¡ðÅÓ£Âe½Ä™ódË”9Z—è
DÚc¯¢×9–v@Æ€ö]â:Q"š©EÉXçk?DUÿ¨
   <ef:>
Ç®Æ!W¦õ³ÂÍò^²Ð\½¼+ì†¢
.e5]ø¡s8¿ô:‡ ±¬*´o“6ÜÈ
ß(*÷*¼ÊÈJé\
×\ªºÎ‘HœÐA…?H´Ûk`›#kl3Ú±ªp£·›yV¢´G HN8‡xO:p~Üâ‰ÖôîËqrûíùŸ—…h|ã…óä‘šœú)ÀI
ËÉ™¯á?ãRg’”®b‹þ:dxwÑ`°³nÔrqRéí~Oc¥ùÌñ #¼_¦÷Õkyh*çmèŸ-‹¹¯        2ËÐ9 oðFsŠ0N„
Ü¦7ôtXÉq‰Ð"Ñþ@ÂØê¥ó}¤Bz».ŒÑ–\Ùpmº”ˆ–\±1¤h^×¿0…ÔáÔ
   </ef:>
  </p>
 </body>
</html>



èTQoÚ0~Ä¸úp¼ª/SI6hÕMíŠVªn&；9月9日的维维卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自自|kÖRÖX aE|6Èk¾RF¸™|‘M“ÄÄÊ9i||žA
y/j•w6K™¨Y-žu·ŽgŽ½%nžTže½196）™ódË“9Zè
DÚcèXè9–vÆÆèèèèk？DUÿ
俎俎俎俎俎俎俎俎俎俎俎俎俎俎俎俎俎俎俎
.e5]øs8:——“o”6Ü
ß（*÷*¼ÊÈJé\
×\xmlopen'HœÐA.？HÛk›kl3Úp·›yV、G HN8‡xO:p~220;îqrù376;-…H||…äïœI
ËÉ™āRgþbþnÔrqRíOcùùùùùùùùùùùùùùùùùùùùùùùùù24
Ü7ôtXÉqÐþØØØØØÙBz.ŒÙÙpm:ˆØØØÙØÙÙØÙÙØ

我不知道为什么会这样。我正在使用python 3.6.0和BeautifulSoup4。另外，我的打印机是HP Photosmart D110a（如果有帮助的话）

（更新）以下是HTML：

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
 "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html>
<head>
  <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
  <script type="text/javascript">
  frameWorkObj = {};
  frameWorkObj.pageMgrDataPathPrefix = "/webApps/Layout/";
  </script>

  <script src="/framework/framework.js" type="text/javascript"></script>

  <link href="/webApps/Layout/layout.css" rel="stylesheet" type="text/css" />

  <script src="/webApps/Layout/header.js" type="text/javascript"></script>
</head>

<body>
<iframe id="pgm-history-iframe" src="/framework/HistoryFrame.html" style="display: none;"></iframe>
<iframe src="/framework/cookie/cookie.html" style="display: none;"></iframe>

  <div id="pgm-language-div"></div>
  <div id="pgm-banner"></div>
  <div id="pgm-top-pane"></div>
  <div id="pgm-title-div"></div>

  <div class="pgm-container">
  <div id="pgm-left-pane"></div>

  <div class="outerContentPane">
  <div id="contentPane" class="contentPane"></div>
  </div>
  <div class="clear"></div>
  </div> <!-- .pgm-container -->

  <div id="pgm-footer"></div>
  <div id="pgm-page-ts-div"></div>

<script type="text/javascript">
// frame buster
if(top != self)
  top.location.replace(self.location.href);
</script>

<noscript>
<div id="pgm-no-js-text">
<p>JavaScript is required to access this website.</p>

<p>Please enable JavaScript or use a browser that supports JavaScript.</p>
</div>
</noscript>
</body>
</html>


frameworkbj={}；
frameworkabj.pageMgrDataPathPrefix=“/webApps/Layout/”；
//定格器
如果（顶部！=自身）
top.location.replace（self.location.href）；
访问此网站需要JavaScript
请启用JavaScript或使用支持JavaScript的浏览器

可能有unicode字符。你能分享原始的html吗？是的，我现在出去走走，但回家后我会添加html