使用gdata python客户端下载Google站点页面内容提要_Python_Google Data Api_Google Sites_Gdata Python Client

使用gdata python客户端下载Google站点页面内容提要

python

使用gdata python客户端下载Google站点页面内容提要,python,google-data-api,google-sites,gdata-python-client,Python,Google Data Api,Google Sites,Gdata Python Client,我的最终目标是从谷歌网站页面导入一些数据。我正在尝试使用gdata python客户端（v2.0.17）下载特定的内容提要： self.client = gdata.sites.client.SitesClient(source=SOURCE_APP_NAME) self.client.client_login(USERNAME, PASSWORD, source=SOURCE_APP_NAME, service=self.client.auth_service) self.clie

我的最终目标是从谷歌网站页面导入一些数据。我正在尝试使用gdata python客户端（v2.0.17）下载特定的内容提要：

self.client = gdata.sites.client.SitesClient(source=SOURCE_APP_NAME)
self.client.client_login(USERNAME, PASSWORD, source=SOURCE_APP_NAME, service=self.client.auth_service)     
self.client.site = SITE
self.client.domain = DOMAIN

uri = '%s?path=%s' % (self.client.MakeContentFeedUri(), '[PAGE PATH]')
feed = self.client.GetContentFeed(uri=uri)
entry = feed.entry[0]
...

Resulted entry.content具有xhtml格式的页面内容。但此树不包含页面中的任何计划文本数据。仅html页面结构和链接

例如，我的测试页面

 <div>Some text</div>

一些文本

ContentFeed条目只有text=None的div节点

我已经调试了gdata python客户端请求/响应，并检查了原始缓冲区中来自服务器的解析数据——内容中的任何计划文本数据。因此，这是一个谷歌API错误

可能有一些解决办法吗？我可以使用一些常用的请求参数吗？这里出了什么问题？

这段代码适用于我的Google应用程序域和gdata 2.0.17：

import atom.data
import gdata.sites.client
import gdata.sites.data

client = gdata.sites.client.SitesClient(source='yourCo-yourAppName-v1', site='examplesite', domain='example.com')
client.ClientLogin('admin@example.com', 'examplepassword', client.source);

uri = '%s?path=%s' % (client.MakeContentFeedUri(), '/home')
feed = client.GetContentFeed(uri=uri)
entry = feed.entry[0]
print entry

考虑到这一点，它与你的几乎相同，但它可能会帮助你证明或反驳某些东西。祝你好运

这段代码适用于谷歌应用程序域和gdata 2.0.17：

import atom.data
import gdata.sites.client
import gdata.sites.data

client = gdata.sites.client.SitesClient(source='yourCo-yourAppName-v1', site='examplesite', domain='example.com')
client.ClientLogin('admin@example.com', 'examplepassword', client.source);

uri = '%s?path=%s' % (client.MakeContentFeedUri(), '/home')
feed = client.GetContentFeed(uri=uri)
entry = feed.entry[0]
print entry

考虑到这一点，它与你的几乎相同，但它可能会帮助你证明或反驳某些东西。祝你好运