bs4 python网页抓取

bs4 python网页抓取,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我只想从这个特定的div访问文本。 结构如下: <div class="edgtf-pli-text"><h4 class="edgtf-pli-title entry-title" itemprop="name"> Crash Landing on You</h4></div> 我如何塑造代码,使其只显示文本,即“坠机降落在你身上?” 我对抓取非常陌生,所以请帮我一点忙,如果有什么好的

我只想从这个特定的
div
访问文本。 结构如下:

<div class="edgtf-pli-text"><h4 class="edgtf-pli-title entry-title" itemprop="name">
Crash Landing on You</h4></div>
我如何塑造代码,使其只显示文本,即“坠机降落在你身上?”

我对抓取非常陌生,所以请帮我一点忙,如果有什么好的抓取wiki表的api,也建议我使用一种方法来提取标记中的文本

对于名称中的名称:
打印(name.get_text(strip=True))
迫降到你身上
喵,秘密男孩
七次初吻
金秘书怎么了
触动你的心
我秘书的秘密生活
坚强的女孩邦顺
可疑伙伴
秘密花园
她很漂亮
购物王路易
哦,我的维纳斯
我的爱来自星星
我的初恋
蓝色海洋的传说
大热门
她的私生活
再打
急诊夫妇
现在就满怀激情地清洁
夸张
使用方法提取标记内的文本

对于名称中的名称:
打印(name.get_text(strip=True))
迫降到你身上
喵,秘密男孩
七次初吻
金秘书怎么了
触动你的心
我秘书的秘密生活
坚强的女孩邦顺
可疑伙伴
秘密花园
她很漂亮
购物王路易
哦,我的维纳斯
我的爱来自星星
我的初恋
蓝色海洋的传说
大热门
她的私生活
再打
急诊夫妇
现在就满怀激情地清洁
夸张

您可以使用BeautifulSoup标记的
.text
属性,然后使用
.strip()
它(删除每个韩剧名称中前面的“\n”(新行字符)


您可以使用BeautifulSoup标记的
.text
属性,然后使用
.strip()
它(删除每个韩剧名称中前面的“\n”(新行字符)

导入请求
从bs4导入BeautifulSoup
def主(url):
r=请求。获取(url)
soup=BeautifulSoup(r.content'html.parser')
target=[item.get_text(strip=True)表示汤中的项目。选择(
“h4.edgtf pli标题。条目标题”)]
打印(目标)
主要(”https://kdramaclicks.com/kdrama/romantic-comedy/")
输出:

['Crash Landing on You', 'Meow, The Secret Boy', 'Seven First Kisses', 'What’sWrong with Secretary Kim', 'Touch Your Heart', 'The Secret Life of My Secretary', 'Strong Girl Bong-soon', 'Suspicious Partner', 'Secret Garden', 'She Was Pretty', 'Shopping King Louis', 'Oh My Venus', 'My Love from the Star', 'My FirstFirst Love', 'Legend of the Blue Sea', 'The Big Hit', 'Her Private Life', 'Beating Again', 'Emergency Couple', 'Clean with Passion for Now', 'Be Melodramatic']
导入请求
从bs4导入BeautifulSoup
def主(url):
r=请求。获取(url)
soup=BeautifulSoup(r.content'html.parser')
target=[item.get_text(strip=True)表示汤中的项目。选择(
“h4.edgtf pli标题。条目标题”)]
打印(目标)
主要(”https://kdramaclicks.com/kdrama/romantic-comedy/")
输出:

['Crash Landing on You', 'Meow, The Secret Boy', 'Seven First Kisses', 'What’sWrong with Secretary Kim', 'Touch Your Heart', 'The Secret Life of My Secretary', 'Strong Girl Bong-soon', 'Suspicious Partner', 'Secret Garden', 'She Was Pretty', 'Shopping King Louis', 'Oh My Venus', 'My Love from the Star', 'My FirstFirst Love', 'Legend of the Blue Sea', 'The Big Hit', 'Her Private Life', 'Beating Again', 'Emergency Couple', 'Clean with Passion for Now', 'Be Melodramatic']
['Crash Landing on You', 'Meow, The Secret Boy', 'Seven First Kisses', 'What’sWrong with Secretary Kim', 'Touch Your Heart', 'The Secret Life of My Secretary', 'Strong Girl Bong-soon', 'Suspicious Partner', 'Secret Garden', 'She Was Pretty', 'Shopping King Louis', 'Oh My Venus', 'My Love from the Star', 'My FirstFirst Love', 'Legend of the Blue Sea', 'The Big Hit', 'Her Private Life', 'Beating Again', 'Emergency Couple', 'Clean with Passion for Now', 'Be Melodramatic']