Python 无法在BeautifulSoup中添加文本和指向新标记的链接
我删除了以下HTML以获取链接信息,创建了一个新标记,将链接添加到新标记,然后尝试将该标记附加到另一个文档,但丢失了所有HTML格式:Python 无法在BeautifulSoup中添加文本和指向新标记的链接,python,beautifulsoup,Python,Beautifulsoup,我删除了以下HTML以获取链接信息,创建了一个新标记,将链接添加到新标记,然后尝试将该标记附加到另一个文档,但丢失了所有HTML格式: data = """ <div class="Answer"> 1. BOUNDARIES - EPB & APL <i>(inferior)</i>, EPL <i>(superior). </i><div>2. FLO
data = """
<div class="Answer">
1. BOUNDARIES - EPB & APL <i>(inferior)</i>, EPL <i>(superior). </i><div>2. FLOOR (proximal to distal) - radial styloid => scaphoid => trapezium => 1st MC base. <br /><div>3. CONTENTS - cutaneous branches of radial nerve <i>(on the roof),</i> cephalic vein <i>(begins here),</i> radial artery <i>(on the floor).</i></div></div><div><br /></div><div><img src="paste-27a44c801f0776d91f5f6a16a963bff67f0e8ef3.jpg" /><br /></div><div><b>Image: </b>Case courtesy of Dr Sachintha Hapugoda, <a href="https://radiopaedia.org/">Radiopaedia.org</a>. From the case <a href="https://radiopaedia.org/cases/52525">rID: 52525</a> [Accessed 15 Nov. 2018].</div>
</div>
"""
soup = BeautifulSoup(data, "html.parser")
image_link = soup.find('div').find('b').next.next
print(image_link)
p_tag = soup.new_tag('p')
p_tag.append(soup.new_tag('br'))
p_tag.append(soup.new_tag('b'))
p_tag.b.append("Image: ")
p_tag.append(NavigableString(image_link))
print(p_tag)
返回:
<p><br/><b>Image: </b>Case courtesy of Dr Sachintha Hapugoda, <a href="https://radiopaedia.org/">Radiopaedia.org</a>. From the case <a href="https://radiopaedia.org/cases/52525">rID: 52525</a> [Accessed 15 Nov. 2018].</p>
图片:案例由Sachintha Hapugoda博士提供,a href=”https://radiopaedia.org/“Radiopaedia.org/a。从案例a href=”https://radiopaedia.org/cases/52525“rID:52525/a[于2018年11月15日查阅]
所有HTML格式都将丢失。我该怎么办?因为
图像链接的类型是导航链接
或字符串,它会像一样转换字符,因为图像链接的类型是导航链接
或字符串,它会像一样转换字符!你这个男人!马来西亚达里?我是一个业余爱好者,与BeautifulSoup和Scrapy一起做了很多工作,我正在考虑组建一个不和谐/松弛的团队。你有兴趣加入吗?老兄!你这个男人!马来西亚达里?我是一个业余爱好者,与BeautifulSoup和Scrapy一起做了很多工作,我正在考虑组建一个不和谐/松弛的团队。你有兴趣加入吗?
....
p_tag.b.append("Image: ")
image_tag = BeautifulSoup(image_link, 'html.parser')
p_tag.append(image_tag)
from html import unescape
....
p_tag.append(NavigableString(image_link))
unescaped_p = unescape(str(p_tag))
print(unescaped_p)