Javascript 按段落分隔html文档

Javascript 按段落分隔html文档,javascript,html,google-chrome-extension,Javascript,Html,Google Chrome Extension,据我所知,在html中有许多方法可以将文本格式化为单独的段落。例如,可以在两段文本之间有一个空格。或者一个在末端断裂的标签。或者甚至可能是一个带有换行符的标签 我的问题是,如果我想在任何给定的网页中孤立每个段落,我如何解释所有这些不同的方式 我们需要这个功能,因为我们正在创建一个chrome扩展,它必须在所有网站上运行。因此,我们必须考虑新段落可能出现的所有方式 你需要定义你所说的“段落”是什么意思,以及你将识别哪些HTML结构来表示或界定“段落”。这正是我们想要弄清楚的。我们如何更好地使用ja

据我所知,在html中有许多方法可以将文本格式化为单独的段落。例如,可以在两段文本之间有一个空格。或者一个在末端断裂的标签。或者甚至可能是一个带有换行符的标签

我的问题是,如果我想在任何给定的网页中孤立每个段落,我如何解释所有这些不同的方式


我们需要这个功能,因为我们正在创建一个chrome扩展,它必须在所有网站上运行。因此,我们必须考虑新段落可能出现的所有方式

你需要定义你所说的“段落”是什么意思,以及你将识别哪些HTML结构来表示或界定“段落”。这正是我们想要弄清楚的。我们如何更好地使用javascript分析文档,以了解在语义上将所有内容分离为完整的思维单元。问题是有数百种方法可以做到这一点,而且变得很难。有没有一种方法可以超越标签,看到文档最深层的文本表示,只看到换行符或类似的东西?这就是为什么它成为一个设计问题,主要是基于观点的,如果不是哲学的,并且取决于特定的背景和目标,因此脱离主题。我们如何处理它呢?也许在较低级别的dom中,有一种方法可以将这些标记全部转换为全局换行符,我们可以寻找它。这可能是一个设计问题,但它仍然需要很多我们没有的技术细节。如果我们从简单的间距角度来看,任何不同行的内容都是一个新段落,有没有办法做到这一点?@Blessoul这将是一个更好的提问标准。你应该用这个来编辑你的问题。