Javascript 从HTML代码中提取数据

Javascript 从HTML代码中提取数据,javascript,jquery,regex,html,Javascript,Jquery,Regex,Html,我将这段HTML代码作为字符串存储在变量中 <p style="text-align: center;"> <span style="font-size: small;font-family: comic sans ms', sans-serif;"> <strong> word1&nbsp; <span style="line-height: 1.5;">

我将这段HTML代码作为字符串存储在变量中

<p style="text-align: center;">
    <span style="font-size: small;font-family: comic sans ms', sans-serif;">
        <strong>
            word1&nbsp;
            <span style="line-height: 1.5;">
                word2&nbsp;
            </span>
            <span style="line-height: 1.5;">
                word3&nbsp;
            </span>
            <span style="line-height:1.5;"></span>
        </strong>
    </span>
</p>

字1 字2 字3

我只想提取
word1
word2
word3
。如何以最简单、最省时的方式完成


我在想前面没有立即加上
的字符
,请尝试以下操作:

var html = '<p style="text-align: center;">
    <span style="font-size: small;font-family: comic sans ms, sans-serif;">
        <strong>
            alyssa&nbsp;
            <span style="line-height: 1.5;">
                enganio&nbsp;
            </span>
            <span style="line-height: 1.5;">
                gono&nbsp;
            </span>
            <span style="line-height:1.5;"></span>
        </strong>
    </span>
</p>';
    var values = $(html).find('p strong').text().split(' ');

只需使用此选项,它将返回p标记内的所有文本-
“alyssa,enganio,gono”


使用jQuery,您可以轻松获取

让我们试试这个:-

$('p').text();

它将返回匹配元素集中每个元素的组合文本内容,包括它们的子元素,或者还用于设置匹配元素的文本内容。

我认为您希望获取标记文本而不获取子元素文本

那就看看吧

此代码:

 console.log($("strong").clone().children().remove().end().text());
var element = $('<div id="a1"></div><div id="a3"></div>');
要将字符串更改为jQuery对象,请参见

此代码:

 console.log($("strong").clone().children().remove().end().text());
var element = $('<div id="a1"></div><div id="a3"></div>');
var元素=$('');

由于您使用了regex标记,我将发布一个带有regex的解决方案

var re = /\w+&nbsp;/g;
var results = html.match(re);

然后您可以从“results”数组中访问结果。

它不是正则表达式,而是
document.querySelector('p').innerText.split(“”)将或多或少提取信息。@litel-->上面的HTML代码是存储在变量中的字符串。在我的情况下,我将如何做?您从哪种语言提取变量?如何获取变量?由于某些原因,字符串存储在数据库中。上面的HTML代码是存储在变量中的字符串。在我的情况下,我将如何做?在页面的隐藏div中添加html,在第行上方处理,当您得到结果时,只需删除隐藏divok,然后在获得'alyssa enganio gono'后,您可以使用string.split(“”)将它们拆分。你可以把它们分开,我必须保留跨度中的空白空间,因为它是文本格式的一部分。上面的HTML代码是一个存储在变量中的字符串。在我的例子中,我将如何做呢?您可以在Div中的一些where中添加该代码,并将显示属性设置为“none”,然后像$('p').text().trim().split(“\xa0”);上面的HTML代码是存储在变量中的字符串。在我的例子中,我将如何做呢?假设代码在myhtml变量中,只需将$('p strong')替换为$(myhtml)。查找('p strong'),并将$('p strong span')替换为$(myhtml)。查找('p strong span')。(现已在答复中确定)