Html 使用Qt Creator从internet页面的源代码中提取信息

Html 使用Qt Creator从internet页面的源代码中提取信息,html,c++,qt,qt-creator,qwebview,Html,C++,Qt,Qt Creator,Qwebview,我正在做一个小项目,下面是我要做的: 我将QtUI与webView小部件一起使用,我想从网页的源代码中提取特定信息。它是组件的订单代码。 在本例中,我想提取的部分是1758990: <div id="productDescription"> <div class="brandLogo"> <a href="http://uk.farnell.com/multicomp">

我正在做一个小项目,下面是我要做的:

我将QtUI与webView小部件一起使用,我想从网页的源代码中提取特定信息。它是组件的订单代码。 在本例中,我想提取的部分是1758990:

<div id="productDescription">


            <div class="brandLogo">
                <a href="http://uk.farnell.com/multicomp">
                    <img id="supplier_logo" src="http://uk.farnell.com/productimages/promo/en_GB/2217096.jpg" alt="MULTICOMP"/>
                </a>
            </div>


    <ul>
        <li>
            <strong>Manufacturer:</strong>
            <a href="http://uk.farnell.com/multicomp">
                MULTICOMP
            </a>
        </li>
        <li>
            <strong>Order Code:</strong>
            1758990
        </li>
        <li>
            <strong>Manufacturer Part No</strong>
            MC0402B821K500CT
        </li>
    </ul>

    <ul id="technicalData">

                <li>
                    <a href="http://www.farnell.com/datasheets/1859359.pdf" target="_blank" ><span class="pfIcon pfPdf" title="Technical Data Sheet (877.82KB) EN">&nbsp;</span>Technical Data Sheet (877.82KB) EN</a>
                </li>


    </ul>

</div>
我想使用这个顺序代码并将其放入一个变量中。其余的我会处理,但我找不到正确的工具来查找代码,因为代码从来都不一样。我用一个toHtml函数从页面中提取了整个源代码,并尝试将其导出到一个textEdit,但我真的不知道它有什么用处。 我应该用什么

先谢谢你

另外,我很抱歉,我不太会问问题,所以如果我。。打破写作惯例

编辑: 我正在尝试使用findFirstElement函数,但是我找不到正确的查询来提取1758990。
我可以用findFirstElementproductDescription li:nth-child2提取订单代码:1758990,但我只想要订单代码:。

好的,我找到了一种方法,当然不是最干净的方法,但是

我有一个按钮来检索代码:

void browser::on_Addtodbbtn_clicked()
{
    QWebElement code = ui->webView->page()->mainFrame()->findFirstElement("#productDescription li:nth-child(2)");
    QString OrderCode = code.toPlainText(); // at this point, OrderCode = "Order Code: 1758990"
    OrderCode.remove("Order Code: "); // I remove the part I don't want
    qDebug() << "OrderCode:" << OrderCode; // Here you go

}

这个页面帮了我很多忙:

我不确定我是否理解,您想要的是从html输入中提取数据?检查此链接是否有帮助:它从网页中提取DOM数据;是的,我以前见过这种技术并尝试过使用它。但我真正想要的是在这种情况下只提取一个信息,组件的订单代码。