Regex 用于解析Facebook开放图元标记的正则表达式_Regex_Windows Runtime_C++ Cx

Regex 用于解析Facebook开放图元标记的正则表达式

regex windows-runtime

Regex 用于解析Facebook开放图元标记的正则表达式,regex,windows-runtime,c++-cx,Regex,Windows Runtime,C++ Cx,我正在尝试从Windows应用商店应用程序的Bing本地页面中提取og:title属性。 WinRT和C++/CX没有HTML解析器，因此我使用正则表达式获取标记，然后使用XML解析器提取相关属性这就是标签的外观 <meta property="og:title" content="Some Location Name"/> 我使用下面的正则表达式从HTML中提取标记，但是每当content属性中有空格时，它都无法找到匹配项 <meta property="og:tit

我正在尝试从Windows应用商店应用程序的Bing本地页面中提取og:title属性。 WinRT和C++/CX没有HTML解析器，因此我使用正则表达式获取标记，然后使用XML解析器提取相关属性

这就是标签的外观

<meta property="og:title" content="Some Location Name"/>

我使用下面的正则表达式从HTML中提取标记，但是每当content属性中有空格时，它都无法找到匹配项

<meta property="og:title" content="[\s\S]*"/>

所以，我的正则表达式将为麦当劳工作，但不会为盒子里的杰克工作

我需要做什么才能获得整个标题？

您只需在正则表达式中添加一个空格即可

[\s\s]*

免责声明：OpenGraph.io是我研究和支持的商业产品

不幸的是，你想出的任何正则表达式都是不成功的。如果您最终需要这样做，您可以使用

它的一个主要优点是，如果OpenGraph标签不存在，它将从页面上的内容中推断出诸如标题或描述（如果您最终需要的话）之类的信息

要获取有关站点的信息，请使用：

GEThttps://opengraph.io/api/1.0/site/

这将返回类似于：

{
   "hybridGraph": {
      "title": "Google",
      "description": "Search the world's information...",
      "image": "http://google.com/images/srpr/logo9w.png",
      "url": "http://google.com",
      "type": "site",
      "site_name": "Google"
   },
   "openGraph": {..}
   "htmlInferred": {..}
}

这是我的一个OpenGraph正则表达式查询，它将大多数内容与内容中的特定问题相匹配，但这些很少出现，我希望有一个更可读的正则表达式

<meta [^>]*property=[\"']og:title[\"'] [^>]*content=[\"']([^'^\"]+?)[\"'][^>]*>

]*property=[\”]og:title[\”][^>]*content=[\”]（[^'^\“]+？）[\”][\”][^>]*>

但我确实遇到过一些内容先于属性的情况，所以我也运行了这个

<meta [^>]*content=[\"']([^'^\"]+?)[\"'] [^>]*property=[\"']og:image[\"'][^>]*>

]*content=[\'”]（[^'^\']+？）[\'][\'][^>]*属性=[\']og:image[\'][^>]*>

您是否尝试过类似的方法：

[^”]*

@casimirithippolyte有效。谢谢！谢谢，非常感谢。