Regex 用于解析Facebook开放图元标记的正则表达式

Regex 用于解析Facebook开放图元标记的正则表达式,regex,windows-runtime,c++-cx,Regex,Windows Runtime,C++ Cx,我正在尝试从Windows应用商店应用程序的Bing本地页面中提取og:title属性。 WinRT和C++/CX没有HTML解析器,因此我使用正则表达式获取标记,然后使用XML解析器提取相关属性 这就是标签的外观 <meta property="og:title" content="Some Location Name"/> 我使用下面的正则表达式从HTML中提取标记,但是每当content属性中有空格时,它都无法找到匹配项 <meta property="og:tit

我正在尝试从Windows应用商店应用程序的Bing本地页面中提取og:title属性。 WinRT和C++/CX没有HTML解析器,因此我使用正则表达式获取标记,然后使用XML解析器提取相关属性

这就是标签的外观

<meta property="og:title" content="Some Location Name"/>

我使用下面的正则表达式从HTML中提取标记,但是每当content属性中有空格时,它都无法找到匹配项

<meta property="og:title" content="[\s\S]*"/>

所以,我的正则表达式将为麦当劳工作,但不会为盒子里的杰克工作


我需要做什么才能获得整个标题?

您只需在正则表达式中添加一个空格即可
[\s\s]*

免责声明:OpenGraph.io是我研究和支持的商业产品

不幸的是,你想出的任何正则表达式都是不成功的。如果您最终需要这样做,您可以使用

它的一个主要优点是,如果OpenGraph标签不存在,它将从页面上的内容中推断出诸如标题或描述(如果您最终需要的话)之类的信息

要获取有关站点的信息,请使用:
GEThttps://opengraph.io/api/1.0/site/

这将返回类似于:

{
   "hybridGraph": {
      "title": "Google",
      "description": "Search the world's information...",
      "image": "http://google.com/images/srpr/logo9w.png",
      "url": "http://google.com",
      "type": "site",
      "site_name": "Google"
   },
   "openGraph": {..}
   "htmlInferred": {..}
}

这是我的一个OpenGraph正则表达式查询,它将大多数内容与内容中的特定问题相匹配,但这些很少出现,我希望有一个更可读的正则表达式

<meta [^>]*property=[\"']og:title[\"'] [^>]*content=[\"']([^'^\"]+?)[\"'][^>]*>
]*property=[\”]og:title[\”][^>]*content=[\”]([^'^\“]+?)[\”][\”][^>]*>
但我确实遇到过一些内容先于属性的情况,所以我也运行了这个

<meta [^>]*content=[\"']([^'^\"]+?)[\"'] [^>]*property=[\"']og:image[\"'][^>]*>
]*content=[\'”]([^'^\']+?)[\'][\'][^>]*属性=[\']og:image[\'][^>]*>

您是否尝试过类似的方法:
[^”]*
@casimirithippolyte有效。谢谢!谢谢,非常感谢。