Regex 用于解析Facebook开放图元标记的正则表达式
我正在尝试从Windows应用商店应用程序的Bing本地页面中提取og:title属性。 WinRT和C++/CX没有HTML解析器,因此我使用正则表达式获取标记,然后使用XML解析器提取相关属性 这就是标签的外观Regex 用于解析Facebook开放图元标记的正则表达式,regex,windows-runtime,c++-cx,Regex,Windows Runtime,C++ Cx,我正在尝试从Windows应用商店应用程序的Bing本地页面中提取og:title属性。 WinRT和C++/CX没有HTML解析器,因此我使用正则表达式获取标记,然后使用XML解析器提取相关属性 这就是标签的外观 <meta property="og:title" content="Some Location Name"/> 我使用下面的正则表达式从HTML中提取标记,但是每当content属性中有空格时,它都无法找到匹配项 <meta property="og:tit
<meta property="og:title" content="Some Location Name"/>
我使用下面的正则表达式从HTML中提取标记,但是每当content属性中有空格时,它都无法找到匹配项
<meta property="og:title" content="[\s\S]*"/>
所以,我的正则表达式将为麦当劳工作,但不会为盒子里的杰克工作
我需要做什么才能获得整个标题?您只需在正则表达式中添加一个空格即可
[\s\s]*
免责声明:OpenGraph.io是我研究和支持的商业产品
不幸的是,你想出的任何正则表达式都是不成功的。如果您最终需要这样做,您可以使用
它的一个主要优点是,如果OpenGraph标签不存在,它将从页面上的内容中推断出诸如标题或描述(如果您最终需要的话)之类的信息
要获取有关站点的信息,请使用:
GEThttps://opengraph.io/api/1.0/site/
这将返回类似于:
{
"hybridGraph": {
"title": "Google",
"description": "Search the world's information...",
"image": "http://google.com/images/srpr/logo9w.png",
"url": "http://google.com",
"type": "site",
"site_name": "Google"
},
"openGraph": {..}
"htmlInferred": {..}
}
这是我的一个OpenGraph正则表达式查询,它将大多数内容与内容中的特定问题相匹配,但这些很少出现,我希望有一个更可读的正则表达式
<meta [^>]*property=[\"']og:title[\"'] [^>]*content=[\"']([^'^\"]+?)[\"'][^>]*>
]*property=[\”]og:title[\”][^>]*content=[\”]([^'^\“]+?)[\”][\”][^>]*>
但我确实遇到过一些内容先于属性的情况,所以我也运行了这个
<meta [^>]*content=[\"']([^'^\"]+?)[\"'] [^>]*property=[\"']og:image[\"'][^>]*>
]*content=[\'”]([^'^\']+?)[\'][\'][^>]*属性=[\']og:image[\'][^>]*>
您是否尝试过类似的方法:[^”]*
@casimirithippolyte有效。谢谢!谢谢,非常感谢。