Java 如何检测哪个博客API

Java 如何检测哪个博客API,java,api,blogs,Java,Api,Blogs,假设你想创建一个非常简单的博客编辑器,你的想法之一就是做Live Writer做的事情,只询问个人博客的URL。你如何检测它是什么类型的博客 基本的检测可以通过URL本身来完成,例如“”,但是如果它是自托管的呢 我最感兴趣的是如何在Java中实现这一点,但这个问题也可以作为任何其他语言的参考。一些博客提供了生成器元标记-例如Wordpress-您可以了解是否有任何例外 不过,你必须小心如何检测它,谷歌的这句话让我大吃一惊: <meta content='blogger' name='gen

假设你想创建一个非常简单的博客编辑器,你的想法之一就是做Live Writer做的事情,只询问个人博客的URL。你如何检测它是什么类型的博客

基本的检测可以通过URL本身来完成,例如“”,但是如果它是自托管的呢


我最感兴趣的是如何在Java中实现这一点,但这个问题也可以作为任何其他语言的参考。

一些博客提供了生成器元标记-例如Wordpress-您可以了解是否有任何例外

不过,你必须小心如何检测它,谷歌的这句话让我大吃一惊:

<meta content='blogger' name='generator'/>

单引号是亵渎。

许多(大多数?)博客都会有一个“生成器”的元标签,其中会列出博客引擎。例如,blogger博客将包含以下元标记:

<meta name="generator" content="Blogger" />  
<meta name="Generator" content="Subtext Version 1.9.5.177" />  

我的Subtext博客显示以下生成器元标记:

<meta name="generator" content="Blogger" />  
<meta name="Generator" content="Subtext Version 1.9.5.177" />  


这个元标记将是第一个要查看的地方。对于没有在源代码中设置此元标记的博客,您必须求助于寻找模式来确定博客类型

要确定在确定博客引擎时要寻找的其他模式(对于那些没有generator meta标记的博客引擎),您基本上只需查看源代码以确定特定于该博客类型的内容。您还需要在多个此类博客之间进行比较,以确保它不是仅针对博客上使用的皮肤或主题的特定内容

另一个想法是阅读各种常见博客引擎的文档,了解如何发现其指向MetaWebLog API等内容的路径的位置。IIRC,Live Writer内置了对最常见类型的支持,其余的分类为“MetaWebLog API Blog”或其他