Database Freebase:让我的公司立足值得吗';它上面有整个数据库吗?

Database Freebase:让我的公司立足值得吗';它上面有整个数据库吗?,database,startup,freebase,Database,Startup,Freebase,我在一家为现场音乐建立场地/艺术家数据库的公司工作,最近我遇到了Freebase。这看起来很有吸引力,即使新的、新兴的乐队没有数据。对于那些与Freebase合作过的人,我有几个问题: 将所有数据输入与Freebase集成是否存在缺点?我们不希望出售或私有化这些信息 就可用性而言,Freebase的弱点是什么 披露:我在谷歌的Freebase工作 Freebase中的音乐数据是我们最强大的领域之一,随着我们继续加载更多的数据集,它将继续变得更广泛、更丰富。例如,我们从MusicBrainz导入数

我在一家为现场音乐建立场地/艺术家数据库的公司工作,最近我遇到了Freebase。这看起来很有吸引力,即使新的、新兴的乐队没有数据。对于那些与Freebase合作过的人,我有几个问题:

  • 将所有数据输入与Freebase集成是否存在缺点?我们不希望出售或私有化这些信息

  • 就可用性而言,Freebase的弱点是什么

  • 披露:我在谷歌的Freebase工作

    Freebase中的音乐数据是我们最强大的领域之一,随着我们继续加载更多的数据集,它将继续变得更广泛、更丰富。例如,我们从MusicBrainz导入数据,清理数据,并将主题与Freebase中的现有主题进行匹配,以避免重复

  • 就缺点而言,您应该准备好处理大量数据。例如,Freebase目前有一些可能对您的应用程序有用,也可能不有用的功能,但您仍需要找出哪些功能对应于您的用户感兴趣的John Smith。我们称之为“协调”及其必要性,以便您的应用程序准确地知道要查询API的主题

    既然你提到了音乐场所,我还应该指出,尽管Freebase有很多关于场所的数据,但我们还没有geosearch API,所以如果你需要的话,你需要自己开发

    <> P>因为任何人都可以编辑FrASBASE,你也应该考虑保护你的网站免受破坏。

  • Freebase对开发人员来说非常好,因为您可以轻松地跳入并清理坏数据或添加缺少的主题。然而,一个一直是挑战的领域是从谷歌外部加载大量数据。我们已经建立了允许人们上传数据集的,但是这些数据集必须通过QA过程,这需要一些时间来完成。有必要使用这些QA过程来保持Freebase中的质量水平,但它确实会减慢加载大型数据集的过程


  • 我真的希望你选择利用Freebase音乐数据来建立你的公司。我知道已经有很多音乐初创公司乐于使用我们的数据。

    谢谢你的解释,肖恩!另一个问题是速度——你是否发现用户通常也会保留本地副本以便快速访问,还是他们直接从Freebase工作?这实际上取决于你正在构建的应用程序的类型。我们的搜索和主题API非常快,并且具有良好的缓存机制。Mqlread更为多样,因为它允许任意复杂的查询。我认为最简单的方法是将Freebase MID存储在数据库中(如我给出的“时间链接”中所述)。这样,您就不必担心检查Freebase以查看数据是否已更改。但是,如果你想做“六度分离”类型的查询来查找相关的音乐艺术家;这种计算需要使用我们的数据转储离线完成。