Database 以上载形式加载文件时,是否可以在数据库中搜索相关文件

Database 以上载形式加载文件时,是否可以在数据库中搜索相关文件,database,file-upload,database-scan,Database,File Upload,Database Scan,我有一个网站,涉及上传文件到该网站的想法。但我想知道的是,当用户点击“浏览”并选择文件时,如果网站可以在将文件上传到网站之前自动扫描网站数据库中的类似文件,我想知道这是否可能。类似于在本网站上处理问题时的自动“相关问题”。可以在不上载文件的情况下获取文件名,以便根据文件名进行搜索。内容只有在上传后才可用。可以在不上传文件的情况下获取文件名,因此您可以根据文件名进行搜索。内容只有在上传后才可用。当然,这是可能的。但你必须提出自己的定义,以及找到相似之处的算法 文件类型差异 不同的文件类型应进行不同

我有一个网站,涉及上传文件到该网站的想法。但我想知道的是,当用户点击“浏览”并选择文件时,如果网站可以在将文件上传到网站之前自动扫描网站数据库中的类似文件,我想知道这是否可能。类似于在本网站上处理问题时的自动“相关问题”。

可以在不上载文件的情况下获取文件名,以便根据文件名进行搜索。内容只有在上传后才可用。

可以在不上传文件的情况下获取文件名,因此您可以根据文件名进行搜索。内容只有在上传后才可用。

当然,这是可能的。但你必须提出自己的定义,以及找到相似之处的算法

文件类型差异

不同的文件类型应进行不同的比较。例如,文本文件非常适合diff查找相似的文件,但是比较相似的图像或视频要困难得多

比较难度

此外,与大量文件进行比较是一件非常昂贵的事情,因为它通常是成对完成的。虽然有些索引方法可以帮助提高搜索效率,但我认为没有一种简单的方法可以快速做到这一点

人群来源备选方案

另一种选择是让网站的用户指出相似之处,这样你就可以简单地显示一个列表,其中列出了被投票为相似的最受欢迎的文件。当然,这对上传新文件没有帮助,但它可以帮助您了解用户发现的相似之处

许多网站用来比较内容相似性的方法是允许用户标记项目。如果一个项目与另一个项目共享许多相同的标签,那么它们很可能是相似的。这可能是最简单的方法


这还有一个好处,即任何内容类型都可以与任何其他内容类型进行比较。因此,与视频具有相同标签的文本文件可以显示为类似的文件。

当然,这是可能的。但你必须提出自己的定义,以及找到相似之处的算法

文件类型差异

不同的文件类型应进行不同的比较。例如,文本文件非常适合diff查找相似的文件,但是比较相似的图像或视频要困难得多

比较难度

此外,与大量文件进行比较是一件非常昂贵的事情,因为它通常是成对完成的。虽然有些索引方法可以帮助提高搜索效率,但我认为没有一种简单的方法可以快速做到这一点

人群来源备选方案

另一种选择是让网站的用户指出相似之处,这样你就可以简单地显示一个列表,其中列出了被投票为相似的最受欢迎的文件。当然,这对上传新文件没有帮助,但它可以帮助您了解用户发现的相似之处

许多网站用来比较内容相似性的方法是允许用户标记项目。如果一个项目与另一个项目共享许多相同的标签,那么它们很可能是相似的。这可能是最简单的方法


这还有一个好处,即任何内容类型都可以与任何其他内容类型进行比较。因此,与视频具有相同标记的文本文件可以显示为类似的文件。

该网站可以先上传,然后标记/评论/填写元信息类程序。该网站可以先上传,然后标记/评论/填写元信息类程序。非常模糊。相关文件?文本,二进制?它们是图像吗?你根据什么标准定义“相似”?因为没有给出文件类型,我假设它是一个通用的上传站点。一个la Rapidshare。所有类型的文件,所以我想它可以被分类为“一般上传站点”。非常模糊。相关文档?文本,二进制?它们是图像吗?根据什么标准定义“相似”?因为没有给出文件类型,我假设它是一个一般上传站点。一个la Rapidshare。所有类型的文件,所以我想它可以被分类为“A”一般上传网站。我从来没有想过“众源备选方案”-谢谢你的建议。+1,众源标签可能是通用场景中的一种方式。我从来没有想过“众源备选方案”-谢谢你的建议。+1,众源标签可能是通用场景中的一种方式。