Php 我将开发一个工作门户,需要建议

Php 我将开发一个工作门户,需要建议,php,Php,我计划用PHP开发一个带有MySQL的工作门户,问题是我们将拥有大约500万个简历数据库,所以需要你的建议,我应该使用多大的硬盘来存储这么多数据 关于负载平衡的一些建议。首先,您不应该使用MySql,而应该使用类似Mongodb for CV数据库的json数据库 MySQL是一个基于关系模型的数据库。问题是CV不能很容易地标准化为这样的模型。例如,有些人可以在简历上分享他们的地址,有些人则不能。使用json格式的数据库,每个CV都可以完全不同。MySQL无法做到这一点(否则很难维护) 其次,创

我计划用PHP开发一个带有MySQL的工作门户,问题是我们将拥有大约500万个简历数据库,所以需要你的建议,我应该使用多大的硬盘来存储这么多数据


关于负载平衡的一些建议。

首先,您不应该使用MySql,而应该使用类似Mongodb for CV数据库的json数据库


MySQL是一个基于
关系
模型的数据库。问题是CV不能很容易地标准化为这样的模型。例如,有些人可以在简历上分享他们的地址,有些人则不能。使用json格式的数据库,每个CV都可以完全不同。MySQL无法做到这一点(否则很难维护)

其次,创建负载平衡的数据库并不容易。 有关更多信息,请参阅mongodb文档:

(至少需要7台服务器)


希望有帮助:o

猜猜看。您的硬件设置应该足够灵活,可以根据需要进行扩展

如果要将CV存储为文本:一个页面包含大约3000个字符。假设一份平均4500个字符的简历,数据是非结构化的,那么所需的存储空间是22.5 GB,在单个服务器的能力范围内

如果你打算将简历存储为PDF/DOC格式:我的简历大约是300K的PDF格式。如果这具有代表性,您将需要大约1.5 TB的存储空间


负载平衡问题太宽泛,无法回答,实际上与您需要的存储量无关,而与您正在构建的服务的预期负载有关。

您如何处理CV中的每个字段并将其插入单独的表中。这将帮助您管理内存并节省成本。 只是一些努力,使分离代码


尝试在核心java中生成提取代码

我建议使用云解决方案。我开发了一个音乐网站,几年后可能会有超过10 TB的数据

我的软件栈:Django、Heroku、Postgres和AmazonS3

负载平衡?让云服务提供商担心一下。此外,由于我将应用程序服务器和静态文件服务器分离,因此负载非常平衡

唯一需要担心的是数据存储和网络流量的费用。

如果您希望保持简单,您可以将CV保存在文件系统中的某个位置,并将上载CV的路径保存在数据库中。您可以使用标签在用户之间搜索技能。需要详细信息时,获取所需简历

这种方法可以减少数据库的负载,因为CV数据不在数据库中,并且在需要时进行处理


但显然,您需要大量的存储空间。:)

你能告诉我们为什么不使用MySQL,而是使用你的建议吗?没有理由你的建议毫无意义。原因很多,但最重要的是MySQL是一个基于模型的数据库。问题是CV不能完全建模。例如,有些人可以在简历上分享他们的地址,有些人则不能。使用json格式的数据库,每个CV都可以完全不同。MySQL无法做到这一点(或者很难维护)“例如,有些人可以在简历上分享他们的地址,有些人不能。”你的问题无法可靠地回答。你怎么知道CVs会有多大?你的数据库模式是什么?所有这些都必须考虑。我正在寻找一个粗略的想法从来没有做过像这样的大项目,所以。。。需要专家的一些想法。把它放到云端,那就没关系了,你只需要付更多的钱。