很明显我们需

Exchange insights, tools, and strategies for canada dataset.
Post Reply
fomayof928@mowline
Posts: 495
Joined: Sun Dec 22, 2024 4:02 am

很明显我们需

Post by fomayof928@mowline »

提出更好的计划。 在我与马特一对一的交谈中获得见解后,要改变我们的方法。马特和我概述了一项高级计划,以降低我们的成本,并增加按时获取索引的潜在好处。我们认为,在告诉团队这可能很难推销之后,在过去的几个月里“不惜一切代价不要错过这个日期”。他们肯定花了数百个小时来维护所有这些服务器,而我们不确定他们对这一变化的态度有多开放。



然而,我们出色的大数据经理 Carin 将团队聚集在一起 c级执行名单 ,我们都同意了这个计划。凯伦概述了这些问题,然后在她给兰德的电子邮件中提出了新方法: 新计划: 在 AWS 中最多运行两个索引: 80 cc2.8xlarge 机器上的集群 - 这些机器更大且更昂贵,但应该在更短的时间内完成索引,从而使它们每月更便宜。



如有必要,请在 200 台小型 c1.xlarge 计算机(当前设置)上运行备份索引。 继续保持 60 - 700 亿个 URL 的索引大小,以保持合理的处理时间。 该计划让工程人员有时间解决重大问题:构建测试环境并改进 Mozscape 代码库。但最重要的是,我们可以更有效地将 PLD 划分为处理分片,这可以显着节省处理时间。
Post Reply