Filecoin 技术选型系列1 - 硬件选购
斯多葛哲学家·塞涅卡
我们的房子,财富,社会地位,我们的眼睛,身体,我们的亲人,子女,朋友,我们所珍惜的一切,都是不是我们的,包括我们自己。它们只是命运女神借我们暂用一下。 我们要像虔诚的,圣神的保管者一样好好保管他们。如果有一天命运女神想要收回它们,我们绝不该抗命不从,而应该满心欢喜, 不带怨气地说:感谢您让我拥有并保管了这一切,我已悉心保管,现在如数奉还。
目前,对于 Filecoin 矿工来说,除了抵押币,硬件算是最大的一笔现金投入了。Filecoin 矿机的对于硬件的配置很高。现在一台算力机少则10几万,多则20几万。 硬件没选对的话,会严重影响封装的效率,对于矿工来说是损失也是很大的。本文分享一些自己在 Filecoin 硬件选购上的一些心得。对于那些购买云算力的同学,请直接略过。
# 1. 租还是购?这是一个问题。
在打算买硬件之前,我觉得你应该先认真考虑一下你到底需不需要买硬件,或者说你到底需要买哪些硬件。如果不知道自己该买还是租的话,我这里提供给你几个决策的信息。
- 一般来说,Miner 机器,daemon 机器(节点机)以及存储机器你是必须采购的。因为这个是你整个 Filecoin 集群的命门所在,这些机器掌握在手里,将来不管你是换机房也好,换技术服务商也好,都不会太麻烦,你只需要把这些机器搬走了,你的质押币,存储数据,算力什么的就都跟着过去了。
- 我估计很多机器供应商都会这么跟你说:算力机器你是可以租的,因为你算力封装完,这些机器就没有用了。这话对于 99% 以上的矿工来说,毫无疑问是正确的。因为大部分矿工目前还是封装
Junk Data
也就是所谓的垃圾数据,垃圾数据一般是没人来检索的,所以你封装好的扇区,除了做时空证明,几乎不会再去访问它。但是如果你接了订单,那么数据检索的时候可能要做unseal
,这个计算量不亚于 PC1,这个时候你不可能全让 Miner 来做的。所以如果有这种需求,那么建议你自己还是采购几台算力机,以备不时之需。 - 目前提供算力出租的还是有不少的,价格一般在 500 RMB / TiB 左右,1 PB 算力大概需要 50万 左右,看着成本挺高,但是应该只有买机器成本的 1/6 到 1/10 左右。 具体视情况而定,比如如果你需要在 10 天之内封装 1PB 的话,那么你就要花 500 万买算力机,如果是要 1 月的话,那么可能就只要 200万不到。
- 买了机器用完了还可以租给别人。可能选择买机器的人都有这个想法
O(∩_∩)O哈哈~
# 2. CPU 选择
CPU 的选购也需要根据你让机器承担的角色来确定选择什么样的 CPU 架构。
节点机器和 Miner 机器一般优先选择 Intel 的,因为价格摆在那呢。有网友说 Miner 用 AMD 的 CPU 会稳定一些,但是我在实测的过程并没有发现,也许是我没有遇到。不过由于 AMD 的核多,主频也高,所以选择 AMD 的CPU 你只需要购买一颗 CPU 就行了,而选 Intel 的话,最好使用双路 CPU。Intel 的推荐 2667 V4,AMD 的话 7302/7402 都是不错选择。
PC1 任务的算力机只能用 AMD 的 CPU,主频高的单个任务完成的时间短,核心组数多的可以并行的路数多。注意我这里用的是核心组数而不是核心数,这是因为 PC1 的 SDR 加速每次用到的是一组共享 L3 缓存的核,而不是一颗核。这一组核中一些用于计算加速,一些用于数据传输加速,共同完成 PC1 的加速(关于 PC1 加速核的设置,我以后会专门写一篇文章介绍)。目前矿工用的比较多的几款 AMD 芯片是 7542/7742/7302 等。一般来说 PC1,PC2,C1 任务都是在同一台机器上完成的。
C2 算力机(又称证明机器)一般首选 Intel 的 CPU,2680/2690 V4系列,2667 V4 等,都是不错的选择。由于 C2 前期依赖 CPU 的计算,所以如果要并行多路 C2 任务,记得 CPU 要用 2 颗。
家用 CPU 一般选择 36/37/38/3900x,3950x/60x/70x 都是不错的选择。其中 3960X 和 3970x 支持 256G 内存可以并行 3PC1 + 1PC2。性价比高一些。
# 3. RAM 和主板
内存的话,基本没有什么好选择,基本用 ECC 的服务器内存,频率 2666MHz 以上就好了,家用机一般用海盗船的内存。还有就是内存最好买新的,二手内存有不少假内存。
AMD CPU 一般主板一般都选用泰安或者超微的。建议直接用厂家的准系统(机箱,电源,主板一体机),性能稳定可靠一些。 Intel 的 CPU 一般选华硕或者技嘉的主板就好了。
# 4. GPU 选择
GPU 一般分三个梯队:
- 一线品牌:华硕,微星,技嘉的超级雕系列也算一线吧。
- 二线品牌:技嘉
- 三线品牌:蓝宝石,七彩虹,影驰等
- 四线品牌:丽台,索泰,戴尔等
根据你资金实力对号入座就好了。好显卡主要体现在做工精良,散热良好,性能稳定,跑个十天半个月之后还是一样稳如老狗,差点一般就能坚持两三天之后性能就急剧下降了。咱们就拿跑 Lotus PC2 任务来说,一线品牌的显卡能够跑出1个月的稳定数据,单个任务的时间稳定在 26min-32min。而三线的显卡一般前2天能保持 30min 左右,后面就越来越慢,一个星期以后基本都到 50min-60min 了。这还算好的,能正常跑完的,有的干脆给你卡上几个小时,甚至十几个小时。
一般来说硬件搭配良好的机器,调试个2-3天就可以正常跑任务了,差点的就不好说了,我们有个客户硬件不知道是没有经过出产测试还是啥的,结果第一轮跑下来(3天),15 台机器就剩下两台可用,一个星期之后这两台也阵亡了。结果我们协助厂商那边前前后后调试了2个月,才把硬件调稳定了。除了 CPU,电源,机箱之外,其他所有的配件都换了。
所以说,有句话说的好,出来混的,迟早都要还的,不该省钱的地方你省了,后面都要成倍的补回来。
注意:
还要一点需要提醒的是,最好不要买游戏显卡,这种显卡在刚开始跑的时候确实速度很快,但是连续跑几天就不行了,性能下降的很厉害。
# 5. SSD/NVME 选择
SSD/NVME 我们主要关注它的速度和使用寿命(擦写次数)。这就不得先说下 SSD 的颗粒分类了。这里先简单说下: 固态硬盘的颗粒目前主要有4种:SLC,MLC,TLC 和 QLC。一般来说,SLC(单层存储单元)理论擦写次数10万次,MLC(双层存储单元)3000-10000次,TLC(三层存储单元)500-1000次,qlc(四层存储单元)仅仅150次。读写速度也是 SLC > MLC > TLC > QLC,当然,生产成本也是 SLC > MLC > TLC > QLC。从价格上来说,SLC 基本是 MLC 的三倍,MLC 是 TLC 的 1.5-2 倍左右。
好了,大概知道几种硬盘的尿性了,那么我们 SSD/NVME 的选择也就比较明了了。
- 系统盘统一用 SSD,颗粒的话用 TLC 就好了。Miner 的系统盘最好用 MLC 的,因为 Miner 轻易不能关机,所以系统故障率要越低越好。节点的用来同步区块数据的 SSD 建议选用 MLC 的。
- PC1,PC2 算力机的缓冲盘,建议用 M.2 或者 U.2 接口的 NVME 磁盘,同时为了保证长时间持续读写不掉速,你最好也选 MLC,最次也要 TLC 的,QLC 建议就不要用了。
- C2 证明机器的缓冲盘(一般证明机要同时做 AP 任务),一般一块 2TB 的 NVME 就够了,颗粒选 TLC 就行。
- 存储如果你用 Ceph 或者 ZFS 存储系统的话,那么存储系统的缓存盘(日志盘)最好也选用 MLC 的,如果想降低成本也可以选 TLC 的,QLC 也不建议要。
所以说,以后别再问:为什么别人买的 2TB 的 NVME 只要 1200,而我买的却要 2100 呢? 因为虽然 MLC 和 QLC 只相差一个字,但是价格却相差好几倍,就如同宝马 X1 跟 X5 的差距一样。
关于 SSD 硬盘颗粒更详细的介绍,请移步我的另一篇博客 谈一谈不同固态硬盘颗粒(SLC,MLC,TLC,QLC)的区别
# 6. 其他配件
电源:一般用长城的电源就 OK 了,节点机器 1200W 左右就可以了,算力机一般都推荐 1600W。
暴力风扇:千万别小看这小东西,建议除了节点机器和存储机,其他机器都装上。所有机器散热都是大问题,一个暴力风扇也许能解决你 GPU 和磁盘散热的大问题,直接提高你机器的封装效率。
转接卡/RAID 卡:这个也非常重要,因为一般我们的算力机器都是要插好几张 NVME 磁盘组 raid0 的,但是一般主板上都没有这么多 NVME 磁盘插槽,要通过转接卡或者 raid 卡来接入。好的 raid 和转接卡能让你的磁盘长期运行不掉速。
# 总结
Filecoin 挖矿对硬件的要求非常高,不仅要稳定,而且要高性能的持续运行,这对于整机的硬件搭配要求是非常高的。
下面贴上目前主流矿机的配置清单:
# Miner 机器
配件类别 | 型号参数 | 配件数量 |
---|---|---|
主板 | 超微 H11DSI | 1 |
CPU | AMD7402 | 2 |
散热器 | AMD SP3-2U 纯铜 | 1 |
内存 | 三星 DDR4 RECC 64G 2933mhz | 4 |
显卡 | 微星 RTX 2080Ti 涡轮 | 2 |
系统盘 | Intel 240G SATA SSD | 1 |
万兆网卡 | 单光口万兆网卡+模块 | 1 |
机箱 | 2U机箱 + 暴力风扇 | 1 |
电源 | 长城 1200W 双电源 | 1 |
# Daemon 机器(节点机)
配件类别 | 型号参数 | 配件数量 |
---|---|---|
主板 | 超微 H11DSI | 1 |
CPU | AMD7402 | 1 |
散热器 | AMD SP3-2U 纯铜 | 1 |
内存 | 三星 DDR4 RECC 64G 2933mhz | 4 |
系统盘 | Intel 240G SATA SSD | 1 |
缓存盘 | 三星 U.2 2T SSD RAID0 | 4 |
转接卡 | PCIe转U.2转接卡4盘位 | 1 |
网卡 | 10G 光口万兆网卡+模块 | 2 |
机箱 | 4U机箱 + 暴力风扇 | 1 |
电源 | 长城 1200W 双电源 | 1 |
# PC1,PC2 Worker
配件类别 | 型号参数 | 配件数量 |
---|---|---|
CPU | AMD 7542 | 1 |
准系统 | H11SSW-NT(4U 机箱、1600W 冗余电源 + 暴力风扇) | 1 |
内存 | 三星 DDR4 RECC 64G 2933mhz | 4 |
显卡 | 微星 RTX 2080Ti 涡轮 | 2 |
系统盘 | Intel 240G SATA SSD | 1 |
缓存盘 | 4T U.2 SSD 企业级(MLC) | 4 |
万兆网卡 | 单光口万兆网卡+模块 | 1 |
Raid 卡 | U.2 磁盘 Raid | 1 |
网卡 | 双口光口万兆网卡+模块 | 1 |
# Commit2 Worker
配件类别 | 型号参数 | 配件数量 |
---|---|---|
主板 | 超微 X10DRG-Q 1 | 1 |
CPU | Intel E5 2667 V4 | 2 |
散热器 | AMD SP3-2U 纯铜 | 1 |
内存 | 三星 DDR4 RECC 64G 2933mhz | 12 |
系统盘 | Intel 240G SATA SSD | 1 |
缓存盘 | 三星 U.2 2T SSD | 1 |
显卡 | 微星 RTX 2080Ti 涡轮 | 4 |
网卡 | 10G 光口万兆网卡+模块 | 1 |
机箱 | 4U机箱 + 暴力风扇 | 1 |
电源 | 长城 1600W 双电源 | 1 |
最后
回答 Filecoin 矿工常在群里问的问题:为什么别人机器配置跟我的一模一样,跑的结果却比我好这么多?
我想说的是,抛开那个别人自己优化代码
的因素不说,也许你的机器的配置只是“长”得跟人家的一样而已,内部配置可能真的不是一样的。
# 硬核广告,高能预警!!!
如果你不知道该如何下手去采购机器,或者说找不到靠谱的硬件供应商,可以联系我们。我们帮您去对接供应商,把关硬件配置,我们提供靠谱的硬件方案,然后帮您去跟供应商死磕,大到配件是否齐全,小到跳线是否插的是否正确。帮您验收机器并对配件和整机性能进行极限压力测试,确保机器配置合理,性能可靠再送到您的机房。当然,我们是要收取介绍费和测试费用的,非诚勿扰。
本站博文如非注明转载则均属作者原创文章,引用或转载无需申请版权或者注明出处,如需联系作者请加微信: geekmaster01