Filecoin运维背后的超级机器人_币世界+IPFS原力区

2020-10-09 15:32 栏目:行业动态 来源:网络整理 查看()

Filecoin的挖掘难度早就得到业界的认可,但是这些难度体现在哪里呢?太空竞赛结束后,为什么Filecoin矿工背后的运维能力如此被业界看重?Filecoin的挖掘难度早就得到业界的认可,但是这些难度体现在哪里呢?太空竞赛结束后,为什么Filecoin矿工背后的运维能力如此被业界看重?

在第142届部队开放日,我们特别邀请了IPFS部队区的资深运维工程师进行深入学习,以“Filecon运维背后的超级机器人”为主题,分享了Filecon运维的相关内容。

Filecoin运维背后的超级机器人_币世界+IPFS原力区

作为IPFS部队区高级运维工程师,我参与过Filecon各个阶段的运维工作,包括Filecon开发网、测试网一期、测试网二期、空间竞赛等。

分享中强调,Filecoin挖掘是整个数字资产领域中最难的挖掘模式之一,主要体现在它对网络、磁盘、CPU、内存等的要求非常高。稍有不慎就可能面临不挖块被处罚的情况。对于Filecoin运维工程师来说,部署更新和稳定运维是最重要的两个环节,也是最棘手的一条路。

难点一:部署更新

在部署方面,Filecoin运维项目面临的困难包括:机型多、配置杂;程序角色多,配置和启动方式不同;服务器数量巨大;需要高可用性架构来实现程序的不间断运行等等。

为了充分发挥Filecoin矿用设备的性能,Filecoin运维工程师需要根据设备的不同磁盘容量、CPU性能、内存大小等进行合理化配置,实现多角色程序的流畅连续运行。

然而,计算能力的提高仍然需要设备的不断投入。随着不同规格设备的日益增多,如何处理大量设备的调配管理成为运维团队的一大难点。

Filecoin运维背后的超级机器人_币世界+IPFS原力区

在这方面,多文介绍了一些基本的解决方案,供社区参考:

针对设备配置混乱的情况,利用配置管理工具对所有设备配置信息进行捕获和组织;

将集群的配置信息输入数据库;

基于上述两个工具,IPFS部队区自行开发的更新部署调度程序用于统一协调管理和自动配置部署。

自动调配的好处是可以大大降低人力管理成本,提高效率。但是部署只是第一步,后期的稳定运维也是一个很大的难度。

难点二:稳定运维

众所周知,Filecoin对矿工节点有严格的要求。为了增加它的计算能力,需要完成文案,完成WinningPoSt,为了避免被惩罚,需要每天完成WindowPoSt。如何保证设备的稳定运行并完成相关认证是Filecoin运维工程师面临的另一大挑战。

基于丰富的运行维护经验,多文在这方面做了详细的分析:

计算能力的稳定性主要与WindowPoSt有关。Filecoin系统将每天分为48个窗口期,矿工需要每半小时完成一次WindowPoSt。一旦矿工有不稳定的块高同步、不稳定的扇区计算时间、不稳定的消息上行,就有可能无法按时完成WindowPoSt,导致计算能力的惩罚和抵押品的扣款。

在太空竞赛的第一阶段,许多矿工的计算能力因新闻拥堵和无法上传新闻而下降。针对上述影响因素,我分享了一些解决方案:

采用高可用的部署架构,检测到高异步后切换到备用操作。大型集群部署多个备用节点,通过自动切换功能,在一个节点出现异常后,立即切换到另一个正常节点同步高度。

优化存储性能,优化扇区读取模式,并通过提高读写并发性来减少读写时间。这样做的好处是可以为计算留出更多的时间

添加了消息验证机制,当发现消息没有向上链接时,会自动重新传输消息。目前Filecoin网络没有消息上行失败的提醒,30分钟后只会收到计算能力受到惩罚的提醒。为了保证消息的正常上传,需要添加一个自制的工具来验证消息是否上传成功。如果不成功,请及时重新发送消息。

保证了计算能力的持续稳定,按时完成WinningPoSt也很重要。WinningPoSt要求矿工在获得格挡权后30秒内完成扇区读取、计算和消息上传,更为紧迫。

以上针对WindowPoSt的解决方案也适用于WinningPoSt,以保证输出块的稳定性。

服务器压力大,容易异常

很多报道提到的另一个问题是,在节点运行过程中,服务器会因为压力过大而出现异常,也会影响挖掘收益。

如前所述,Filecoin挖掘需要多个角色来完成多个任务,这意味着磁盘、网络、计算等设备资源可以协同工作。这个过程中容易出现的问题有:挖掘程序对性能资源的过度占用导致进程阻塞,设备长期运行的故障率增加,并发任务多导致资源争用等。

为了最大限度地提高设备资源的利用率,最大限度地提高生产能力,多文提出了以下解决方案:

资源隔离,确保挖掘程序不影响系统进程的运行。这样虽然给服务器预留了一些资源,但是经过充分测试,挖掘效率最大化。

加强服务器硬件,通过网络监控及时发现异常;

收集各个阶段的任务需要时间,及时发现加班任务。例如,统计收集扇区封装阶段的时间,以形成报告分析并协调资源。

基于多年的技术沉淀和实践经验,IPFS力区的工程师们将上述所有解决方案整合在一起,形成了“定风珠”,一个用于Filecoin运维的精细化管理平台。通过固定风珠,运行维护工程师可以了解整个矿井水池的运行状态,及时发现问题并进行处理。

Filecoin运维背后的超级机器人_币世界+IPFS原力区

分享的最后强调,Filecoin矿业需要支付的不仅仅是硬件和设备的成本,还有运维人员24小时不间断维护的人工成本。本次分享的主要目的是帮助Filecoin挖掘参与者更好地加入这个生态,共同推动分布式存储行业的发展。

微信二维码
售前客服二维码

文章均源于网络收集编辑侵删

提示:仅接受技术开发咨询!

郑重申明:资讯文章为网络收集整理,官方公告以外的资讯内容与本站无关!
NFT开发,NFT交易所开发,DAPP开发 Keywords: NFT开发 NFT交易所开发 DAPP开发