内地超算有待提高的方面

我仅使用过为数不多的几个超算,体验难免偏颇,以下建议仅供参考。

  1. 内地超算缺少文档,主要依靠客服人员解决客户的问题,依靠这种模式发展新用户的边际成本高,导致超算对小用户不够友好。国际上做得比较好的有爱丁堡大学的Cirrus(https://cirrus.readthedocs.io/en/master/index.html)、加拿大的国家超算中心Compute Canada(https://docs.computecanada.ca/wiki/Compute_Canada_Documentation),不胜枚举。这两个文档显然不是世界一流的超算中心开发的,这是任何一家超算中心都应该有的文档。
  2. root等管理员权限管理混乱,官僚作风严重。普通用户希望申请安装某些运维工具如htop,连提交工单的入口都没有,直接对接用户的运维人员也没有申请root权限的途径。而拥有root权限的管理员却连module都配置不好,module中有失效条目,还有临时的测试版本,配置地十分随意。可见拥有root权限的管理员,毫无服务意识,肆意妄为,
  3. 不兼容国际主流工具,自主研发的解决方案又不够透明。国际主流的作业管理系统是slurm,国家超算中心用了自主开发的作业管理系统yhlurm,把里面所有命令开头的s换成了yh,导致无法兼容大量的slurm配置文件,徒增用户成本。yhlurm同样没有文档,也没说明yhlurm和slurm的区别,更没有版本控制工具的修改记录,比如git的commit history,用户只能参考slurm的文档,把使用slurm的经验简单迁移到yhlurm。世界通用的远程登录协议是ssh,内地某些超算却要加上奇怪的封装,增加了用户对安全性的顾虑,也增加了用户的学习成本。
  4. 不尊重用户的偏好。某些超算不允许用户自己设置linux系统的用户名,不允许用户使用自己的密钥;不提供zsh,无视用户的个性化需求,总是要求用户适应机器。
  5. 工作人员安全意识淡薄。比如明文传输私钥。用户的项目可能没有保密要求,用户也不应该把敏感数据放到超算上,但任何有安全意识的用户看到这种行为,难免会质疑服务提供者的专业性。
常恭

作者: 常恭

略懂 OpenFOAM

发表评论