4.存储问题

我使用 ls 命令查看目录下的文件,可是一直停留下那里,没有显示

遇到这个问题,您可以等待一会,再重新使用 ls 命令查看目录文件。

  • 原因之一:可能是 TH-1A 的登录节点负载比较重,造成使用终端命令受到影响
  • 原因之二:可能是用户客户端的网络负载比较重,出现比较严重的网络延迟
  • 原因之三:可能是 TH-1A 系统的存储正在进行恢复调整。

执行文件操作时提示:Disk quota exceeded

原因为用户的磁盘配额已超限,天河系统针对用户的数据量和文件数量分别设有上限,可通过 lfs quota 命令查看具体信息;可通过删除临时数据来降低数据量和文件数量。命令行下输入 lfs quota -g 用户组名 /存储文件系统名 ,用于查看所在用户组的配额权限;命令行下输入 lfs quota -u 用户名 /存储文件系统名 ,用于查看所在用户的配额权限。

作业运行提示forrtl: Input/output error

可能是存储某一时刻压力较大,造成 IO 错误,请您重新提交作业。

作业运行时报错:forrtl: No space left on device,forrtl: severe (38): error during write, unit 12,但是同样的作业再次提交时可能就正常运行完成

该问题主要由文件系统中某一 OST 存储已满导致,请联系与您对接的工程师或系统管理员。Lustre 文件系统由若干 IO 服务器(Object Storage Services)和 Object Storage Targets(OST)组成。当对一个文件进行读写操作时,为了提高 IO 效率,文件系统会自动将该文件的读写操作分割成多个,在多个 OST 上并发实现,该过程也被称为 file striping。如果在该过程中,使用到的某一 OST 出现问题,就会发生读写错误。