建议您调整客户端实例以获得最佳性能,可以进行以下配置达到更好的性能表现:
修改网络超时时间为2秒,网络异常时快速切换。
echo 2> /sys/module/ko2iblnd/parameters/timeout
对于超过8个 vCPU 核心的客户端实例类型,可以通过增加CPU分区,获取更好的性能。
echo 'options libcfs cpu_npartitions=4' >> /etc/modprobe.d/lustre.conf echo 'options libcfs cpu_pattern=""' >> /etc/modprobe.d/lustre.conf
对于内存超过64 GiB 的客户端实例类型,我们建议应用以下调整:
sudo lctl set_param ldlm.namespaces.*.lru_max_age=600000 sudo lctl set_param ldlm.namespaces.*.lru_size=<100 * number_of_CPUs>
对于超过64 个 vCPU 核心的客户端实例类型,我们建议应用以下调整:
echo "options ptlrpc ptlrpcd_per_cpt_max=32" >> /etc/modprobe.d/modprobe.conf echo "options ksocklnd credits=2560" >> /etc/modprobe.d/modprobe.conf # reload all kernel modules to apply the above two settings sudo reboot
挂载客户端后,需要应用以下调整:
sudo lctl set_param osc.*OST*.max_rpcs_in_flight=32 sudo lctl set_param mdc.*.max_rpcs_in_flight=64 sudo lctl set_param mdc.*.max_mod_rpcs_in_flight=50
请注意,已知 lctl set_param 重启后不会继续有效。由于无法从客户端侧永久设置这些参数,因此建议实施启动 cron 作业,使用推荐的调整来设置配置。