Press "Enter" to skip to content

三星 980 500 GB 的温度问题

我最近安装了一个PVE,使用的是三星的SSD 980 500GB,几乎间隔一天就会收到我的pve的告警邮件,提示我SSD的温度过高。

This message was generated by the smartd daemon running on:

   host name:  pve
   DNS domain: xiaocaicai.com

The following warning/error was logged by the smartd daemon:

Device: /dev/nvme0, Critical Warning (0x02): Temperature

Device info:
Samsung SSD 980 500GB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
The original message about this issue was sent at Thu May  8 15:37:56 2025 CST
Another message will be sent in 24 hours if the problem persists.

在网上查了些资料,似乎这个固态硬盘确实有这个问题,需要升级固件:

https://www.reddit.com/r/homelab/comments/zeyb5m/temperature_problem_with_samsung_980_500_gb/?tl=zh-hans

以下摘自论坛:

我的 980 的 1TB 版本也有同样的问题。

你的硬盘运行的固件和我的一样,这里有一个新版本:

https://semiconductor.samsung.com/consumer-storage/support/tools

我还没来得及安装新的固件,但我希望它能有所帮助。 有人知道 3B4QFXO7 版本是否修复了这个问题吗?

我这儿 500GB 的模块也遇到同样的问题。温度传感器 1 报告 84 摄氏度,温度传感器 2 报告 19 摄氏度 (!)

nvme smart-log /dev/nvme0n1
NVME 设备的 Smart Log:nvme0 命名空间 ID:ffffffff
critical_warning                        : 0x2
temperature                             : 84 摄氏度 (357 开尔文)
available_spare                         : 100%
available_spare_threshold               : 10%
percentage_used                         : 0%
endurance group critical warning summary: 0
data_units_read                         : 33,506
data_units_written                      : 108,523
host_read_commands                      : 406,587
host_write_commands                     : 991,971
controller_busy_time                    : 4
power_cycles                            : 15
power_on_hours                          : 7
unsafe_shutdowns                        : 3
media_errors                            : 0
num_err_log_entries                     : 0
Warning Temperature Time                : 279
Critical Composite Temperature Time     : 0
Temperature Sensor 1           : 84 摄氏度 (357 开尔文)
Temperature Sensor 2           : 19 摄氏度 (292 开尔文)
Thermal Management T1 Trans Count       : 0
Thermal Management T2 Trans Count       : 608
Thermal Management T1 Total Time        : 0
Thermal Management T2 Total Time        : 14086

我用的固件版本和你一样:

nvme list
Node                  SN                   Model                                    Namespace Usage                      Format           FW Rev
--------------------- -------------------- ---------------------------------------- --------- -------------------------- ---------------- --------
/dev/nvme0n1          S64DNX1T508607R      Samsung SSD 980 500GB                    1          19.66  GB / 500.11  GB    512   B +  0 B   2B4QFXO7

现在,几分钟后,两个温度传感器一致了:

Temperature Sensor 1           : 20 摄氏度 (293 开尔文)
Temperature Sensor 2           : 19 摄氏度 (292 开尔文)

感谢这个帖子和 u/ObiWanKenobody 我找到了 3B4QFX07 固件。

这太搞笑了。我刚挂载了固件 iso 文件,结果是个 isolinux 的东西 😀

我刚更新了固件。看起来是成功了,因为现在两个传感器的温度差在1-2摄氏度以内。

温度传感器1:21摄氏度(294开尔文)
温度传感器2:20摄氏度(293开尔文)

现在我用U盘更新了。咱们过几天看看。

固件版本:3B4QFXO7

固件升级参考资料:

https://www.bilibili.com/opus/810692025078775824

下载固件:https://semiconductor.samsung.cn/consumer-storage/support/tools/

我的是980固态,下载的是:

https://download.semiconductor.samsung.com/resources/software-resources/Samsung_SSD_980_3B4QFXO7.iso

帮固件iso放到我们的ventoy优盘,用固件启动。

然后会显示这个,等一会自己会跳转,等很久不跳转就按一下回车键。

然后会显示这个,等一会自己会跳转,等很久不跳转就按一下回车键。

按任意键继续

按y回车

  • 按完y,还会在提醒WARNING 加一段英文大意是让你备份固态上的数据。
  • 再输入“y”按一下回车
  • 等待更新完成电脑自动重启就可以了。
发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注