作者 Cubelia (大胸智乃)標題 Re: [請益] 2t 遊戲用SSD選擇時間 Thu Mar 20 01:35:01 2025
好讀
https://www.ptt.cc/bbs/PC_Shopping/M.1742405705.A.8F7.html
先幫樓主拍拍,三爽v6真的雷自己就算了還雷到別人
現在SSD貴森森也只能送修,奇妙的是創見還允許用戶拒用三爽顆粒XD
以下99%內容都是腦補出來的,請看看就好
=
研究了一下樓主flashid給出來的資料,這是很有研究價值的東西
不過裡面的數據並不能完全相信
1.未有官方解釋 2.幾乎只能靠字面意義來推敲,縮寫也很難懂
而且很多的數值都是空的(-1或0),單位更不用說
看到有fail之類的不要自己嚇自己,也別拿這個去和原廠盧,就當參考用
進入主題
一. smi_nvme_flash_id.txt
https://i.imgur.com/EMhw8Bg.png
1.三星v6 136L TLC顆粒、原廠測試壞塊19個、三星D4 DRAM
(創見到底三爽DRAM庫存壓多深==)
2.搞不懂FBlock意思
這是我們看flashid最主要的檔案,上面會有控制器、韌體、顆粒等資訊
精華是下面的遙測(telemetry)數據,這些是控制器所記錄的內部資料
由於NVMe SMART項目都標準化
只能從遙測看以前SATA SSD能看出的ECC、重定位、壞塊資料
而台廠群聯和慧榮的資料剖析方式都有被攻破了
(螃蟹、英韌、聯芸我沒有玩過,所以不知道有無相關資料)
下面的遙測(不同控制器項目會較少,或是可解讀項目不同)
https://i.imgur.com/waNbtUj.png
ECC理論順序為硬LDPC=>(read retry)=>軟LDPC=>RAID ECC
向右修正能力越強但越費時間,SMI整套稱為NANDXtend技術
硬LDPC解碼不行的話就得...
1.TLC read retry(重讀)
重讀就是來回調整電壓看能不能讀出正確數據
2.ECCUnc(軟LDPC失敗)
重讀也不行就得用軟LDPC,耗時較大
正常來說多少會出現的,切勿慌張,因為還有RAID ECC這招
3.重定位和XOR Fail都有相同數值
XOR就是奇偶校驗,也是RAID ECC的原理之一
猜測RAID ECC為最後防線,可以理數值和重定位次數相同
連RAID ECC也沒有辦法就宣告無法恢復了,也就出現ECC錯誤事件
這是我最近從網拍買的MTE220S 512GB(美光/Spectek AS等級96L TLC)
可以看到僅軟LDPC失敗有紀錄,RAID ECC無失敗紀錄
https://i.imgur.com/0hvjNfY.png
實際沒跳0E
https://i.imgur.com/TP3i0L2.png
自用了超過五年的MTE220S 512GB(美光/自封64L TLC)
這條用比上面那條還久,沒想到都沒軟LDPC失敗,可能64L舊顆粒體質更好
https://i.imgur.com/I1nFUWz.png
實際也沒跳0E
https://i.imgur.com/7moRYcT.jpeg
-
二. 至於smi_nvme_flash_id_ec.txt這個是顆粒的磨損值
ec應該為Erase Count(抹除次數),裡面的BAD數量可對應前述19個壞塊
三. smi_nvme_flash_id_smart.txt就單純的NVMe SMART數據
用CrystalDiskInfo也能見到
不過下面有溫度警告的統計次數
四. 那真的壞掉的案例呢?
之前有板友tyf99用Klevv C720爆0E的案例,今天終於能當教材了
phison_e12_flash_id_ec.txt
前面提過這是顆粒的磨損數據
https://i.imgur.com/AVGmBIq.png
可以看到有一整排BAD,這個就是"1片"晶片壞掉
群聯的數據可以看到單獨的晶片,慧榮的好像不行
(正常來說一定都有壞塊的,但不可能這樣整欄BAD,請不要拿這個和客服盧)
phison_nvme_flash_id_smart.txt也有顯示ECC錯誤,包含RAID ECC也沒救
https://i.imgur.com/zxFf1bq.png
SSD外觀顆粒內部是好幾片晶片疊起來
你能看到M.2 2230 TLC用一顆2TB,裡面其實就高達16片NAND Flash晶片
當然SSD正反面貼那麼多顆,全部加起來也會有很多片晶片
--
姊姊 姊姊 我們好像變成簽名檔了
雷姆 雷姆 好像真的是這麼一回事呢
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.255.51.22 (臺灣)
※ 作者: Cubelia 2025-03-20 01:35:01
※ 文章代碼(AID): #1dsm19Zt (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1742405705.A.8F7.html
推 knight714: 這件事最搞笑的是我上個月有打開軟體看過 那時候0E還是0
這次出問題一看0E直接變成22萬1F 111.251.226.109 台灣 03/20 01:42
炸翻XD
推 E7lijah: 推4F 27.242.4.13 台灣 03/20 01:43
推 Depthsharky: 0E不一定吧
我自己體感上使用出問題了 讀出來是0後續讀不到硬碟 重裝重灌 就讀出來5F 36.228.215.40 台灣 03/20 01:44
個人理解是位於故障區域的資料被用戶操作動到,確認ECC錯誤後才會記錄下來
所以有些三星SSD是用魔術師工具箱"完整掃描"才爆出0E
不然就得等控制器主動refresh碰到
我其實很想寫一篇用Linux nvme-cli自我檢測SSD的文章,但都懶得寫
※ 編輯: Cubelia (111.255.51.22 臺灣), 03/20/2025 01:54:36
推 tn601374: 還好都買金金 fury9F 1.164.209.85 台灣 03/20 02:54
推 BlackCoal: 推10F 111.242.188.174 台灣 03/20 06:11
推 jack61031: 超硬知識推一個11F 220.138.192.93 台灣 03/20 10:36
推 arenoe: 推12F 27.52.99.195 台灣 03/20 12:27
推 Lemming: 存資料時後面都會加較驗 SSD跟HDD都一樣因為有bit error rate這種東西
不加下次拿出來的時候不知道有沒有錯
但加的位元數有限不然浪費空間
所已有Uncorrectable BER的概念
SSD一般15次方分之一 企業級17次方
比同級的HDD好太多了
所以讀取校驗時才會發現錯誤
平常沒碰到沒事 我是隔壁看到TEAM客服
在那邊亂回才想起細節的 我大學專題(EE)做過光纖的BER 道理都類似
其實量夠大都會出現錯誤 但是這次一堆
廠商在那邊誤導 把那種量太大跳出幾個
機率上發生的那種 拿來當成拒絕理由
拜託 他們跳得像是有做到15次方喔幹13F 1.170.167.122 台灣 03/20 18:34
→ Cubelia: 消費級HDD是14次方分之一,再上去15次方就NAS、企業級等規格了28F 111.255.51.22 台灣 03/20 19:38
--