【導(dǎo)讀】ODI最近對較舊的Teslas Model S和Model X車輛提出的信息要求突顯了工作負(fù)載疏忽,其中基于NVIDIA Tegra 3處理器和集成8GB eMMC NAND閃存的主控制單元(MCU)遇到了問題。
監(jiān)督成本| eMMC NAND閃存技術(shù)和用例需求
ODI最近對較舊的Teslas Model S和Model X車輛提出的信息要求突顯了工作負(fù)載疏忽,其中基于NVIDIA Tegra 3處理器和集成8GB eMMC NAND閃存的主控制單元(MCU)遇到了問題。當(dāng)引入新的固件更新為電動汽車(EV)帶來附加功能時,問題變得更加復(fù)雜。這充當(dāng)進(jìn)一步激發(fā)NAND閃存磨損進(jìn)度的燃料。盡管在一開始固件不是問題,并且記錄的數(shù)據(jù)具有足夠的內(nèi)存來處理工作量,但每次固件升級都帶來了新功能,從而減少了每次更新的存儲空間。應(yīng)ODI的信息請求,特斯拉列出了2,399項投訴和現(xiàn)場報告,7,777項保修索賠以及4,746項與MCU替換方案有關(guān)的非保修索賠。倒車時,故障的MCU導(dǎo)致后置攝像頭圖像顯示遺失。隨著NAND閃存全部耗盡,駕駛員不能再使用車輛的某些功能,例如HVAC(除霧),與ADAS相關(guān)可聽得見的提示音,自動駕駛儀和轉(zhuǎn)向信號燈,嚴(yán)格地來說盡管車主仍然可以駕駛車輛,但不能再充電,使汽車無法運行。
eMMC模塊因為是以NAND閃存技術(shù)為基礎(chǔ)而具有預(yù)定的使用壽命。它們具備有限的程序/擦除(P/E)周期,即使公司最初按照這些規(guī)范進(jìn)行設(shè)計,他們也必須預(yù)見到同一系統(tǒng)隨著時間的推移必須應(yīng)對不斷增加的工作負(fù)載挑戰(zhàn)。最后,這問題有三個方面。缺乏對NAND閃存技術(shù)的了解,以及對更加復(fù)雜和多面的用例了解,并且假設(shè)驅(qū)動器的使用期限完全取決于NAND閃存技術(shù)–而不是正在使用的閃存控制器。
了解NAND閃存技術(shù)
根據(jù)特斯拉維修專家的說法,由于eMMC中的NAND閃存單元結(jié)構(gòu),在較舊的Model S和X組件中發(fā)現(xiàn)的基于嵌入式NAND的eMMC磨損。在一定程度上是對的。不同類型的NAND閃存技術(shù)具有不同(但始終是有限的)的P/E周期數(shù)或他人所稱的“寫入周期”。
SLC NAND閃存技術(shù)大約10萬次P/E周期
MLC NAND閃存技術(shù)大約10 000-3500 P/E周期
TLC NAND閃存技術(shù)大約3000個P/E周期
QLC NAND閃存技術(shù)大約1000-100次P/E周期
這意味著一旦這些周期用完,驅(qū)動器將再也無法可靠地存儲數(shù)據(jù)。根據(jù)特斯拉的報告,Hynix單元“針對eMMC中每個NAND閃存塊,額定3,000個編程/擦除周期”。
要了解NAND閃存單元為何總是具備有限的P/E周期,必須了解其基礎(chǔ)技術(shù)。NAND閃存是一種非易失性存儲器(NVM)技術(shù),它通過電荷陷阱技術(shù)或浮柵MOSFET晶體管將數(shù)據(jù)存儲在制成的存儲單元陣列中。通過在晶體管的控制柵極上施加高電壓,同時將源極和漏極接地,溝道中的電子可以獲得足夠的能量來克服氧化物勢壘,并從溝道移入浮柵。在浮柵中捕獲電子的過程是閃存設(shè)備的編程(或“寫入”)操作,該操作對應(yīng)于邏輯位0。相反,擦除操作從浮柵中提取電子,從而切換存儲在其中的數(shù)據(jù)NAND閃存單元磨損,因為編程和擦除周期最終會損壞浮柵和基板之間的隔離層。這減少了數(shù)據(jù)保留,并可能導(dǎo)致數(shù)據(jù)丟失或意外編程的單元。
了解用例的工作負(fù)載
特斯拉電動汽車對于任何存儲應(yīng)用都是一個充滿挑戰(zhàn)的環(huán)境,這不僅是因為汽車質(zhì)量對溫度和功能安全性的要求,而且因為每輛汽車的使用方式都不同。在這種情況下,eMMC模塊會受到每日行駛時間,每日充電時間,每日音樂流式傳輸時間以及一系列其他因素的影響。此外,極其重要的功能和特性取決于MCU能夠可靠地執(zhí)行其工作。這個生態(tài)系統(tǒng)中的eMMC具有非常獨特的工業(yè)級工作負(fù)載,只有使用符合工業(yè)標(biāo)準(zhǔn)設(shè)計的高質(zhì)量閃存控制器才能適當(dāng)取得。
特斯拉認(rèn)為“以每塊0.7的額定每日P/E周期使用率計算,在設(shè)備中每塊平均獲得3,000個P/E周期需要11到12年的時間,以每塊 1.5的每日P/E周期使用速率的第95個百分位,在設(shè)備中平均累積3,000個P/E周期需要5到6年時間。”歸根結(jié)底,復(fù)合固件更新的苛刻性質(zhì)使這些驅(qū)動器比預(yù)期還早崩潰。這就引出了一個問題,為什么這些MCU這么早崩潰?
了解NAND閃存控制器的作用
閃存控制器在高端存儲系統(tǒng)中的作用常被忽略。在NAND閃存經(jīng)常引起關(guān)注的地方,許多人忽視了評估控制器在管理其應(yīng)用程序方面的真實能力,而所選閃存則預(yù)定義了P/E周期。盡管閃存技術(shù)在定義驅(qū)動器的使用壽命方面起著重要作用,但所選的控制器應(yīng)掩蓋閃存的所有固有缺陷,從而延長其使用壽命,確保不會出現(xiàn)任何故障設(shè)備或數(shù)據(jù)損壞。
例如,閃存控制器可以針對任何特定的存儲設(shè)備執(zhí)行最佳類型的糾錯編碼(ECC),完全取決于所選NAND閃存的特性以及控制器中可用的處理性能。在不同類型的NAND閃存中,不同類型的錯誤也更為常見,例如多層單元(MLC)中更容易出現(xiàn)讀取干擾錯誤,而其他控制器功能(如損耗均衡)和垃圾回收的時間也會受到NAND閃存中過度配置的影響。因此,控制器需要仔細(xì)匹配NAND閃存的特性,如果忽略這一點,驅(qū)動器在預(yù)測的時間之前提早崩潰也就不足為奇了。這是一項昂貴的疏忽,選擇正確的閃存控制器是設(shè)計高效可靠的存儲系統(tǒng)(如eMMC模塊)必不可少的一個部分。
歸根結(jié)底,在工業(yè)中–故障系統(tǒng)和數(shù)據(jù)損壞不像在其他市場中那樣被接受,因為期望壽命和故障成本更為急切。像eMMC模塊這樣的存儲系統(tǒng)需要針對其獨特的工作負(fù)載進(jìn)行設(shè)計,并進(jìn)行適當(dāng)?shù)墓芾?,以避免在其特定領(lǐng)域發(fā)生故障。最后,閃存控制器在掩飾所選NAND閃存技術(shù)的缺陷方面起著非常重要的作用,應(yīng)被視為核心組件,而不僅僅是NAND閃存的支援。
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請電話或者郵箱聯(lián)系小編進(jìn)行侵刪。