36氪專訪 | 富士膠片記錄媒體事業部總經理駱琤:用磁帶存儲冷數據,富士膠片能做到單盤580TB容量
文|韋雯
編輯|彭孝秋
雖然膠片已離開了大眾視野,但富士膠片并沒有像柯達一樣徘徊在膠片時代。富士膠片將膠片時代累積的銀鹽、納米等技術,應用到新產品的開發,例如高性能材料、護膚品、醫療器械、數據磁帶等。
據36氪了解,富士膠片旗下的東京西南部工廠中,仍在生產磁帶。這款磁帶,不再是以往的錄音帶、錄影帶,它已經被廣泛應用于企業云端冷數據。
在國內市場,磁帶早先只應用于影視、金融等行業。駱琤在2017年加入富士膠片(中國)投資有限公司記錄媒體事業擔任總經理后,開始探索磁帶在新興行業中的應用。“僅依靠SSD和硬盤無法保障數據安全和低存儲成本。”生產磁帶成了一門‘新生意’。3年時間,富士膠片記錄媒體的銷售規模提升近5倍。
對于云端冷數據的具體應用,主要體現在存儲冷數據和冰數據。目前,熱數據只占數據量的20%,剩下80%數據是冷數據和冰數據。未來機器學習、數據分析將對這80%數據進行深度挖掘,因此它們需要被長期保存。
為了更清楚了解這門新生意背后的邏輯,36氪近日對富士膠片記錄媒體事業部總經理駱琤進行了專訪。他將從幾個方面進行解答:如何挖掘磁帶這門“新生意”?富士膠片有哪些新技術?磁帶存儲的優勢是什么?
冰山理論
磁帶這門“新生意”
駱琤在加入富士膠片前,沒太關注數據磁帶。加入富士膠片之后他發現,數據磁帶主要應用在電視臺、銀行保險、通訊以及能源行業,基本沒有市場宣傳,即使從事數據存儲工作,幾乎對數據磁帶一無所知。
他發現,在國內云存儲市場,數據磁帶存儲解決方案的地位被低估了。其實,在海外市場,數據磁帶早已被廣泛應用于云服務商,例如谷歌、微軟和亞馬遜。
“大部分人并不知道富士膠片是數據磁帶生產廠商,也不知道數據磁帶單盤容量每年以超過30%的速度提升,關鍵因素是富士膠片專利技術——鋇鐵氧體顆粒。”
駱琤的市場策略是在成熟市場深挖需求,在新興市場探潛在需求。在成熟市場里(影視行業、金融行業、通訊電信以及能源行業等),突出富士膠片磁帶存儲數據擴容的優勢。在新興行業加入生態圈,同磁帶存儲的硬件廠商加強整體集成方案上的配合,與有潛在需求的用戶直接溝通,并把需求轉化為實際案例。
駱琤向36氪介紹了一個典型案例,通過和硬件廠商合作,與百度使用部門持續溝通,富士膠片磁帶已經應用于百度智能駕駛,用于儲存傳感器數據和控制數據。公開資料顯示,對比先前存儲方案,運用數據磁帶后,百度智能駕駛總擁有成本(TCO)迅速下降了85%。
富士膠片的磁帶技術
富士膠片的磁帶離不開其膠片時代累積的技術。基于納米立方技(NANOCUBIC)和鋇鐵氧體技術,富士膠片的磁帶可以做到磁性顆粒更小,精度和準確性同步提高。
對比上一代產品,FUJIFILM LTOUltrium 9數據流磁帶產品(以下簡稱LTO9)的磁顆粒尺寸從35-45納米縮小為10-20納米,以12.65mm的磁帶寬度記錄在8960條數據軌道上,實現了最大記錄容量45TB(未壓縮時18TB)。LTO9以每秒400MB的高速傳輸速率(數據壓縮情況下,可達1000MB每秒),比其他存儲系統快20%。
富士膠片LTO9產品
富士膠片的磁帶存儲容量還可以做到更大。2020年底,IBM和富士膠片共同發布了單盤容量580TB磁帶產品,這款磁帶用到富士膠片最新顆粒研發成果“鍶鐵氧體”,顆粒尺寸相較于“鋇鐵氧體”縮減了60%。
存儲冷數據,磁帶介質具備天然優勢。云服務商之間的競爭在于云空間租用價格,租用價格同存儲設備和運維成本直接相關。在存儲設備方面,使用磁帶解決方案可以降低企業采購驅動器成本。據駱琤介紹,與其他存儲系統不同的是,一臺磁帶驅動器可以對應幾百盤磁帶,大幅降低企業采購驅動器的成本。
在運維成本方面,相比SSD和硬盤,使用磁帶更省電。SSD和硬盤系統需要全天在線運行,磁帶存儲系統只在需要連線時才消耗電力,能耗僅為硬盤的2-5%。
磁帶還可以幫助云服務商解決數據安全問題。就存儲能力而言,LTO9磁帶壽命預計超過50年。另外,若云服務遭遇意外中斷或人為侵害,磁帶存儲還扮演了事先備份角色,防止系統崩潰、數據丟失,避免病毒侵襲和黑客攻擊。
如何讓離線數據存儲更方便?富士膠片順應“軟件定義存儲”的行業趨勢,推出了對象歸檔軟件,這款軟件使用行業標準AMAZON S3兼容API,通過新型的磁帶格式—OTFormat,使本地對象存儲能夠以最低的成本實現與云存儲相同的可操作性。
結合磁帶存儲和對象歸檔軟件,無論是單一數據中心,還是多地數據執行,富士膠片可以實現類似于AMAZON GLACIER,對數據進行簡單長期的保管。據駱琤介紹,在現有存儲的基礎上,企業使用此方案能夠免除數據外運費用,解決云數據回遷的困擾。
更低碳
駱琤認為,磁帶是一門長久的生意。“中國區記錄媒體市場規模與中國大數據存儲市場緊密結合。”
2020年始,視頻、電話會議成為常見的溝通方式。近幾年,我們所創造的數據量遠遠大于新冠疫情前,需要被存儲的數據隨之增加。更多智能化技術也隨之出現,比如遠程醫療、體溫監測、人臉識別、行程分析、在線網課以及虛擬現實。這些新興技術需要大量數據積累,一方面為機器學習做好準備,另一方面作為歷史回溯的歸檔。
值得注意的是,我們雖受益于數據,但同時,大型數據中心運營商卻是能耗大戶。IDC研究顯示,企業數據存儲以27%的復合年增長率增長,數據量大約每三年翻一番。據駱琤介紹,從全球來看,數據中心消耗了大約2%的電力,到2030年有可能上升到8%。從國內來看,數據中心的耗電量已連續8年,以超過12%的速度增長。2017年,國內數據中心總耗電量達到1200-1300億千瓦時,超過三峽大壩和葛洲壩電廠發電量之和(約1000億千瓦時)。
磁帶是更低碳的存儲方式。LTO磁帶存儲設備在數據保管方面,比硬盤驅動器(HDD)減少95%的CO2排放量。根據IDC的預測,通過將數據的保存地點轉移到LTO磁帶上,可對環境產生積極影響,預計到2030年可累計削減碳排放43.7%,約6億6400萬噸,這相當于1.44億輛乘用車一年的溫室氣體排放量,8000萬個家庭一年的能源使用量。
“疫情持續下,企業希望縮減費用,與此同時,數據量因為疫情急劇增長,關鍵數據需要以環保方式安全保管。”駱琤認為,無論是合理地降低TCO(總擁有成本),還是確保符合數據中心PUE(能源使用效率),磁帶存儲是最優解。