原標題:上海交大:基於機器學習的輕合金壓鑄關鍵工藝參數分析
隨着汽車制造技術的更新迭代,以鎂、鋁代鋼,以鑄代衝得到行業的重視。在全球雙碳政策達成基本共識的背景下,輕量化、低碳、節能得到廣泛關注。大型復雜薄壁結構件減重效果好、制造效率高,是汽車輕量化與制造高效化發展的必然趨勢,當前超大型一體化集成設計產品正在被各主機廠開發和應用。高壓鑄造作爲大鑄件高效成形方法之一也存在若幹技術壁壘,與傳統壓鑄件合格率(90%以上)相比,大鑄件成品率僅有50%~70%。大型薄壁一體化壓鑄件在壓鑄過程中,存在鑄件各部位鑄造條件不均勻、影響鑄件品質的因素衆多(30~50種)、參數與質量間的映射關系復雜高維等問題,很難通過傳統的“經驗+試錯”法來對鑄件質量進行精確的預測與控制。隨着現代信息技術與人工智能的發展,基於數據驅動的機器學習方法已經逐漸融入先進材料研究與制造過程,推動了材料制造智能化的發展。在輕合金研發與制造領域,多項研究證明了機器學習在建立材料“參數-性能”關系的有效性,但這些研究大多基於少量樣本和參數的簡單制造方法,無法適用於工藝參數衆多、影響因素復雜的大型一體化壓鑄的實際工業制造過程。針對此問題,本研究建立基於工業壓鑄生產線的“壓鑄工藝參數-鑄件下線質量”關系大數據庫,通過大數據驅動的機器學習的方法建立鑄件質量預測模型,獲得15種壓鑄關鍵工藝參數與鑄件品質的影響權重排序,爲大型一體化壓鑄過程智能控制提供參考。
圖文結果
爲了建立壓鑄工藝參數與鑄件質量之間的大數據預測模型,通過制造執行系統(MES)採集與記錄了2452條經過異常值去除的鋁合金前機艙壓鑄生產線數據樣本,並通過Matlab軟件提取相關工藝參數形成數據集,數據集結構見圖1。每一條樣本由27個壓鑄機本體工藝參數(模型輸入)與1個鑄件質量等級(模型輸出)組成。工藝參數由壓鑄機集成的傳感器採集,直接匯入工廠MES系統;質量等級爲鑄件下線後由人工檢查鑄件表面各類缺陷後判斷所得的等級,人工輸入MES系統。質量等級分爲0、1、2,其中0級代表報廢,即該鑄件外觀缺陷較爲明顯、數量較多,不滿足合格標準,下線後直接淘汰;1級代表待定,即鑄件外觀缺陷數量中等,需要通過後續檢驗來確定是否淘汰;2級代表合格品,即外觀缺陷較少,符合產品合格標準。採用MySQL數據庫軟件對數據集進行儲存與檢索。
爲了降低冗餘參數或者噪音參數對模型預測準確性產生影響,需要首先對工藝參數進行篩選與降維。主成分分析(PCA)等降維算法是應對維度爆炸的常用方法,但經過主成分分析後的特徵可解釋性較差,難以分析不同工藝參數在壓鑄過程中所產生的影響。因此,本研究結合專家經驗與數據波動分析對27個工藝參數進行預篩選降維,在消除冗餘特徵與噪音過大參數的同時保持可解釋性。經過預篩選後,選用與鑄件品質相關程度較高、數據分布較爲優質的15個工藝參數進行機器學習訓練集的建立,見表1。
圖1 壓鑄大數據集結構
表1 篩選後的壓鑄工藝參數
本研究通過Matlab R2021a軟件中集成的K近鄰、支持向量機、袋裝樹以及BP神經網絡模型對數據集進行訓練與測試,並通過超參數調節,分別獲得了各模型最優的訓練結果。模型超參數與預測準確率見表2。可以看出,4種模型均能獲得極高的訓練集準確率,表示此4種機器學習模型均具備極高的高緯度非線性分類能力。但是K近鄰、支持向量機以及BP神經網絡3個模型的測試集準確率卻非常低下,產生了較爲嚴重的過擬合,缺乏對未知數據的泛化推廣能力。相對而言,袋裝樹模型的測試集準確率達60.9%,泛化能力顯著高於其他幾種機器學習模型。袋裝樹模型屬於集成學習方法的一種,原理見圖2。該模型利用多個決策樹模型(Decision Tree)分別對多個子數據集進行訓練學習,通過投票的方法進行袋裝(Bagging),將多個準確率低下的弱分類器組合成一個具有較強準確率的強分類器。和BP神經網絡、支持向量機等單分類器模型相比,集成算法有效減少了數據波動的隨機性與高噪聲所帶來的準確率下降,也減少了過擬合的風險,從而提升了模型總體預測準確性與泛化能力。因此,本研究選擇具有最優預測能力的袋裝樹模型作爲關鍵工藝參數分析的預測模型。
表2 不同機器學習模型的超參數設置與模型預測準確率
圖2 袋裝樹模型原理示意圖
圖3 袋裝樹模型訓練損失與決策樹數量的關系曲線
表3 測試集混淆矩陣
通過對數據集進行均值與歐氏距離計算,可以獲得3類數據的等效半徑以及兩個類均值中心之間的間距,見表4。R0、R1、R2分別代表報廢、待定、合格3類鑄件的工藝參數的等效半徑,D01、D02、D12分別代表3類鑄件工藝參數均值中心之間的距離。顯然,3類的等效半徑均大於3個中心間距,說明3類數據之間存在較大的重疊區域,分類模型若要獲得較高的訓練集準確率,則需要對重疊區域數據進行細致分割,一定會產生嚴重的過擬合現象,導致模型對於已知訓練集的預測能力極強,而對於未知樣本的泛化推廣能力較爲薄弱。由於鑄件品質不僅受到壓鑄機本體的27個主要工藝參數的影響,同樣受到模溫機、真空機、噴塗設備、點冷機等多個周邊設備上衆多工藝參數的影響,忽略這些因素是導致數據分布產生缺陷的主要原因。若需要進一步有效提升模型預測性能,則必須將壓鑄周邊設備的重要工藝參數進行集成,建立更復雜更龐大的預測模型。然而,這些周邊設備的工藝參數衆多,可達800個以上,目前尚未有完善的方法來對這些工藝參數進行集成分析與降維,是未來對於壓鑄智能化控制領域將要面對的主要挑戰與重要研究內容。
表4 數據集類聚中心間距與類等效半徑
(a)相對重要度 (b)靈敏度圖4壓鑄關鍵工藝參數重要性分布圖
結論
(1)以鋁合金大型薄壁壓鑄件生產線中獲取的工業大數據爲研究對象,通過袋裝樹方法建立了壓鑄關鍵工藝參數與鑄件下線質量之間的多參數映射模型,可以初步實現對前機艙等壓鑄件進行下線質量初篩,減少人工成本。模型的訓練集預測準確率爲100%,測試集準確率爲60.9%,測試集容忍準確率爲77.3%,報廢、待定和合格3類鑄件預測的容忍真正率(TTPR)分別爲80.6%、68.3%、84.4%。
(2)通過相對重要度與靈敏度的計算,獲得了15種壓鑄關鍵工藝參數對鑄件品質影響程度的大小,爲大型薄壁壓鑄件壓鑄工藝參數的優化與控制策略提供參考。
本文作者:
王鑫 汪星辰 彭立明 付彭懷上海交通大學材料科學與工程學院輕合金精密成型國家工程研究中心
本文來自:《特種鑄造及有色合金》雜志,《壓鑄周刊》戰略合作夥伴