Activities
【導(dǎo)讀】2024年7月2日,由中國科學(xué)技術(shù)協(xié)會、廣西壯族自治區(qū)人民政府主辦,中國自動化學(xué)會承辦的第二十六屆中國科協(xié)年會通用大模型未來演進路線——數(shù)據(jù)、算力、算法論壇在廣西南寧召開。會議特別邀請中國自動化學(xué)會副理事長、青島科技大學(xué)副校長、上海交通大學(xué)教授李少遠,作了題為“工業(yè)大數(shù)據(jù)的知識表達和利用”的主旨報告。報告詳細介紹了工業(yè)大數(shù)據(jù)、知識圖譜與知識嵌入技術(shù)的深度融合與創(chuàng)新,指出了工業(yè)大數(shù)據(jù)、知識圖譜與知識嵌入技術(shù)的協(xié)同發(fā)展將為工業(yè)4.0時代的企業(yè)構(gòu)建起強大的認知基礎(chǔ)設(shè)施,實現(xiàn)從數(shù)據(jù)到知識,再到智慧決策的無縫轉(zhuǎn)化,開啟一個高度自治、高效協(xié)同與可持續(xù)發(fā)展的智能制造新時代。
關(guān)于工業(yè)系統(tǒng)的應(yīng)用,特別是流程工業(yè),我國已在全球占據(jù)了重要地位。從現(xiàn)狀來看,我國流程工業(yè)中的許多設(shè)備和軟件并不落后,甚至在某些方面處于領(lǐng)先地位。然而,如何真正發(fā)揮這些設(shè)備和軟件的效益,充分利用其優(yōu)勢,仍然存在諸多問題。一個主要問題是操作經(jīng)驗和人類知識的積累和利用。盡管我國購買了大量的先進過程控制(APC)軟件,但許多工程師由于擔心出錯,往往不敢輕易調(diào)整和使用這些軟件。這導(dǎo)致了軟件的實際效益未能得到充分發(fā)揮。同時,某些廠家的運行情況非常良好,積累了豐富的經(jīng)驗。然而,這些寶貴的運行經(jīng)驗?zāi)芊裨谛袠I(yè)內(nèi)得到廣泛分享,成為一個關(guān)鍵問題。如何有效地利用和推廣這些先進的經(jīng)驗,對于提升整個行業(yè)的運營水平至關(guān)重要。
因此,我們需要深入研究并解決這些問題,確保先進設(shè)備和軟件的最佳利用,促進經(jīng)驗共享,從而實現(xiàn)我國流程工業(yè)的持續(xù)發(fā)展和優(yōu)化。
一、工業(yè)系統(tǒng)的數(shù)據(jù)與模型
催化裂化流程是一個復(fù)雜的工業(yè)生產(chǎn)過程,涉及物料流、能量流及其他多種流體的混合。這一過程不僅在工藝上復(fù)雜,且運行過程中產(chǎn)生的數(shù)據(jù)非常豐富,尤其是在短周期內(nèi)。這樣的復(fù)雜性和數(shù)據(jù)量為人工智能提供了實際數(shù)據(jù)進行學(xué)習和訓(xùn)練的理想場景。
在工業(yè)系統(tǒng)中,存在著大量的軟件和不同的系統(tǒng),從上層的企業(yè)資源規(guī)劃(ERP)到中層的制造執(zhí)行系統(tǒng)(MES),再到底層的過程控制系統(tǒng)(PCS)和制造控制系統(tǒng)(MCS)等。每個層級和系統(tǒng)基于不同的機理進行分工,并擁有各自不同的軟件和數(shù)據(jù)權(quán)限,以及操作經(jīng)驗等。要有效利用人工智能技術(shù),必須打破這些系統(tǒng)之間的壁壘,整合不同來源的數(shù)據(jù)和經(jīng)驗。
例如,按照分鐘級別采集數(shù)據(jù),可以獲得非常豐富的數(shù)據(jù)信息,如圖1所示。這些數(shù)據(jù)不僅反映了整個系統(tǒng)的運行是否處于優(yōu)化的平衡點上,還能揭示出能耗是否最低,產(chǎn)品產(chǎn)出是否最優(yōu)。通過分析這些數(shù)據(jù),能夠提煉出大量的操作經(jīng)驗,為優(yōu)化生產(chǎn)流程提供重要的參考。
因此,催化裂化流程中的豐富數(shù)據(jù)和復(fù)雜性正是人工智能技術(shù)發(fā)揮作用的理想場景。通過人工智能的應(yīng)用,可以更好地分析和優(yōu)化這些數(shù)據(jù),提升整個工業(yè)系統(tǒng)的運行效率和產(chǎn)出質(zhì)量。
圖1 工業(yè)數(shù)據(jù)的來源多樣
在流程工業(yè)領(lǐng)域,國內(nèi)外的情況存在一些區(qū)別。雖然中國的流程工業(yè)在設(shè)備和軟件上看起來都很先進,但在操作和運行過程中,尤其是在優(yōu)化控制和人工智能技術(shù)的應(yīng)用上,還遠未得到充分的釋放和利用。
如在煉油行業(yè),國外與國內(nèi)有所不同。我國的煉油原材料成分非常豐富且變化多樣,有中東原油、國產(chǎn)原油,還有其他國家的原油,成分變化非常大。然而,設(shè)備是固定的,不能隨時進行調(diào)整。因此,在這種情況下,優(yōu)化控制和人工智能技術(shù)的作用顯得尤為重要。我國對優(yōu)化控制和人工智能技術(shù)的需求更加迫切,但目前許多企業(yè)只追求安全生產(chǎn),效率方面卻大打折扣。提高流程工業(yè)的效率對于我國來說至關(guān)重要。
在流程工業(yè)的運行過程中,數(shù)據(jù)、操作經(jīng)驗和人類知識的積累非常豐富,但這些寶貴的信息并未得到充分利用。研究如何進行多信息融合,是解決這一問題的關(guān)鍵,即如何將數(shù)據(jù)、語音和圖像等多種信息融合起來,這一概念在工業(yè)系統(tǒng)中顯得尤為必要。
在這一背景下,如何將數(shù)據(jù)和知識融合起來,統(tǒng)一進行建模和優(yōu)化,是流程工業(yè)領(lǐng)域亟需解決的問題。這不僅涉及知識的載體和融合,還包括自動化操作等各個方面的要求。通過將多元信息融合并進行優(yōu)化控制,可以提升工業(yè)系統(tǒng)的整體效率和運行質(zhì)量。這正是工業(yè)控制領(lǐng)域的研究重點和方向。
二、隱式知識的發(fā)現(xiàn)和利用
在工業(yè)系統(tǒng)中,隱性知識是指操作人員對設(shè)備及其運行機制的認知和經(jīng)驗,如圖2所示。這些知識雖然表面上不顯眼,但在實際運行中往往起到關(guān)鍵作用。例如,許多自動化領(lǐng)域的專家在設(shè)計控制器時,通常基于一個模型,而這個模型包含了許多在控制器運行過程中未被充分利用的知識,包括操作人員的經(jīng)驗。
圖2 隱式知識的發(fā)現(xiàn)和利用
首先,信息獲取存在困難。相比過去,現(xiàn)在的信息獲取手段有了顯著改善。過去主要依賴傳感器,而現(xiàn)在增加了圖像、視頻和語音等多種信息來源。然而,如何有效融合多元化的信息仍是一個技術(shù)難題。
其次,隱性知識的存儲較為復(fù)雜。這些經(jīng)驗往往以簡短的語言表達,如老工程師在緊急情況下的幾句話。這些經(jīng)驗如何統(tǒng)一到系統(tǒng)控制器中并進行有效存儲,是一個挑戰(zhàn)。如何將操作人員的經(jīng)驗和知識系統(tǒng)化、標準化地存儲起來,以便在系統(tǒng)控制中發(fā)揮作用,是我們需要解決的問題。
此外,知識和數(shù)據(jù)的共享也是一個重要課題。即使在同一個行業(yè)中,不同地點的相同裝置由于加工原材料不同,操作數(shù)據(jù)和知識也會有所差異。如何實現(xiàn)數(shù)據(jù)和知識的共享是一個重要課題。雖然中國自動化學(xué)會和企業(yè)在對話中探討了數(shù)據(jù)共享的可能性,但實際操作中面臨諸多挑戰(zhàn)。一種可行的解決方案是通過標桿學(xué)習和數(shù)據(jù)利用,使數(shù)據(jù)資源在不同情況下都能被有效利用,而不是局限于數(shù)據(jù)所有權(quán)的問題。
最后,隱性知識和多元信息的利用仍然不足。目前,隱性知識、操作經(jīng)驗和多元信息的融合和利用仍然不足。這種利用不足是推動我們努力改進的重要動力。通過更好地結(jié)合這些信息,我們可以顯著提升工業(yè)系統(tǒng)的整體效率和控制水平。解決這些問題不僅需要技術(shù)上的突破,還需要政策和標準的支持,以實現(xiàn)數(shù)據(jù)和知識的有效獲取、存儲、共享和利用。這些方面的綜合改進將大大增強工業(yè)系統(tǒng)的優(yōu)化控制能力,提高生產(chǎn)效率和產(chǎn)品質(zhì)量。
在工業(yè)系統(tǒng)中,如何將人的經(jīng)驗和知識,包括操作過程中的知識納入系統(tǒng)是個較為重要的內(nèi)容。主要包括三個方面:下層數(shù)據(jù)、人的經(jīng)驗和知識、機理模型。
所謂的知識圖譜,是對傳統(tǒng)模型的進一步擴展。傳統(tǒng)模型僅關(guān)注系統(tǒng)的輸入輸出,而知識圖譜則包括系統(tǒng)內(nèi)部的操作變量、狀態(tài)變化和輸出因素。通過這種方式,可以全面描述系統(tǒng)的狀態(tài)及其變化因素。
我們要構(gòu)建一個立體化、全方位的知識圖譜,其中包括操作經(jīng)驗、控制變量和操作變量。首先,通過知識圖譜了解系統(tǒng)發(fā)生了什么變化,并判斷是否需要產(chǎn)生控制作用。這一概念是對傳統(tǒng)模型控制優(yōu)化技術(shù)路線的擴展,需要不斷豐富和發(fā)展。
我們的工作之一是探討如何通過遷移學(xué)習等先進人工智能技術(shù),應(yīng)用于工業(yè)系統(tǒng),以提出新的方法,如圖3所示。這包括機理建模、裝置結(jié)構(gòu)和子系統(tǒng)之間的拓撲關(guān)系等新表述的探索。通過分析多維數(shù)據(jù),發(fā)現(xiàn)系統(tǒng)變化的主要特征,從而構(gòu)建知識圖譜。通過實際運行數(shù)據(jù),可以看到系統(tǒng)變化的輸入因素,判斷系統(tǒng)運行是否處于優(yōu)化狀態(tài),是否存在安全隱患等。
圖3 相似系統(tǒng)知識輔助的遷移-增量學(xué)習建模
有了實時運行數(shù)據(jù)、操作經(jīng)驗、運行經(jīng)驗和裝置運行結(jié)構(gòu)特征等多方面的信息,我們可以構(gòu)建一個完整的知識圖譜,如圖4所示。然而,這并不是我們的最終目的。傳統(tǒng)控制器使用模型進行推理,而模型的關(guān)鍵作用在于推理。
圖4 從數(shù)據(jù)中發(fā)現(xiàn)模式,從模式中固化知識
三、融合關(guān)系知識的數(shù)據(jù)驅(qū)動建模和優(yōu)化
第二個方面的工作是如何從知識圖譜中進行進一步的演化和推理,以了解整個系統(tǒng)的狀態(tài)是否滿足要求。特別是對最終產(chǎn)品進行預(yù)測,判斷其是否合格和最優(yōu)。反過來,指導(dǎo)各個裝置之間的操控,包括操控變量和操作條件的優(yōu)化。這是對傳統(tǒng)控制概念的進一步擴展,通過知識圖譜實現(xiàn)更精準的控制和優(yōu)化。
原有的控制系統(tǒng)主要作用于單個裝置,例如調(diào)節(jié)溫度至1200度,并在允許的誤差范圍內(nèi)進行調(diào)整。然而,現(xiàn)在我們需要擴展這一概念,將其應(yīng)用到整個生產(chǎn)線。通過利用知識圖譜建立內(nèi)部各種關(guān)系之間的推理關(guān)系,進行全局的推理,使得生產(chǎn)線能夠持續(xù)優(yōu)化,不斷運行。無論內(nèi)部條件如何變化,生產(chǎn)線都能在環(huán)保、優(yōu)化的狀態(tài)下運行,并提高產(chǎn)品的生產(chǎn)指標。根據(jù)不同的要求,調(diào)節(jié)相應(yīng)的變量。
從學(xué)術(shù)角度來看,流程工業(yè)中存在大量的關(guān)系和知識,需要不斷地加以利用。如何有效利用這些關(guān)系和知識?我們采用了多種新的方法。例如,在工業(yè)系統(tǒng)中按照遞階結(jié)構(gòu)進行實時控制,從底層控制到中間的DCS,再到上方的RPU,最后到ERP,打通各個層次的不同定位。對于我國而言,生產(chǎn)結(jié)構(gòu)難以改變,在這種情況下,如何將數(shù)據(jù)和知識更好地融合起來?
在控制系統(tǒng)中,數(shù)據(jù)的輸入和輸出之間存在因果關(guān)系,這與一般通用大模型僅從大數(shù)據(jù)中發(fā)現(xiàn)規(guī)律和特征有所不同,如圖5所示。從這個角度來看,我們建立了許多拓撲結(jié)構(gòu),探討各個子系統(tǒng)之間的相互關(guān)聯(lián)和影響,實現(xiàn)全局系統(tǒng)的動態(tài)變化特征的捕捉和遞進。
圖5 工業(yè)生產(chǎn)過程
四、融合公式化機理知識的數(shù)據(jù)驅(qū)動建模和優(yōu)化
我們采用了深度神經(jīng)網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)等先進技術(shù)和人工智能方法,從而進一步推動工業(yè)生產(chǎn)和應(yīng)用場景的發(fā)展,如圖6所示。這些技術(shù)幫助我們統(tǒng)一構(gòu)建知識圖譜和知識大模型,解決優(yōu)化問題,確定每個裝置的操作條件。通過實際案例,如煉油過程中的操作經(jīng)驗,根據(jù)生產(chǎn)運行的實際情況進行推理,最終實現(xiàn)整個系統(tǒng)的運行優(yōu)化。
圖6 融合多視角先驗知識圖的質(zhì)量預(yù)測
在具體實施過程中,我們主要使用圖神經(jīng)網(wǎng)絡(luò)和機器學(xué)習等先進算法,如圖7所示。整個系統(tǒng)結(jié)構(gòu)從底層的PID控制、中間的MPC(模型預(yù)測控制)到上層的RTO(實時優(yōu)化)和ERP(企業(yè)資源計劃)都是逐層工作的。在這一過程中,我們嵌入了大量圖神經(jīng)網(wǎng)絡(luò)的算法,最終以MPC計算控制為框架,包括模型、滾動優(yōu)化算法和法規(guī)校正等多個關(guān)系都納入到MPC的算法框架中進行實施。
圖7 以圖結(jié)構(gòu)為基礎(chǔ)的知識融合建模
實際運行時,數(shù)據(jù)不斷產(chǎn)生,信息也在不斷積累。我們需要根據(jù)實時數(shù)據(jù)來融合知識圖譜。知識圖譜通常是離線事先制作的,人的操作經(jīng)驗事先插入到知識圖譜中。但在實際運行中,我們需要利用實時數(shù)據(jù)進行系統(tǒng)實時的推理。實際裝置總是存在許多約束條件,優(yōu)化的主要瓶頸正是這些約束。如果沒有約束,系統(tǒng)優(yōu)化會變得相當容易。通過機器學(xué)習和人工智能的各種算法,可以將約束轉(zhuǎn)化為非約束問題進行求解,最終利用實時數(shù)據(jù)和機理系統(tǒng)運行的知識進行融合,形成統(tǒng)一的算法,如圖8所示。
圖8 基于BNN結(jié)構(gòu)學(xué)習的知識融合的混合建模策略
流程工業(yè)非常復(fù)雜,包括冶金、電力等多個領(lǐng)域。這些領(lǐng)域有共性,即所謂的通用大模型。然而,結(jié)合具體行業(yè)又有具體的應(yīng)用和設(shè)計。因此,我們需要進一步擴展技術(shù)策略,將新的技術(shù)統(tǒng)一納入進來。流程工業(yè)和零散制造有時不能分開,例如煉油有時是一批一批的,其中涉及零散制造。建模和優(yōu)化的矛盾與困難一直困擾著工業(yè)控制應(yīng)用。現(xiàn)在,結(jié)合人工智能的許多技術(shù)和方法,特別是結(jié)合機理和知識,可以有效解決這些問題。
五、總結(jié)與展望
工業(yè)數(shù)據(jù)講求對應(yīng)性,即輸入和輸出之間的因果關(guān)系,這是有效的。因此,在工業(yè)系統(tǒng)中應(yīng)用深度學(xué)習和深度神經(jīng)網(wǎng)絡(luò)時,需要考慮系統(tǒng)的橫向關(guān)系。如果不加這個橫向關(guān)系,學(xué)習出來的數(shù)據(jù)可能會偏離工作點,對工業(yè)系統(tǒng)無用。工業(yè)系統(tǒng)中的人工智能應(yīng)用有許多特殊性和具體技術(shù)問題需要研究。通過數(shù)據(jù)到信息、信息到知識的轉(zhuǎn)化,最終形成有用的知識是關(guān)鍵。技術(shù)只能反映當前這一時刻的系統(tǒng)內(nèi)部關(guān)系。如何全方位了解并開好一條生產(chǎn)線,需要建立整體的知識圖譜,并利用不同來源進一步形成實時控制作用。
在工業(yè)系統(tǒng)中應(yīng)用人工智能的技術(shù)涉及多方面問題。進一步利用好人工智能的各種新方法非常重要。例如,MPC(模型預(yù)測控制)在工業(yè)系統(tǒng)應(yīng)用時有許多問題需要解決。雖然深度神經(jīng)網(wǎng)絡(luò)的規(guī)模較小,無法與通用大模型相比,但其概念和技術(shù)路線確實能夠推動傳統(tǒng)工業(yè)控制技術(shù)的發(fā)展。我們還需將人機協(xié)同、人類知識和操作經(jīng)驗很好地結(jié)合起來。這些新方法和技術(shù)的應(yīng)用將對工業(yè)人工智能和人工智能技術(shù)提出新的挑戰(zhàn),并進一步推動其發(fā)展。
(本文根據(jù)作者所作報告速記整理而成)