1. search

              Enter search content
              當前位置 - 網(wǎng)站首頁 > 行業(yè)動態(tài)

              DeepSeek:帶飛全網(wǎng),帶不動化工?2025-03-18

              1月20日,在特朗普宣布啟動總投資5000億美元的“星際之門” (Stargate)AI基礎設施計劃前一天,杭州深度求索人工智能基礎技術(shù)研究有限公司——一家此前名不見經(jīng)傳的中國企業(yè),將其開發(fā)的大語言推理模型DeepSeek-R1以開源形式上線。憑借高性能、低成本優(yōu)勢,這個初出茅廬的大模型立刻成為科技圈、投資圈和媒體圈乃至全網(wǎng)關注的焦點。

              《中國化工報》記者注意到,春節(jié)假期后第 一周,多家上市企業(yè)宣布接入DeepSeek,帶動上證科創(chuàng)板50成份指數(shù)和創(chuàng)業(yè)板指數(shù)均漲超5%。但這場帶著全網(wǎng)起飛的“龍卷風”,吹到石油和化工行業(yè)時卻好像減了速——迄今為止,鮮少有石油和化工企業(yè)加入這場狂歡。

              對此,工業(yè)智能化、AI等研究領域的多位專家近日接受記者采訪時表示,DeepSeek橫空出世令人鼓舞,但要解決AI大模型在流程工業(yè)垂直應用的諸多難題并非易事,能否帶飛石油和化工行業(yè),仍需時間檢驗。

              訓練便宜≠成本低 基礎設施花費仍然較高

              DeepSeek能在網(wǎng)絡上掀起巨浪,甚至引發(fā)美國股市中英偉達等科技股出現(xiàn)“歷史性”大跌的核心“殺手锏”,在于其顛覆性的低成本與高 效 率。

              根據(jù)深度求索公司官方放出的數(shù)據(jù),DeepSeek僅用2048塊英偉達 H800圖形處理器(GPU)和557.6萬美元的投入,就訓練出了規(guī)模達6710億參數(shù)的DeepSeek-V3。Open AI創(chuàng)始成員之一Andrej Karpathy表示,按照以往經(jīng)驗,行業(yè)內(nèi)類似能力級別的大模型大多使用約10萬張GPU。例如,Llama 3 405B模型消耗了3080萬GPU小時,而DeepSeek-V3則用了280萬GPU小時,計算需求僅為前者的十一分之一。

              此前,市場上也普遍認為同等參數(shù)規(guī)模的GPT-4訓練花費高達10億美元。而DeepSeek推出的DeepSeek-R1模型,推理成本僅為OpenAI新模型(o1)的三十分之一。許多后續(xù)研究團隊更是用較低的成本成功復現(xiàn)了DeepSeek的模型樣本。

              從用戶端來看,這樣的數(shù)據(jù)似乎意味著企業(yè)部署AI大模型的花費從“腳脖子打折”,個人用戶部署一個自有大模型好像也不再是夢想。但這真的意味著誰都“用得起”大模型的時代到來了嗎?

              “部署和訓練成本并不等同于應用成本?!币晃籌CT從業(yè)人士表示,DeepSeek成本的降低,主要是靠算法創(chuàng)新對訓練成本進行了壓縮。根據(jù)官方數(shù)據(jù),研究團隊在訓練模型時同時使用了8浮點混合精度訓練技術(shù)(FP8)、混合專家模型(MoE)以及自主研發(fā)的多頭潛在注意力(MLA)機制,解決了傳統(tǒng)Transformer模型在處理長輸入序列時的內(nèi)存瓶頸問題,可將顯存占用降至傳統(tǒng)模型的5%~13%。

              而應用成本則包括計算設施、傳輸設施的建設成本,數(shù)據(jù)收集與存儲成本等。以煉廠為例,一套催化裂化裝置每秒產(chǎn)生的數(shù)據(jù)點可能就多達上千個,其中既包括每秒或幾分鐘就要采集一次的溫度和壓力數(shù)據(jù),也包括需要長期連續(xù)測定的催化劑活性數(shù)據(jù),還有一些動設備如泵的噪音、振動幅度等其他數(shù)據(jù),一家大型煉廠每年產(chǎn)生的數(shù)據(jù)量可能在千億級字節(jié)。即使DeepSeek依靠算法降低了對GPU服務器集群等計算設施的需求,其數(shù)據(jù)存儲與傳輸設施的剛性投入也難以降低,中小企業(yè)搭建自有大模型仍然存在困難。

              圖靈獎得主、Meta AI科學家楊立昆(Yann LeCun)也公開發(fā)聲強調(diào),許多投資者對AI基礎設施投資存在“重大誤解”?!澳切?shù)十億美元的資金中,很大一部分都投入到了推理基礎設施中,而不是訓練。數(shù)十億人運行 AI助手服務需要大量的計算,一旦你將視頻理解、推理、大規(guī)模內(nèi)存和其他功能納入AI系統(tǒng),推理成本就會增加?!睏盍⒗フf。

              模型幻覺難除 輸出內(nèi)容并不完全可靠

              此前,DeepSeek憑借一句“打動你的是人類集體智慧的回聲”在網(wǎng)絡上引起無數(shù)轉(zhuǎn)發(fā)和討論。出于好奇,記者也嘗試讓它進行了多種風格的寫作,在情感及純文學寫作中表現(xiàn)出色的DeepSeek,在涉及專業(yè)數(shù)據(jù)時卻有些“不知所云”,它給出了歐洲某家煉油廠應用AI優(yōu)化運維的案例,但記者按其給出的數(shù)據(jù)無法查證該煉油廠是否真實存在,“追問” DeepSeek也無法得到該煉油廠更具體的信息。

              “這就是大語言模型(LLM)目前應用的一個大問題——模型幻覺。”中化信息技術(shù)有限公司專家委員會副主任、華東理工大學講席教授馮恩波告訴記者,目前LLM僅能勝任知識或數(shù)據(jù)管理方面的工作,但如果讓它產(chǎn)生專業(yè)程度較強的新知識、新內(nèi)容,就需要十分小心,因為“模型幻覺”目前在AI深度學習領域中,仍是難以根除的問題。

              其中,一部分幻覺數(shù)據(jù)可以通過核對輸入內(nèi)容和生成內(nèi)容發(fā)現(xiàn),并通過調(diào)整輸入關鍵詞來修正。例如,向AI詢問“中國第 一家化工企業(yè)的名字是什么?”,AI可能會由于抓取關鍵詞的不同,給出“1880年成立的上海江蘇藥水廠是中國第 一家化工廠”或“始建于1954年的吉林化學工業(yè)公司(中國石油吉林石化分公司前身),是我國第 一家化工企業(yè)”的答案,用戶可以通過添加例如“新中國成立前/后”等關鍵詞再進行篩選。

              另一部分的幻覺則更加“危險”?!坝锌赡蹵I會給你一個語言華麗、數(shù)據(jù)漂亮的成果報告,但其中‘融化’了大量不確定性高,甚至在專業(yè)人士看來是謬論的數(shù)據(jù)?!瘪T恩波強調(diào),尤其要謹防AI講話“真假參半”,將虛假的數(shù)據(jù)掩藏在大量專業(yè)詞匯和華麗的語言之后,因為即使是對相關從業(yè)者來說,一一核對與辨別這些案例和數(shù)據(jù)的不合理之處,也是非常困難的事情。如果這些摻雜“幻覺”的數(shù)據(jù)和知識進入數(shù)據(jù)庫,被用在流程行業(yè)實際生產(chǎn)系統(tǒng)的實時優(yōu)化、實時控制等方面,可能造成嚴重后果。

              對此,他建議,行業(yè)可以先利用大數(shù)據(jù),建立較為準確的反應機理模型作為“司令員”,在此基礎上應用大語言推理模型作為“參謀長”進行輔助判斷,再由有經(jīng)驗的操作員***終驗證和確定反應流程的實時優(yōu)化與控制該如何進行,從而提高模型應用的準確性與可靠性。

              “目前,DeepSeek這樣的大模型也會造成很多‘幻覺’,但企業(yè)需要大模型在決策過程中能保證百分之百的準確性。”北京中關村科金技術(shù)有限公司總裁喻友平說:“大模型在面向企業(yè)端(To B)的應用離理想狀態(tài)還有很大距離,這比面對終端消費者(To C)場景的挑戰(zhàn)要大得多?!?/span>

              數(shù)據(jù)“地基”不穩(wěn) 廣泛應用尚有待時日

              近年來,能源化工行業(yè)AI大模型應用已經(jīng)取得了初步成績,例如中國石油700億參數(shù)昆侖大模型、中控石化化工大模型、中國海油“海能”人工智能模型,但要實現(xiàn)更加廣泛的應用,仍在可用性與易用性方面面臨挑戰(zhàn)。多位業(yè)內(nèi)專家表示,大語言推理模型在流程行業(yè)的應用仍然需要夯實數(shù)據(jù)和機理的“地基”,以保障其安全性與可靠性。

              中國工程院院士、中國石油勘探開發(fā)研究院正高級工程師劉合此前表示,數(shù)據(jù)治理是油氣行業(yè)AI大模型應用的關鍵,如何在保證數(shù)據(jù)安全和保密的前提下,充分整合分散的數(shù)據(jù)并訓練行業(yè)模型,是行業(yè)一直在探索的一個“大問題”。

              但對于石化行業(yè)來說,推動數(shù)據(jù)治理,打牢大語言模型應用的“地基”并不容易。一方面,石化行業(yè)的數(shù)據(jù)環(huán)境極為復雜、數(shù)據(jù)來源廣,且受外部環(huán)境影響噪聲高,容易出現(xiàn)數(shù)據(jù)不完整的情況;另一方面,主流深度學習的模型通常在靜態(tài)數(shù)據(jù)集上進行訓練,而實際生產(chǎn)是“牽一發(fā)而動全身”,催化劑中毒、不同批次原料成分的細微改變,都會使設備狀態(tài)及工藝參數(shù)發(fā)生漂移,導致數(shù)據(jù)集逐漸“過期”,優(yōu)化模型也不再有效。劉合在其署名文章《油氣大模型破局需從三方面發(fā)力》中也提出,油氣企業(yè)必須強化數(shù)據(jù)全生命周期管理,從數(shù)據(jù)源頭、數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)融合和匹配、數(shù)據(jù)完整性增強、數(shù)據(jù)標注等環(huán)節(jié)嚴格規(guī)范,建立高質(zhì)量的訓練樣本庫,提升數(shù)據(jù)治理能力,從而為行業(yè)大模型提供堅實的數(shù)據(jù)基礎。

              “除了挖掘數(shù)據(jù)與場景價值點外,石化企業(yè)應用大模型的另一個重點是安全性和保密性問題?!闭憬潞统晒煞萦邢薰具\營首席專家鄭根土認為,數(shù)據(jù)安全治理也是企業(yè)所擔憂的問題,目前國家已經(jīng)出臺了數(shù)據(jù)流通安全治理的相關法案,但數(shù)據(jù)流通安全治理體系仍然有待構(gòu)建,相關機制也并不完善,需要企業(yè)、行業(yè)與相關部門多方協(xié)同,提高行業(yè)數(shù)據(jù)流通與應用的監(jiān)管效能。

              喻友平表示:“展望未來,AI在To B領域的應用將面臨轉(zhuǎn)型與創(chuàng)新的雙重挑戰(zhàn)。企業(yè)需要逐步建立基于大模型的智能決策系統(tǒng),同時考慮如何增強系統(tǒng)的透明性,確保AI生成內(nèi)容的可追溯性與可靠性。此外,還應密切關注相關法規(guī)政策,以預防不當使用AI技術(shù)可能帶來的法律和倫理問題?!?/span>

              如有侵權(quán) 請聯(lián)系刪除

              • 董事長助理李先生:19990089977
                柳先生19990086993/ 岳女士19990089050
              遼ICP備2022001649號 備案號
              亚洲不卡无码av中文字幕_日韩AV成人片在线观看_久久亚洲免费精品视频_99久久无码一区人妻A黑
                        1. 亚洲人成中文电影 | 在线观看亚洲午夜天堂 | 中文字幕电影亚洲精品 | 欧美视频精品一区二区 | 日本午夜啪视频免费 | 中文字幕在线观看精品 |