• <rt id="2wkqu"><small id="2wkqu"></small></rt>
  • 大模型時(shí)代,數(shù)據(jù)要素產(chǎn)業(yè)鏈如何參與生態(tài)培育?
    2023-08-25 10:51:02 來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道 編輯:

    21世紀(jì)經(jīng)濟(jì)報(bào)道記者駱軼琪 汕頭報(bào)道

    數(shù)字經(jīng)濟(jì)時(shí)代,國(guó)內(nèi)數(shù)據(jù)要素產(chǎn)業(yè)鏈的各個(gè)環(huán)節(jié)正在積極將能力融合。硬件端,基于國(guó)內(nèi)GPU芯片平臺(tái)推進(jìn)能力積蓄;軟件端,則從數(shù)據(jù)產(chǎn)生前端在數(shù)據(jù)采集、挖掘、清洗等多層面著手籌備。

    2023中國(guó)數(shù)字經(jīng)濟(jì)創(chuàng)新發(fā)展大會(huì)期間,首都在線副總裁、智算中心事業(yè)群總經(jīng)理牛繼賓接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪時(shí)表示,“首都在線一方面會(huì)在國(guó)內(nèi)針對(duì)英偉達(dá)算力持續(xù)投資,做算力業(yè)務(wù)部署;另一方面也開(kāi)始與國(guó)產(chǎn)芯片公司進(jìn)行布局合作,首都在線和燧原科技等不少于五家的國(guó)內(nèi)優(yōu)質(zhì)芯片廠商合作,并在持續(xù)做適配和認(rèn)證工作?!?/p>

    多名受訪者都指出,高質(zhì)量的精調(diào)數(shù)據(jù)將決定AI大模型的最終能力,要綜合運(yùn)用各類(lèi)型工具完善這項(xiàng)工作;同時(shí)不可忽視是對(duì)數(shù)據(jù)合規(guī)性、安全性挑戰(zhàn)的前置預(yù)防型工作。

    構(gòu)筑大模型底座

    當(dāng)前AI大模型構(gòu)建過(guò)程中,最受關(guān)注的就是國(guó)內(nèi)底層GPU為代表的智能計(jì)算類(lèi)硬件能力構(gòu)建進(jìn)展。

    牛繼賓告訴記者,首都在線最早從數(shù)據(jù)中心業(yè)務(wù)起步,逐步迭代出云計(jì)算能力、新一代智能計(jì)算能力。人工智能和元宇宙互相促進(jìn),元宇宙更側(cè)重于圖形圖像的沉浸式,人工智能更趨向于背后智能技術(shù)的支撐。牛繼賓稱(chēng),將通過(guò)把圖形圖像業(yè)務(wù)、GPU算力和服務(wù)做迭代升級(jí),打造新一代算力平臺(tái)。

    值得注意的是,當(dāng)前國(guó)內(nèi)普遍面臨著對(duì)大模型訓(xùn)練硬件能力緊俏的難題。對(duì)此,牛繼賓對(duì)記者表示,目前英偉達(dá)的高端訓(xùn)練芯片國(guó)內(nèi)可以用,但帶寬被限制過(guò),即使如此也供不應(yīng)求。為此,首都在線一方面會(huì)在國(guó)內(nèi)針對(duì)英偉達(dá)算力持續(xù)投資,另一方面也開(kāi)始與國(guó)產(chǎn)芯片公司進(jìn)行布局合作。

    “我們已經(jīng)在無(wú)錫開(kāi)通了信創(chuàng)專(zhuān)區(qū),也會(huì)在內(nèi)蒙古、海南各自開(kāi)通信創(chuàng)專(zhuān)區(qū)。目的是把國(guó)產(chǎn)芯片能力逐步引入。在每一個(gè)國(guó)產(chǎn)芯片的資源池上,都會(huì)迭代一種模型服務(wù),最終服務(wù)于用戶(hù)?!迸@^賓進(jìn)一步指出,所以會(huì)從英偉達(dá)+國(guó)產(chǎn)算力,同時(shí)做資源池建設(shè),然后引入成熟的模型,去解決算力短缺問(wèn)題。

    僅有算力硬件并不夠,牛繼賓分析道,單純建設(shè)智能算力業(yè)務(wù)只是建立了一個(gè)資源池,真正要用上這些資源,需要應(yīng)用驅(qū)動(dòng),再結(jié)合英偉達(dá)不同的場(chǎng)景學(xué)習(xí)、觀察,最終導(dǎo)入到不同的國(guó)產(chǎn)芯片上,在不同場(chǎng)景中,計(jì)劃、激活模型訓(xùn)練相關(guān)業(yè)務(wù)?!拔覀儾捎脩?yīng)用驅(qū)動(dòng)、網(wǎng)絡(luò)驅(qū)動(dòng)??梢园堰@些算力資源制作成服務(wù)的形式,最終交付到最終用戶(hù)。”

    數(shù)據(jù)治理機(jī)遇

    當(dāng)前在模型搭建過(guò)程中,面臨的較大難題是數(shù)據(jù)處理和清洗等相關(guān)工作。

    對(duì)此,廣東天億馬信息產(chǎn)業(yè)股份有限公司副總經(jīng)理林少勇受訪時(shí)表示,為了處理好海量數(shù)據(jù)的挖掘,還需要引入一些大數(shù)據(jù)處理工具,包括分布式存儲(chǔ)、離線計(jì)算、實(shí)時(shí)計(jì)算等,同時(shí)也要有可視化的建模工具,以便更好調(diào)整模型參數(shù)。也可以借助AI,在數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式和趨勢(shì),從而幫助組織進(jìn)行預(yù)測(cè)性分析。

    同時(shí)為了保證挖掘數(shù)據(jù)的價(jià)值和質(zhì)量,從數(shù)據(jù)采集方向,可以使用AI技術(shù)清洗數(shù)據(jù)、填補(bǔ)缺失值、處理異常值,以確保數(shù)據(jù)的準(zhǔn)確性。也需通過(guò)制定數(shù)據(jù)質(zhì)量規(guī)則、數(shù)據(jù)脫敏規(guī)則進(jìn)一步保證數(shù)據(jù)的質(zhì)量和合規(guī),同時(shí)也建立訪問(wèn)控制和權(quán)限管理,確保只有授權(quán)人員能夠訪問(wèn)特定數(shù)據(jù)。

    在數(shù)據(jù)治理過(guò)程中,林少勇認(rèn)為,AI可以提供很大幫助,這體現(xiàn)在幫助數(shù)據(jù)質(zhì)量提升、智能數(shù)據(jù)分類(lèi)和標(biāo)注、預(yù)測(cè)性分析洞察和決策等方面。

    “舉例來(lái)說(shuō),人工智能可以用于自動(dòng)檢測(cè)和修復(fù)數(shù)據(jù)質(zhì)量問(wèn)題。比如使用機(jī)器學(xué)習(xí)算法來(lái)識(shí)別數(shù)據(jù)中的異常值、缺失值,進(jìn)行數(shù)據(jù)清洗和糾正;也可以自動(dòng)對(duì)數(shù)據(jù)進(jìn)行分類(lèi)和標(biāo)注,幫助識(shí)別不同類(lèi)型的數(shù)據(jù),并為數(shù)據(jù)元素添加適當(dāng)?shù)脑獢?shù)據(jù),從而提高數(shù)據(jù)的可管理性。”他進(jìn)一步指出,在AI的協(xié)助下,做好數(shù)據(jù)治理、提高數(shù)據(jù)質(zhì)量,可以反過(guò)來(lái)將數(shù)據(jù)提供給AI訓(xùn)練,進(jìn)一步提高模型的識(shí)別率,形成閉環(huán)。

    深圳數(shù)闊信息技術(shù)有限公司(下稱(chēng)“數(shù)闊”)創(chuàng)始人兼CEO劉寶強(qiáng)也對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,當(dāng)前市場(chǎng)比較缺乏高質(zhì)量的精調(diào)數(shù)據(jù),即經(jīng)過(guò)人工標(biāo)注、清洗、整合的數(shù)據(jù)。數(shù)據(jù)質(zhì)量決定了大模型能力。

    應(yīng)對(duì)安全挑戰(zhàn)

    數(shù)字經(jīng)濟(jì)時(shí)代,更為重要是對(duì)數(shù)據(jù)這一涉及人們生活各方面的要素進(jìn)行安全性防范。即便是剛剛興起的AI大模型,在被廣泛應(yīng)用后,很快部分公司便遭遇了泄密挑戰(zhàn)。

    林少勇對(duì)記者表示,AI大模型對(duì)于訓(xùn)練的數(shù)據(jù)要求越來(lái)越高,國(guó)內(nèi)還需做好數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)脫敏、數(shù)據(jù)安全等工作。

    尤其是數(shù)據(jù)的廣泛收集、存儲(chǔ)和共享為個(gè)人、企業(yè)和政府帶來(lái)了機(jī)會(huì),但同時(shí)也引發(fā)對(duì)數(shù)據(jù)隱私、保密性和安全性的擔(dān)憂。

    “因此公司會(huì)從多個(gè)層面考慮應(yīng)對(duì)這一難題:強(qiáng)化數(shù)據(jù)加密、建立訪問(wèn)控制和權(quán)限管理、實(shí)施多層次防御策略(從軟硬件層面)、持續(xù)員工培訓(xùn)、運(yùn)用新技術(shù)(如人工智能、機(jī)器學(xué)習(xí))等?!彼m(xù)稱(chēng)。

    劉寶強(qiáng)則對(duì)記者分析,倘若要應(yīng)用海外大模型,可能會(huì)涉及數(shù)據(jù)被傳輸出去的情形,目前國(guó)產(chǎn)大模型本身底座安全,數(shù)據(jù)等信息也都留存在國(guó)內(nèi);同時(shí)開(kāi)源大模型已經(jīng)從底層源代碼開(kāi)源,因此可自由部署、靈活可控。

    近兩年來(lái),在企業(yè)數(shù)字化轉(zhuǎn)型中,受大環(huán)境和市場(chǎng)等多重因素影響,企業(yè)對(duì)這方面的投入愈發(fā)審慎。但劉寶強(qiáng)對(duì)記者表示,“各行各業(yè)對(duì)數(shù)字化、智能化轉(zhuǎn)型的訴求上升速度很快,即使面臨短暫的資源困難,大多數(shù)企業(yè)都不會(huì)停止其數(shù)字化迭代進(jìn)程。”

    關(guān)鍵詞:

    相關(guān)閱讀
    分享到:
    版權(quán)和免責(zé)申明

    凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門(mén)戶(hù)"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門(mén)戶(hù)"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門(mén)戶(hù)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門(mén)戶(hù)",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門(mén)戶(hù)"的電頭。

    久久激情五月网站,一本色道综合亚洲精品精品,午夜电影久久久久久,中文无码AV片在线 成a在线观看视频播放 婷婷色中文在线观看
  • <rt id="2wkqu"><small id="2wkqu"></small></rt>