環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶-重新發(fā)現(xiàn)生活

您當(dāng)前的位置：環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶>生活資訊 > 正文

逐浪 AIGC｜Hugging Face匯聚30萬個(gè)AI模型后，最新估值到了45億美元

2023-09-01 08:53:47 來源：21世紀(jì)經(jīng)濟(jì)報(bào)道編輯：

南方財(cái)經(jīng)全媒體記者江月上海報(bào)道

“百模大戰(zhàn)”不足以形容2023年的AI模型訓(xùn)練熱潮，行業(yè)蓬勃程度突破想象。

8月末，南方財(cái)經(jīng)全媒體記者從開源代碼平臺(tái)Hugging Face內(nèi)部人士處了解到，在過去8個(gè)月里，Hugging Face上的預(yù)訓(xùn)練模型數(shù)量從此前積累的10萬個(gè)增長到了超過30萬個(gè)，數(shù)據(jù)集從1萬個(gè)增長至5.8萬個(gè)，估值也從20億美元飆升到45億美元。

Hugging Face正逐步成為全球最大的大模型庫。8月末，Hugging Face宣布最新一輪融資成功，共籌集到2.35億美元，公司估值較去年同期上漲1倍至45億美元，投資方包括Salesforce、谷歌、IBM、亞馬遜等科技巨頭，英偉達(dá)、英特爾、AMD、高通等芯片公司以及知名風(fēng)險(xiǎn)投資機(jī)構(gòu)Sound Ventures等。

盡管對(duì)話式機(jī)器人ChatGPT率先引發(fā)了全球關(guān)注，但全球開發(fā)者的AI模型研究，目前不限于語言類，還包括圖像生成、聲音生成和轉(zhuǎn)移、視頻生成等。這反映，人工智能開發(fā)者仍然在從不同方向挖掘市場需求點(diǎn)，未來還可能出現(xiàn)新的“爆款應(yīng)用”。

AI融資加速

Hugging Face在2023年乘AIGC東風(fēng)而上，它被稱為AI領(lǐng)域的GitHub，今年銷售量大增，且加快融資速度、身價(jià)倍增。

一名Hugging Face內(nèi)部人士近期告訴南方財(cái)經(jīng)全媒體記者，截至8月底，在Hugging Face平臺(tái)上公開的人工智能模型數(shù)量已經(jīng)超過30萬個(gè)，未公開的數(shù)量甚至更多。另外，數(shù)據(jù)集也達(dá)到5.8萬個(gè)。公司也在迅速擴(kuò)張，團(tuán)隊(duì)人數(shù)從去年的30人擴(kuò)張到了160多人。

與去年年末的數(shù)據(jù)相比，這意味著在2023年前8個(gè)月，該平臺(tái)上的預(yù)訓(xùn)練模型數(shù)量增長200%，數(shù)據(jù)集數(shù)量增長接近500%。

該人士介紹，Hugging Face目前對(duì)業(yè)界提供模型托管、社區(qū)交流，仍在圍繞AI發(fā)展完善各種功能。在中國，Hugging Face也深入社區(qū)交流、提供免費(fèi)的課程，從而促進(jìn)當(dāng)?shù)赜信d趣的開發(fā)者加速流入行業(yè)，也盡早推廣“人人使用AI”的理念。

此前有市場消息還稱，Hugging Face今年的ARR（年度經(jīng)常性收入）可能達(dá)到4000萬美金左右。Hugging Face首席執(zhí)行官克萊門特·德朗格（Clément Delangue）近期預(yù)計(jì)，2023年總收入將為2022年的五倍，因?yàn)槭袌鲂枨笫滞ⅰ?jù)Hugging Face此前披露，包括微軟、谷歌、Bloomberg、英特爾等各個(gè)行業(yè)超過1.5萬家機(jī)構(gòu)都成為它的用戶，而其中付費(fèi)用戶已有3000多家。

全球今年，一級(jí)市場加速對(duì)人工智能產(chǎn)業(yè)的投資。風(fēng)投數(shù)據(jù)分析公司PitchBook稱，2023上半年，全球人工智能領(lǐng)域共計(jì)發(fā)生融資1387件，籌集融資金額255億美元，平均融資金額達(dá)2605萬美元。如要分析業(yè)務(wù)結(jié)構(gòu)，以硅谷的AI創(chuàng)業(yè)公司為例，分為基礎(chǔ)大模型層、中間層和垂直場景應(yīng)用層三種，盡管基礎(chǔ)大模型層產(chǎn)生了OpenAI這樣的獨(dú)角獸，但從事中間層數(shù)據(jù)庫、工具包以及應(yīng)用層的公司，也不乏亮點(diǎn)。

Hugging Face由法國連續(xù)創(chuàng)業(yè)者德朗格和兩位伙伴在2016年創(chuàng)辦，NBA球星杜蘭特是其天使融資者之一；2018年5月，它又獲得了400萬美元的種子輪融資；2019年12月，Hugging Face拿到了總額1500萬美元的A輪融資；2022年5月10日，Hugging Face宣布C輪融資籌集了1億美元，估值達(dá)到20億美元。2023年8月的最新一輪融資，是該公司單筆融資規(guī)模最大的一筆，也令估值達(dá)到45億美元。

值得留意的是，以往融資中，財(cái)務(wù)投資者比重高；這一次，新一輪投資中出現(xiàn)諸多科技巨頭面孔。以領(lǐng)銜投資的Salesforce為例，這家企業(yè)級(jí)軟件開發(fā)巨頭近來也在持續(xù)提升產(chǎn)品中的AI功能，包括通過網(wǎng)站頁面上下文生成銷售電子郵件、回復(fù)建議提供、自動(dòng)總結(jié)與客戶的對(duì)話摘要等。此外，諸多本形成競爭關(guān)系的科技巨頭同時(shí)投資了該公司，反映業(yè)內(nèi)希望通過促進(jìn)AI發(fā)展，給科技界帶來新的增長機(jī)遇。

AI開源模型迅速增長

AI模型開發(fā)，成為2023年上半年全球關(guān)注的科技熱點(diǎn)。一方面，開源與閉源的優(yōu)劣比較被再次搬上舞臺(tái)；另一方面，AI模型開發(fā)之后如何進(jìn)行應(yīng)用落地，得到諸多探討。

Hugging Face成立于2016年，但推動(dòng)人工智能模型“開源”開始于2018年底。當(dāng)年11月，谷歌宣布推出預(yù)訓(xùn)練大語言模型BERT，瞬間成為了自然語言理解領(lǐng)域最“紅”的模型，但初期只有TensorFlow版本。Hugging Face創(chuàng)始人之一Thomas Wolf完成并開源了PyTorch版本的BERT，這吸引了大量開發(fā)者涌入Hugging Face。

在ChatGPT走紅之后，Hugging Face繼續(xù)吸納更多開發(fā)者涌入，不少人集中在機(jī)器學(xué)習(xí)、AI大模型開發(fā)上。由于Hugging Face支持大文件的上傳、免費(fèi)提供hosting（網(wǎng)站托管）、免費(fèi)提供全球CDN（內(nèi)容分發(fā)網(wǎng)絡(luò)），還可以一鍵部署，也就是點(diǎn)一下鼠標(biāo)就將模型快速地布署到亞馬遜云上，從而很快將模型使用起來，因此受到開發(fā)者歡迎。

不過，開源和閉源的優(yōu)劣之爭也在持續(xù)。

目前，“開源”模式獲得不少知名公司和機(jī)構(gòu)的支持，例如Meta旗下的LLaMA、斯坦福大學(xué)旗下Alpaca、Databricks旗下Dolly 2.0等均已經(jīng)公開了“算法”。

“開源生態(tài)的好處在于，它集思廣益，今天你發(fā)現(xiàn)一個(gè)漏洞、明天他發(fā)現(xiàn)一個(gè)功能增補(bǔ)，貢獻(xiàn)者在看著大模型獲得點(diǎn)贊以及落地應(yīng)用時(shí)，將獲得很大的成就感。”一位開源社區(qū)的經(jīng)營者告訴南方財(cái)經(jīng)全媒體記者。

不過，支持“閉源”的人士也有自己的理由。例如，2023年紅遍全球的GPT大語言模型，于3月14日發(fā)布了GPT-4版本，這個(gè)模型選擇了“閉源”模式，這其中有安全性、版權(quán)和商業(yè)競爭的復(fù)雜考量。

大模型“開源”，到底開放的是什么樣的資源？開源字面意思是“公開源代碼”。例如Linux操作系統(tǒng)所開放的就是操作系統(tǒng)內(nèi)核源代碼。

大語言模型開放，則更為復(fù)雜。業(yè)界認(rèn)為，核心在于“算法”加上“參數(shù)”，算法的核心部分主要包括模型結(jié)構(gòu)和訓(xùn)練方法，而參數(shù)更是極難獲得、高質(zhì)量的人工標(biāo)注數(shù)據(jù)。由于大模型的核心構(gòu)成包括算法、算力和數(shù)據(jù)這三駕馬車，因此缺少任何一樣元素都難以“復(fù)制”目標(biāo)大模型。

支持大模型以開源形式發(fā)展的人士普遍認(rèn)為，開源模型下的數(shù)據(jù)集依然透明，這對(duì)于使用者是一個(gè)便利，這樣的數(shù)據(jù)集更容易維持觀點(diǎn)均衡、沒有偏頗。

在AI模型大量涌現(xiàn)之后，應(yīng)用落地將在不遠(yuǎn)的將來吸引更多人的注意。記者在Hugging Face上注意到，盡管語言大模型因?qū)υ挋C(jī)器人率先受到大眾關(guān)注，但開發(fā)者并不局限于這一領(lǐng)域，而是對(duì)圖像、聲音、視頻以及多模態(tài)模型各有涉獵。

如何產(chǎn)生更多像ChatGPT的“爆款”應(yīng)用？“從事AI模型落地，一方面要在市場上尋找需求，另一方面也不能僅通過API坐享其成模型開發(fā)成果，應(yīng)當(dāng)更關(guān)注數(shù)據(jù)庫的建立?！币幻Ｐ烷_發(fā)工程師如是向南方財(cái)經(jīng)全媒體介紹。

關(guān)鍵詞：

相關(guān)閱讀

分享到：

版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件，均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨(dú)家版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載或鏡像；授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"，并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。

逐浪 AIGC｜Hugging Face匯聚30萬個(gè)AI模2023-09-01
世界快消息！以多品牌開拓平價(jià)走量市場新2023-09-01
2023年科研助理崗位已吸納應(yīng)屆高校畢業(yè)生超2023-09-01
哈爾濱市氣溫又殺“回馬槍”，2日最高氣溫22023-09-01
哈爾濱市醫(yī)保局解讀門診慢性病政策2023-09-01
蔣萬安上海行意猶未盡：期待下次再來2023-09-01
民生直通車丨跨省就醫(yī)、交通出行、文旅購票2023-09-01
國家疾控局印發(fā)《兒童青少年近視防控公共衛(wèi)2023-09-01
煤電“三改聯(lián)動(dòng)”完成“十四五”目標(biāo)八成以2023-09-01
四部門印發(fā)通知部署2023年秋季學(xué)校食品安全2023-09-01
中央氣象臺(tái)9月1日06時(shí)繼續(xù)發(fā)布暴雨黃色預(yù)警2023-09-01
中央氣象臺(tái)9月1日06時(shí)繼續(xù)發(fā)布臺(tái)風(fēng)紅色預(yù)警2023-09-01
受臺(tái)風(fēng)“蘇拉”影響香港多個(gè)公共服務(wù)部門2023-09-01
中信銀行鄭州分行縱深推進(jìn)“資金鏈”治理，2023-09-01
華天科技董秘回復(fù)：有，公司封裝技術(shù)水平及2023-09-01
地方債發(fā)行提速銀行間流動(dòng)性邊際趨緊2023-09-01
王炸利好存量首套房利率下調(diào)！一大波住房2023-09-01
A股半年報(bào)全景圖：150家公司營收翻倍，多數(shù)2023-09-01
恒指牛熊街貨比(58:42)︱9月1日2023-09-01
企業(yè)名稱冠以“中國”“中華”等字詞，從嚴(yán)2023-09-01
鎮(zhèn)域經(jīng)濟(jì)大省，廣東輸給了江蘇？2023-09-01
東方甄選想換個(gè)朋友，俞敏洪帶隊(duì)入淘10小時(shí)2023-09-01
武漢、東莞等4城同日官宣“認(rèn)房不認(rèn)貸”2023-09-01
2023暑期檔總票房超206億元創(chuàng)中國影史多2023-09-01
上海虹橋火車站停車場收費(fèi)標(biāo)準(zhǔn) 虹橋火車站2023-09-01
女人到了四五十歲，早秋多穿針織衫真的很溫2023-09-01
服務(wù)型制造大有可為2023-09-01
【忠陽車評(píng)】讓“黑”企業(yè)的自媒體付出代價(jià)2023-09-01
青島天一紅旗紡機(jī)集團(tuán)有限公司深耕紡織機(jī)械2023-09-01
寧波通商控股集團(tuán)有限公司聚焦園區(qū)發(fā)展——2023-09-01

新視野

資訊

焦點(diǎn)