近期,多家上市公司披露在多模態(tài)大模型技術(shù)上的布局進(jìn)展。當(dāng)前,人工智能逐步突破文本處理的邊界,多模態(tài)大模型通過(guò)整合文本、圖像、視頻、音頻等多維數(shù)據(jù),集成了多種不同類型數(shù)據(jù)處理能力,在統(tǒng)一架構(gòu)下實(shí)現(xiàn)跨模態(tài)理解與生成,成為AI技術(shù)演進(jìn)的新焦點(diǎn),已布局多模態(tài)大模型的A股上市公司將直接受益,如A股“字庫(kù)第一股”漢儀股份(301270),通過(guò)多模態(tài)大模型的應(yīng)用研究,探索各種大模型在文字、圖像、視頻等設(shè)計(jì)領(lǐng)域的應(yīng)用創(chuàng)新落地。
據(jù)了解,自2024年5月14日OpenAI發(fā)布多模態(tài)AI大模型GPT-4o以來(lái),多模態(tài)大模型興起,成為多模態(tài)人工智能發(fā)展的新方向。多模態(tài)大模型建立在大語(yǔ)言模型LLM和大型視覺(jué)模型LVM以及其他模態(tài)模型(如語(yǔ)音模型)的基礎(chǔ)上,借助大模型的強(qiáng)大計(jì)算能力,實(shí)現(xiàn)更加復(fù)雜和智能任務(wù)的處理,例如總結(jié)圖片/視頻內(nèi)容,根據(jù)文字描述生成圖片/視頻等。未來(lái),多模態(tài)大模型內(nèi)容將主要應(yīng)用于商業(yè)定制、醫(yī)療、游戲、教育和影視領(lǐng)域。
AI應(yīng)用分析師表示,多模態(tài)大模型的出現(xiàn)如阿里萬(wàn)象開(kāi)源后下載量超百萬(wàn),千問(wèn)衍生模型下載量超10萬(wàn),開(kāi)源后會(huì)催生更多應(yīng)用,如圖像相關(guān)應(yīng)用成本降低,電商商品展示等會(huì)更多基于AI生產(chǎn),直播領(lǐng)域大量使用AI且能提高轉(zhuǎn)化率,廣告營(yíng)銷、云、電商、搜索等互聯(lián)網(wǎng)相關(guān)領(lǐng)域都有較大提升。數(shù)據(jù)預(yù)測(cè),預(yù)計(jì)至2025年,中國(guó)多模態(tài)內(nèi)容市場(chǎng)規(guī)模將達(dá)到832.7億美元,2018-2025年復(fù)合增長(zhǎng)率達(dá)65.02%。
作為A股“字庫(kù)第一股”,漢儀股份不僅在主業(yè)上全面系統(tǒng)地布局了B端和C端業(yè)務(wù),更是在新興業(yè)務(wù)領(lǐng)域上進(jìn)行了積極探索。目前,人工智能應(yīng)用是漢儀股份戰(zhàn)略布局的重點(diǎn)方向,其通過(guò)自研和戰(zhàn)略合作,布局人工智能領(lǐng)域的創(chuàng)新產(chǎn)品,尤其是多模態(tài)大模型的應(yīng)用研究方面,探索各種大模型在文字、圖像、視頻等設(shè)計(jì)領(lǐng)域的應(yīng)用創(chuàng)新落地,并取得了突破性進(jìn)展。
漢儀股份此前接受機(jī)構(gòu)調(diào)研時(shí)表示,結(jié)合文本、圖像和視頻的等多模態(tài)內(nèi)容生成技術(shù),公司布局開(kāi)展了營(yíng)銷海報(bào)生成、虛擬換裝、圖生視頻、視頻混剪等方面的產(chǎn)品規(guī)劃和研發(fā)工作,例如針對(duì)服飾類電商客戶,研發(fā)AI模特商拍和商品圖合成技術(shù),替代傳統(tǒng)拍攝方式,為品牌營(yíng)銷圖智能換臉、智能合成商品背景圖等功能,降低客戶商品拍攝與處理成本,提升商品上架速度和展示效果;針對(duì)視頻電商客戶,研發(fā)AI視頻剪輯解決方案,替代傳統(tǒng)人力剪輯方式,可大大降低剪輯處理的成本,提升營(yíng)銷內(nèi)容生產(chǎn)和投放效率,上述應(yīng)用已在公司kreatr 工具平臺(tái)上線,并已和外部企業(yè)展開(kāi)商業(yè)合作。
值得一提的是,漢儀股份在人工智能領(lǐng)域的布局不僅限于技術(shù)研發(fā),更在于如何將技術(shù)與市場(chǎng)緊密結(jié)合,實(shí)現(xiàn)商業(yè)價(jià)值的最大化。公司通過(guò)一系列戰(zhàn)略合作和投資并購(gòu),不斷拓寬業(yè)務(wù)范圍,公司投資的賽博愛(ài)思和工作魔法(WorkMagic)等公司也都具備較好的AI技術(shù)優(yōu)勢(shì)。其中,WorkMagic已推出WorkMagic Copilot營(yíng)銷助手,功能涵蓋創(chuàng)意內(nèi)容生成和營(yíng)銷自動(dòng)化兩大模塊。具體而言,在創(chuàng)意生成方面,WorkMagic Copilot已上線AI文案、圖片生成功能,支持場(chǎng)景圖、模特圖,以及博客、郵件內(nèi)容生成,后續(xù)還將上線3D視頻生成功能。而從客戶群體來(lái)看,漢儀股份在字庫(kù)產(chǎn)品的互聯(lián)授權(quán)領(lǐng)域占據(jù)領(lǐng)先地位。在互聯(lián)網(wǎng)授權(quán)領(lǐng)域,公司主要合作伙伴為騰訊QQ、華為、OPPO、VIVO等互聯(lián)網(wǎng)廠商和手機(jī)廠商,并與上述主要客戶保持穩(wěn)定合作關(guān)系,來(lái)自華為、OPPO等智能手機(jī)平臺(tái)的收入及占比呈上升趨勢(shì)。未來(lái)有望與各大主要合作伙伴在多模態(tài)大模型的應(yīng)用上展開(kāi)全面合作,搶占市場(chǎng)先機(jī)。
分析人士認(rèn)為,大模型行業(yè)已呈現(xiàn)蓬勃發(fā)展態(tài)勢(shì),面對(duì)這一藍(lán)海市場(chǎng),A股公司紛紛加大投入,爭(zhēng)相涌入大模型行業(yè)。多模態(tài)大模型能夠處理多種模態(tài)的數(shù)據(jù),實(shí)現(xiàn)更加復(fù)雜的智能任務(wù),抓住應(yīng)用需求則是相關(guān)企業(yè)能夠?qū)崿F(xiàn)突圍的關(guān)鍵。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.