5 月 23 日 -24 日,AICon 全球人工智能開發(fā)與應(yīng)用大會上海站即將拉開帷幕。本次大會將聚焦 AI 技術(shù)的前沿突破與產(chǎn)業(yè)落地,圍繞 AI Agent、多模態(tài)應(yīng)用、大模型架構(gòu)創(chuàng)新、推理性能優(yōu)化、大模型驅(qū)動數(shù)據(jù)創(chuàng)新、AI 產(chǎn)品創(chuàng)新與出海策略等核心議題,呈現(xiàn)技術(shù)與應(yīng)用融合的最新趨勢。
科大訊飛研發(fā)總監(jiān)王磊磊已確認(rèn)出席 AICon 上海并將在智能硬件落地實(shí)踐專題發(fā)表題為《復(fù)雜場景下的語音交互,多模態(tài)降噪技術(shù)的實(shí)踐與應(yīng)用》的主題分享。在智能硬件快速發(fā)展的今天,嘈雜環(huán)境下的語音采集問題已成為制約用戶體驗(yàn)的關(guān)鍵瓶頸。傳統(tǒng)降噪技術(shù)主要依賴單模態(tài)信號處理(如麥克風(fēng)陣列或數(shù)字信號處理算法),但在面對突發(fā)性噪音、多聲源混疊以及動態(tài)場景時,其性能往往難以滿足需求。為解決這一難題,本次演講將重點(diǎn)介紹基于多模態(tài)融合的降噪技術(shù)體系。該技術(shù)通過整合麥克風(fēng)陣列、攝像頭視覺分析以及其他傳感器數(shù)據(jù),結(jié)合深度學(xué)習(xí)模型,實(shí)現(xiàn)了對復(fù)雜場景下目標(biāo)聲源的精準(zhǔn)提取和背景噪音的有效抑制。
目前,這項技術(shù)已成功應(yīng)用于多種智能硬件產(chǎn)品中,包括大屏一體機(jī)、人形機(jī)器人、智能音箱等。通過硬件與軟件的深度協(xié)同,多模態(tài)降噪技術(shù)不僅顯著提升了設(shè)備在嘈雜環(huán)境中的語音識別能力,還為智能硬件的交互體驗(yàn)帶來了質(zhì)的飛躍。本次演講將從技術(shù)原理、應(yīng)用場景及未來發(fā)展方向等方面,全面解析多模態(tài)降噪技術(shù)如何應(yīng)用于下一代智能硬件中。
科大訊飛研發(fā)總監(jiān)王磊磊,先后在科技創(chuàng)新 2030“新一代人工智能”重大項目中的多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化項目、2022 年安徽省科技攻關(guān)計劃中的面向物聯(lián)網(wǎng)的開放式云端人機(jī)自然交互系統(tǒng)、2019 年新一代人工智能產(chǎn)業(yè)創(chuàng)新重點(diǎn)任務(wù)揭榜工作下的語音交互系統(tǒng) iFLYOS、2017 年安徽省戰(zhàn)略性項目 AIUI 人工智能交互解決方案研發(fā)等重大項目中擔(dān)當(dāng)技術(shù)核心。他在本次會議的詳細(xì)演講內(nèi)容如下:
演講提綱:
多模態(tài)簡介
多模態(tài)降噪技術(shù)介紹
單模態(tài)降噪介紹
單模態(tài)降噪的優(yōu)缺點(diǎn)
多模態(tài)降噪介紹
多模態(tài)降噪技術(shù)應(yīng)用實(shí)踐
未來的工作
聽眾收益:
了解如何解決嘈雜環(huán)境的收音問題
了解麥克風(fēng)陣列降噪的優(yōu)缺點(diǎn)
了解多模態(tài)降噪的原理和應(yīng)用
除此之外,本次大會還策劃了AI Agent 構(gòu)建及多元應(yīng)用、多模態(tài)大模型創(chuàng)新實(shí)踐、AI for Data,數(shù)據(jù)管理與價值挖掘?qū)嵺`、大模型推理性能優(yōu)化策略、AI 產(chǎn)品設(shè)計的創(chuàng)新思維、智能硬件與大模型的融合探索、金融領(lǐng)域大模型應(yīng)用實(shí)踐、大模型助力業(yè)務(wù)提效實(shí)踐等專題,屆時將有來自不同行業(yè)、不同領(lǐng)域、不同企業(yè)的 60+ 資深專家在 AICon 上海站現(xiàn)場帶來前沿技術(shù)洞察和一線實(shí)踐經(jīng)驗(yàn)。
目前,所有大會演講嘉賓已結(jié)集完畢,了解更多報名和詳情信息可掃碼或聯(lián)系票務(wù)經(jīng)理 13269078023 咨詢。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.