- 政策解讀
- 經(jīng)濟(jì)發(fā)展
- 社會(huì)發(fā)展
- 減貧救災(zāi)
- 法治中國(guó)
- 天下人物
- 發(fā)展報(bào)告
- 項(xiàng)目中心
|
|
2.虛擬現(xiàn)實(shí)與數(shù)字媒體技術(shù)
2.1媒體大數(shù)據(jù)內(nèi)容理解與智能服務(wù)
通過(guò)對(duì)媒體大數(shù)據(jù)進(jìn)行深度分析和關(guān)聯(lián)挖掘,建立符合媒體內(nèi)容理解的計(jì)算模型,實(shí)現(xiàn)異構(gòu)媒體(圖像、視頻、音頻和文本)的結(jié)構(gòu)化描述和語(yǔ)義協(xié)同,突破媒體內(nèi)容理解的關(guān)鍵技術(shù),顯著提升媒體大數(shù)據(jù)的使用價(jià)值,為基于語(yǔ)義的媒體搜索、監(jiān)管與服務(wù)等相關(guān)產(chǎn)業(yè)的發(fā)展提供技術(shù)支撐并建立典型應(yīng)用示范。下設(shè)5個(gè)研究方向。
2.1.1媒體大數(shù)據(jù)的深度分析與結(jié)構(gòu)化描述(國(guó)撥經(jīng)費(fèi)限600萬(wàn)元,實(shí)施年限3年)
在超過(guò)10TB的數(shù)據(jù)集上建立多層次多角度的語(yǔ)義描述模型,研究媒體大數(shù)據(jù)的概念表示、事件提取、多角度語(yǔ)義表述、結(jié)構(gòu)組織、內(nèi)容分析的多層次結(jié)構(gòu)化描述方法,形成超過(guò)300個(gè)媒體內(nèi)容深度分析的概念模型,為媒體大數(shù)據(jù)的內(nèi)容理解奠定基礎(chǔ)。
2.1.2異構(gòu)媒體數(shù)據(jù)的關(guān)聯(lián)與挖掘(國(guó)撥經(jīng)費(fèi)限500萬(wàn)元,實(shí)施年限3年)
研究異構(gòu)媒體關(guān)聯(lián)分析與表達(dá)、基于上下文的多模態(tài)特征融合、異構(gòu)媒體相似性計(jì)算等問(wèn)題,建立異構(gòu)媒體的語(yǔ)義關(guān)聯(lián)和統(tǒng)一表示,實(shí)現(xiàn)跨媒體的內(nèi)容挖掘和異構(gòu)媒體的統(tǒng)一管理。在超過(guò)10TB的數(shù)據(jù)集上視頻、圖像、音頻和文本之間的關(guān)聯(lián)速度小于2秒。
2.1.3面向社交網(wǎng)絡(luò)的搜索方法與群體行為分析(國(guó)撥經(jīng)費(fèi)限600萬(wàn)元,實(shí)施年限3年)
在社交網(wǎng)絡(luò)數(shù)據(jù)信息融合的基礎(chǔ)上,提出新型搜索模式與群體推薦方法,研究社交網(wǎng)絡(luò)中個(gè)體角色、信息傳播規(guī)律、群體行為演化的分析與預(yù)測(cè)技術(shù),實(shí)現(xiàn)社交網(wǎng)絡(luò)信息的高效獲取和態(tài)勢(shì)感知。在真實(shí)社交網(wǎng)絡(luò)環(huán)境下,千萬(wàn)級(jí)用戶(hù)動(dòng)態(tài)社交數(shù)據(jù)的增量分析比靜態(tài)分析速度提高15%,基于用戶(hù)偏好的預(yù)測(cè)及信息推薦方法的準(zhǔn)確率比現(xiàn)有方法提高10%。
2.1.4媒體大數(shù)據(jù)內(nèi)容聚合與呈現(xiàn)(國(guó)撥經(jīng)費(fèi)限500萬(wàn)元,實(shí)施年限3年)
在分析用戶(hù)的屬性、興趣偏好、行為特征等信息的基礎(chǔ)上,通過(guò)領(lǐng)域知識(shí)構(gòu)建和社會(huì)需求發(fā)現(xiàn),建立用戶(hù)的興趣模型;在媒體內(nèi)容聚類(lèi)、關(guān)聯(lián)和挖掘基礎(chǔ)上,提供符合用戶(hù)特定需求的多層次多維度的媒體信息聚合與呈現(xiàn)。聚合信息來(lái)源覆蓋新聞、論壇、博客、微博、社交網(wǎng)站等網(wǎng)絡(luò)媒體,熱點(diǎn)事件信息提取的準(zhǔn)確率超過(guò)85%。
2.1.5基于網(wǎng)絡(luò)媒體內(nèi)容的智能服務(wù)平臺(tái)(國(guó)撥經(jīng)費(fèi)限800萬(wàn)元,企業(yè)牽頭申報(bào),實(shí)施年限3年)
搜集、整合與管理超過(guò)10億網(wǎng)絡(luò)媒體用戶(hù)的數(shù)據(jù),通過(guò)分類(lèi)與挖掘建立超過(guò)30個(gè)多維度、分層次的需求模型;研發(fā)滿(mǎn)足千萬(wàn)級(jí)用戶(hù)并發(fā)訪(fǎng)問(wèn)的網(wǎng)絡(luò)異構(gòu)媒體大數(shù)據(jù)存儲(chǔ)、管理與分析系統(tǒng),構(gòu)建高可靠的基于媒體內(nèi)容的智能服務(wù)平臺(tái),實(shí)現(xiàn)關(guān)鍵技術(shù)驗(yàn)證和基于語(yǔ)義的媒體智能服務(wù)示范。
2.2面向移動(dòng)終端的多模態(tài)自然交互技術(shù)
研究提升移動(dòng)終端視覺(jué)、聽(tīng)覺(jué)感觀(guān)性能的手段,探討增強(qiáng)現(xiàn)實(shí)、情感語(yǔ)音、手勢(shì)等創(chuàng)新性人機(jī)交互技術(shù),實(shí)現(xiàn)系統(tǒng)集成,達(dá)到提高下一代智能移動(dòng)終端易用性和便捷性的目的。下設(shè)5個(gè)研究方向。
2.2.1基于LCOS的眼鏡型透視融合顯示系統(tǒng)(國(guó)撥經(jīng)費(fèi)限1300萬(wàn)元,企業(yè)牽頭申報(bào),實(shí)施年限3年)
完成大規(guī)模SDRAM器件與數(shù)字邏輯器件共融的集成電路設(shè)計(jì)和準(zhǔn)亞微米厚度液晶盒制造工藝研究,提供微型高分辨率(1920×1080)時(shí)間混色LCOS芯片;研究波導(dǎo)器件設(shè)計(jì)和加工方法,研制眼鏡型透視式增強(qiáng)顯示系統(tǒng),波導(dǎo)器件厚度≤3mm,顯示視場(chǎng)角≥35度,在該視場(chǎng)角范圍內(nèi)實(shí)現(xiàn)虛實(shí)融合顯示。
2.2.2基于移動(dòng)終端的戶(hù)外實(shí)時(shí)視覺(jué)定位技術(shù)(國(guó)撥經(jīng)費(fèi)限600萬(wàn)元,企業(yè)參與申報(bào),實(shí)施年限3年)
研究高效的視覺(jué)特征提取及編碼技術(shù)、海量場(chǎng)景的快速識(shí)別技術(shù)、資源受限環(huán)境下的高精度實(shí)時(shí)跟蹤定位技術(shù)。制定視覺(jué)定位相關(guān)技術(shù)標(biāo)準(zhǔn),重點(diǎn)研究視覺(jué)特征的數(shù)據(jù)規(guī)范。單幅圖像的視覺(jué)特征描述小于2K字節(jié),視覺(jué)定位準(zhǔn)確率大于80%。研制符合標(biāo)準(zhǔn)規(guī)范的低功耗硬件。建立基于移動(dòng)終端的大范圍戶(hù)內(nèi)外視覺(jué)定位服務(wù)平臺(tái),實(shí)現(xiàn)在旅游、文化等領(lǐng)域的示范應(yīng)用。
2.2.3基于視覺(jué)的非接觸式自然人機(jī)交互技術(shù)(國(guó)撥經(jīng)費(fèi)限500萬(wàn)元,企業(yè)參與申報(bào),實(shí)施年限3年)
研制可用于移動(dòng)終端的新型光學(xué)傳感器設(shè)備,研究低功耗控制電路及新型多模傳感緊湊(或單封裝)型構(gòu)件,在移動(dòng)終端上實(shí)現(xiàn)新型多模態(tài)的非接觸式自然人機(jī)交互。實(shí)現(xiàn)對(duì)用戶(hù)手指運(yùn)動(dòng)的跟蹤,完成虛擬鍵盤(pán)操作等功能,刷新速度30幀/秒,跟蹤覆蓋區(qū)域60度,跟蹤范圍50cm。
2.2.4多方言的高表現(xiàn)力情感語(yǔ)音交互系統(tǒng)(國(guó)撥經(jīng)費(fèi)限500萬(wàn)元,企業(yè)參與申報(bào),實(shí)施年限3年)
研發(fā)帶有多種方言口音的普通話(huà)低運(yùn)算復(fù)雜度語(yǔ)音交互嵌入式引擎和基于云計(jì)算的語(yǔ)音交互服務(wù)平臺(tái),研制面向移動(dòng)終端多種交互方式融合的情感語(yǔ)音交互系統(tǒng)。方言普通話(huà)連續(xù)語(yǔ)音識(shí)別正確率達(dá)到95%;對(duì)話(huà)、疑問(wèn)、感嘆語(yǔ)氣自然度的主觀(guān)意見(jiàn)平均分(MOS)超過(guò)4.0;愉悅、悲傷等情感識(shí)別準(zhǔn)確率超過(guò)80%;日常生活問(wèn)答的準(zhǔn)確率超過(guò)80%。
2.2.5移動(dòng)終端三維聲場(chǎng)技術(shù)(國(guó)撥經(jīng)費(fèi)限600萬(wàn)元,企業(yè)參與申報(bào),實(shí)施年限3年)
研究3D音頻高效感知壓縮技術(shù),提升3D音頻空間信息壓縮率25%以上;研究個(gè)性化HRTF庫(kù)多級(jí)選擇方法,減少前后混淆效應(yīng)30%以上;研究實(shí)時(shí)聲場(chǎng)增強(qiáng)技術(shù),在資源受限的移動(dòng)終端上實(shí)現(xiàn)3D音頻的實(shí)時(shí)生成,用耳機(jī)實(shí)現(xiàn)3D聲場(chǎng)的再現(xiàn);研制簡(jiǎn)單易用的3D音頻編輯創(chuàng)作工具和播控服務(wù)器,支持2000人以上的并發(fā)3D音頻請(qǐng)求。
2.3全景互動(dòng)關(guān)鍵技術(shù)與示范系統(tǒng)
針對(duì)安全生產(chǎn)、仿真訓(xùn)練、文化科技等領(lǐng)域的應(yīng)用需求,突破球面全景建模、復(fù)雜場(chǎng)景動(dòng)態(tài)演化、實(shí)時(shí)角色植入與虛實(shí)合成、人群實(shí)時(shí)劇情交互等全景互動(dòng)關(guān)鍵技術(shù),構(gòu)建具有高真實(shí)感的全景互動(dòng)系統(tǒng)支撐平臺(tái)并實(shí)現(xiàn)應(yīng)用示范。下設(shè)3個(gè)研究方向:
2.3.1球面全景建模技術(shù)(國(guó)撥經(jīng)費(fèi)限500萬(wàn)元,實(shí)施年限3年)
針對(duì)球面全景應(yīng)用要求,研究機(jī)載、車(chē)載和手持便攜等設(shè)備獲取的多源數(shù)據(jù)處理與建模技術(shù),自然現(xiàn)象與動(dòng)植物快速精細(xì)建模與表現(xiàn)技術(shù),融合圖形圖像的表觀(guān)模型建模及交互表現(xiàn)方式,研制3D全景建模工具,全景模型精度達(dá)厘米級(jí),場(chǎng)景范圍不小于100公里。
2.3.2大規(guī)模復(fù)雜場(chǎng)景動(dòng)態(tài)演化模擬技術(shù)與系統(tǒng)(國(guó)撥經(jīng)費(fèi)限1000萬(wàn)元,實(shí)施年限3年)
重點(diǎn)研究基于數(shù)學(xué)物理特性的大規(guī)模復(fù)雜場(chǎng)景的高可信建模技術(shù);探索研究交互過(guò)程中復(fù)雜場(chǎng)景的演化規(guī)律,研發(fā)具有高度物理真實(shí)的動(dòng)態(tài)發(fā)展過(guò)程、發(fā)展?fàn)顟B(tài)模擬技術(shù)與平臺(tái),其中演化模擬的典型復(fù)雜場(chǎng)景不少于4個(gè),幀率不低于25幀/秒;提出有效的誤差度量方法和準(zhǔn)則,構(gòu)建模型可信性評(píng)估與驗(yàn)證平臺(tái)。
2.3.3大型全景互動(dòng)系統(tǒng)及其應(yīng)用示范(國(guó)撥經(jīng)費(fèi)限800萬(wàn)元,企業(yè)牽頭申報(bào),實(shí)施年限3年)
突破多視角高清內(nèi)容的高速自動(dòng)生成技術(shù)、實(shí)時(shí)角色植入與虛實(shí)合成技術(shù)、用戶(hù)人群實(shí)時(shí)交互技術(shù),研制多線(xiàn)索數(shù)字腳本編輯與內(nèi)容制作平臺(tái)。集成本項(xiàng)目研究成果,面向安全生產(chǎn)、仿真訓(xùn)練、文化科技等領(lǐng)域需求,研發(fā)大型全景互動(dòng)系統(tǒng)并應(yīng)用示范,系統(tǒng)總體性能和主要技術(shù)指標(biāo)達(dá)到2015年底國(guó)際先進(jìn)水平。