欧美精品九九_丝袜诱惑制服诱惑色一区在线观看_亚洲综合激情在线_欧美日韩在线观看视频小说_喷白浆一区二区_免费在线欧美黄色_欧美亚洲免费_亚洲人成网站在线在线观看_久久婷婷亚洲_久久成人一区_国产精品红桃_青青草国产成人99久久

多模態時代來了!AI虛擬數字人,掀起百億數據服務新藍海

有態度
2022
01/25
21:34
智東西
分享
評論

來源:智東西

作者 | 心緣

編輯 | 漠影

寫在前面:元宇宙、虛擬數字人概念火爆的2021,高質量訓練數據資源正成為雄心勃勃的AI企業們解鎖更強智能的關鍵燃料,通過對話國內唯一A股上市數據服務商海天瑞聲,我們試圖探討隱藏于這場新興技術浪潮幕后的基石角色,如何運用技術解決智能化升級過程中的核心痛點。

2022年,再不關注虛擬數字人,你就落伍啦!

在剛剛過去的一年,AI虛擬主播、虛擬學生、虛擬員工輪番上崗,成為元宇宙與人工智能兩大領域最熱門的技術賽道之一。

▲萬科首位數字化員工崔筱盼獲得萬科總部最佳新人獎

有些虛擬數字人已經表現得靈性十足,不僅發音標準自然、身體動作流暢,就連眨眼頻率、口型與聲音的匹配等細節都惟妙惟肖。

這些火遍大江南北的特殊生命體,通過越來越多元的形象定制、舒適的交互體驗,逐漸轉變為擁有更接近真實人類智商和情感的新型社會角色。

而「多模態技術」,正是打破單一感官的藩籬,讓AI虛擬形象越來越像人類的秘密武器。

一、破圈而來,“完美”虛擬人離不開的多模態

數據,是將真實世界與虛擬世界連接的橋梁。

在現實世界中,數據天然以「多模態」的形式存在,人類通過綜合運用視覺、聽覺、觸覺、嗅覺等多種感官,來接觸和理解大千世界。

為了探索實現通用人工智能(AGI)的路徑,人工智能(AI)從單模態走向多模態已是大勢所趨。

以前,Siri等語音助手只有聲音沒有臉,搜索只能依靠輸入文字,機器看不懂照片的深層含義。

如今,借助多模態技術,AI實現了圖像、視頻、音頻、語義文本等多維度資源的融合互補,不僅決策更加精準,還在行為和智商上更接近人類。

新冠疫情亦催化了多模態技術的落地進程。在隱私安全保護重視程度日益加強的趨勢下,多模態生物識別憑借更高的準確率和安全性,正取代基于指紋、人臉等單一生物特征的身份識別方法。

而深藏多種黑科技的AI虛擬主播,亦是基于多模態技術的快速演進,成為感知智能邁向認知智能階段的重要探索。

它們的精致面容、流暢表達、優美體態,離不開微表情追蹤、語音識別、語音合成、自然語言理解、動作捕捉等豐富技術的支撐。

▲虛擬數字人技術架構(來源:《2020年虛擬數字人發展白皮書》)

其中,AI手語主播要解決的技術難點尤其復雜。為了照顧到聽障人士的需求,它需要具備實時將中文、英文等語音“翻譯”成連貫手語的能力。

但手語有一套獨特的語法體系,如果來一段央視押韻狂魔朱廣權的段子“冷空氣非常強,但他強任他強,清風拂山崗,他橫任他橫,秋褲保健康”,那就極度考驗AI手語主播的理解和翻譯水準了。

要做到實時精確演示手語,AI主播需先將語音轉化成文字,再將健聽人士的文本語序轉化成手語語序,最后基于手語數據集進行手語合成,將相同的信息以視覺的形式傳遞給聽障人士。

在此過程中,獲得符合需求的訓練數據成為了最具挑戰性的問題之一。

這是因為,作為一種視覺語言,手語語言遠比語音語言模態復雜,既包含手型、手部位置等手控信息,又包含表情、口動、體態等非手控信息。

如果從2D視頻來采集手語運動過程中的數據,則不可避免會遇到動作被遮擋、人臉五官各區域區分不明顯、空間深度信息缺失等問題。

▲央視冬奧AI手語主播

綜合看來,通過專業設備采集的3D多模態數據,已經成為優化特定垂直場景AI虛擬數字人的智能化水平中,為數不多的解決方案之一。

怎樣獲得高品質的多模態訓練數據庫?AI基礎數據服務商的商業價值開始日益凸顯。

二、優質算法“殺手锏”:高質量數據背后的技術試煉

數據、算法、算力被并稱為「AI三要素」,數據質量的高低,往往決定AI算法模型的性能上限

隨著AI應用逐漸普及,位于基礎設施層的AI數據服務行業正發展地風生水起。根據知名市研機構IDC報告,到2025年,中國AI數據采標服務市場規模預計將增至123.4億元。

▲2020-2025年中國AI基礎數據服務市場規模預測(來源:IDC中國)

但如果你認為AI基礎數據服務是個純人工作坊,那你就太小瞧這個行業的技術含量了。

尤其是多模態技術爆發以來,相應的對多模態數據需求的增長,逐步暴露了“作坊式”數據采標團隊“人海”戰術的短板,整個數據市場正向滿足客戶長尾需求演進,對服務商技術屬性的要求一再加碼。

如何制定與算法匹配的數據方案?如何同步采集不同模態的數據?如何處理丟失的數據?如何保證不同模態數據的精準對齊?這些都極度考驗AI數據服務商的技術能力。

以獲評國家工信部新一代人工智能產業創新重點任務揭榜優勝單位、國家專精特新“小巨人”企業、國家重點軟件企業的海天瑞聲為例,這家企業在中國AI基礎數據采標服務市場中排名前列,也是A股唯一的AI數據服務上市公司,其多模態訓練數據解決方案最近獲得了智東西2021年度AI生產力創新獎。

根據其IPO文件,AI數據服務的核心技術可分為三個層次:訓練數據生產(包括設計、采集、加工、質檢),平臺工具(一體化數據處理平臺)以及基礎研究(語音識別、語音合成、計算機視覺、訓練數據集設計技術等)。

其中,在訓練數據生產層,多語種多模態訓練數據設計技術、采集及標注技術是高質量訓練數據的生產基礎

首先在設計階段,為了滿足AI算法的需求,AI數據服務商需深入理解客戶算法和應用場景,設計與之最優匹配的多模態訓練數據結構,并制定合理的原料數據采集方案。

通過設計多設備采集方案,以便同時獲取人發出的語音、視頻畫面、精細唇部動作等不同模態的信息,便于客戶匹配自身算法模型框架,實現視覺、聽覺等融合的多維度交互。整個過程非常考驗AI數據服務商的技術儲備和工程能力。

其次,在實際的采集環節中,數據損耗是常事,且造成損耗的原因迥異,而有經驗的AI數據服務商能用技術快速找出解法。

我們繼續以AI手語合成主播為例,采集手語數據會用到裝有傳感器的手套,這些手套由于并非專為手語而設計,因此在采集過程中難免會出現數據丟失的問題,一個動作很可能要做上百幀的數據修復,耗時耗力。

發現這一問題后,海天瑞聲技術研發團隊迅速啟動應對方案,歷經半個月研發出一款與硬件采集設備相匹配的自動導出、修復工具,極大提升了數據的處理效率。

修復好數據,還要應對「精細對齊」的挑戰。

在虛擬數字人、智能座艙等場景中,越來越多應用開始將語音識別和計算機視覺結合,以提高理解人類意圖的準確率。

像這樣需用多個攝像頭、傳感器等設備來采集數據的應用,又帶來新的難題——如何將不同設備記錄的影像、聲音等數據,實現同步標注對齊?

▲不同通道錄制的語音數據不對齊情況示例

大規模標注數據本來就是AI模型進一步優化性能的瓶頸,而多模態數據不僅標注工作量是單模態的數倍,還要解決多設備采集數據同步難的問題,這會進一步增加后續數據加工難度。

對此,海天瑞聲的解決思路是自研多通道采集工具和數據同步技術,多通道采集工具支持4路甚至更多語音數據同時錄入、自動對齊整合,數據同步技術可實現多通道采集原料數據的自動對齊,并做到多音頻文件起始點自動對齊誤差小于1毫秒,大幅提升訓練數據生產效率和質量。

借助數據同步技術,唇形動作與聲音的對齊能精確到毫秒級,這也是可以避免虛擬數字人說話時音畫不同步、對不上口型等尷尬局面背后的重要因素之一。

三、為更強智能輸送燃料,多模態數據強勢崛起

哪個AI應用不想實現更高的準確率、更自然貼心的交互能力呢?在更強智能需求的拉動下,基于多模態數據的AI算法模型日漸成為主流。

▲微軟多模態預訓練模型「女媧」可根據文本內容生成相應視頻

例如公安、金融等場景的身份鑒定,電商場景下的智能客服交互,未來自動駕駛場景的艙內艙外交互等等,數據準確率越高,有助于抵御越多的安全風險。而多模態生物識別不僅有助于保護信息安全,還能應對單一模態無法有效識別的戴口罩、手指磨繭、整容等特殊情況。

▲單一生物識別技術的特點

可以看到,如今AI垂直應用場景呈現碎片化特征,對多模態數據的需求更加復雜和長尾化。

這些新業務場景需求的變化,更為考驗AI數據服務商處理復雜交叉業務場景數據的綜合能力。

因此AI數據服務商必須具備與客戶算法團隊平行溝通的技術儲備,理解客戶希望用數據解決什么問題、設計什么結構的模型,才能用最小代價,給出高效高質的數據集解決方案,保證客戶算法取得盡可能好的落地效果。

在這樣的趨勢下,海天瑞聲等頭部品牌數據服務商的資源優勢將被進一步放大。

從海天瑞聲的IPO文件可以看到,這家公司已經積累了近千個自有知識產權的訓練數據產品、服務微軟、阿里巴巴、騰訊、百度、三星、字節跳動、亞馬遜、科大訊飛、商湯科技、中國科學院、清華大學等超過500家國內外客戶,并持有信息安全認證證書ISO/IEC 27701及管理體系認證證書ISO/IEC 27001。

▲2018-2020年海天瑞聲前五大客戶情況

過去三年,海天瑞聲的前五大客戶呈現高復購率,足見其產品的高粘性。

無論是知名科技公司的背書,還是經年累月沉淀的多語種語言學家團隊資源和穩定合作的供應商、客戶等上下游資源,都使得兼具技術壁壘與業務經驗的品牌數據服務商,更易成為確保多模態數據高效高質交付的首選。

結語:多模態終將主導智能產業未來

AI算法要想高質量,多模態數據得跟得上。

過去一年,應用場景的創新和機器學習算法的流行繼續帶動訓練數據需求爆發式增長。

在多模態大模型、虛擬數字人等熱門技術方向的驅動下,持續探索更強智能的AI應用,對高質量多模態訓練數據資產的需求愈發迫切。

當前多模態技術仍處于起步階段,多維度信息的轉化和融合尚不成熟,在真實場景下的泛化能力較為受限,距離實現人類級別的多模態感知能力還有較長的路要走。

這需要研發多模態AI應用的企業或研究機構與AI基礎數據服務商長期磨合,摸索出更加符合人類認知習慣的前沿多模態技術,幫助AI全面理解真實世界,最終更好地服務于未來的人類社會。

THE END
廣告、內容合作請點擊這里 尋求合作
深度
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

對于互聯網而言,社交需求是其用戶最原始也是最基本的需求,任何產品都不愿意放過這一需求。
態度
“最嫩的一波韭菜”,當賽力斯SF5疑似被停產后,車主們自我調侃道。
態度
美股上市、連年虧損、市值5400萬美元的團車網,在1月5日官宣造車,并發微博@蔚來汽車、理想汽車、小鵬汽車,配文:“你們覺得擠不?”
態度
據新浪財經1月14日報道,有市場消息稱知乎將考慮在香港IPO,籌資約3億美元。
態度
95后小沙回憶,10多年前,父母會說“你這次考試考一百分,我就帶你去吃肯德基。”如今,每次在吃什么上犯難的時候,小沙和朋友就會說“要不就吃肯德基算了。”
態度

相關推薦

1
3
欧美精品九九_丝袜诱惑制服诱惑色一区在线观看_亚洲综合激情在线_欧美日韩在线观看视频小说_喷白浆一区二区_免费在线欧美黄色_欧美亚洲免费_亚洲人成网站在线在线观看_久久婷婷亚洲_久久成人一区_国产精品红桃_青青草国产成人99久久
九一精品国产| 欧美aⅴ一区二区三区视频| 国产91一区| 麻豆精品在线| 午夜视频一区二区在线观看| 人在线成免费视频| 日本a级不卡| 亚洲精选91| 水野朝阳av一区二区三区| 日韩一区欧美| 日韩欧美一区免费| 日韩中文在线电影| 日韩精品麻豆| 日韩国产欧美| 国产精品va视频| 国产亚洲第一伦理第一区| 视频一区二区三区入口| 亚洲成人精选| 亚洲欧美日本国产专区一区| 一区在线免费| 老司机久久99久久精品播放免费| 狠狠干综合网| 国产视频一区在线观看一区免费| 激情久久中文字幕| 亚洲国产一区二区在线观看 | 日韩在线麻豆| 欧美在线日韩| 国产精品欧美大片| 天堂中文av在线资源库| 神马日本精品| 99日韩精品| 日韩精品亚洲专区在线观看| 国产日韩欧美在线播放不卡| 精品久久亚洲| 国产中文一区| 综合激情在线| 日本精品一区二区三区在线观看视频| 欧美伊人影院| 日本午夜精品久久久久| 欧美一区二区三区久久| 国产伦精品一区二区三区在线播放| 911亚洲精品| 国产欧美亚洲精品a| 九九九精品视频| 亚洲高清激情| 亚洲日产国产精品| 国产999精品在线观看| 亚洲大全视频| 国产精品18| 国产99精品| 奇米777国产一区国产二区| 国产传媒在线观看| 亚洲欧美日韩专区| 精品国产亚洲一区二区三区在线 | 日韩精品第二页| 国产日产精品_国产精品毛片 | 亚洲毛片在线| www.九色在线| 亚洲人成精品久久久| 福利精品在线| 欧美日韩91| 国产精品日本欧美一区二区三区| 日韩精品欧美精品| 天堂中文av在线资源库| 奇米色欧美一区二区三区| 久久九九国产| 国产精品多人| 伊人久久大香伊蕉在人线观看热v| 成人国产精品一区二区免费麻豆| 亚洲欧美日本国产| 91久久久精品国产| 日韩综合在线| 欧美极品中文字幕| 亚洲综合激情在线| 久久成人亚洲| 激情婷婷欧美| 精精国产xxxx视频在线野外| 国产精品美女在线观看直播| 日韩专区一卡二卡| 99国产精品久久久久久久| 黄色在线网站噜噜噜| 国产欧美日韩免费观看| 蜜臀久久久久久久| 狠狠干综合网| av亚洲在线观看| 欧美成人日韩| 99精品视频精品精品视频| 精品视频高潮| 日韩av片子| 亚洲天堂av影院| 亚洲精品**中文毛片| 97精品国产| 欧美日韩免费看片| 日本国产精品| 一区二区三区视频免费观看| 免费观看久久av| 99香蕉国产精品偷在线观看| 激情五月色综合国产精品| 美女亚洲一区| 日韩精品一区第一页| 午夜一级在线看亚洲| 亚洲欧美在线专区| 国产欧美丝祙| 精品久久久中文字幕| 日韩欧美三级| 欧美日韩国产免费观看| 免费成人性网站| 国产免费久久| 国产成人精品一区二区三区在线| av资源中文在线| 国精品一区二区| 亚洲免费成人av在线| 国产精品欧美在线观看| 久久99视频| 亚洲天堂黄色| 日韩av一区二区三区四区| 国产精品一区二区av日韩在线| 激情久久一区二区| 午夜欧美精品| 日本在线视频一区二区| 国产精品久久| 日韩一区三区| 免费在线看一区| 欧美一区自拍| 欧美.日韩.国产.一区.二区 | 在线视频亚洲| 日本va欧美va精品发布| 久久精品国产网站| 午夜免费一区| 欧美91在线| 麻豆久久精品| 国产精品国产三级国产在线观看| 日本综合字幕| 蜜臀久久久久久久| 日本久久精品| 日韩美女国产精品| 99视频精品全部免费在线视频| 日本成人中文字幕在线视频| 精品日韩视频| 国产精品色婷婷在线观看| 99精品电影| 久久精品国产在热久久| 国产视频一区在线观看一区免费| 日韩avvvv在线播放| 中文字幕系列一区| 国产伦一区二区三区| 免费av一区| 国产精品白丝久久av网站| 五月婷婷六月综合| 精品国产一区二区三区噜噜噜| 亚洲一区二区成人| www在线观看黄色| 国产精品一区高清| 亚洲国内欧美| 毛片在线网站| 国产麻豆一区| 日韩三级久久| 日韩精品一卡二卡三卡四卡无卡| 美女一区网站| 国产精品最新自拍| 丝袜美腿亚洲色图| 久久高清精品| 999国产精品永久免费视频app| 欧美一级网站| 首页亚洲欧美制服丝腿| 久久久久久色 | 国产亚洲精品自拍| 福利一区在线| 国产亚洲精品精品国产亚洲综合 | 国产精品亚洲综合色区韩国| 麻豆成人在线| 国产视频一区在线观看一区免费| 国产综合色区在线观看| 精品久久久网| 国产精品高潮呻吟久久久久| 亚洲乱码久久| 日韩精品导航| 久久a爱视频| 国产精品第一国产精品| 国产精品第一国产精品| 国产精品视频3p| 国产精品任我爽爆在线播放| 亚欧洲精品视频在线观看| 亚洲男女自偷自拍| 99国产精品久久久久久久| 欧美中文字幕| 亚洲伊人影院| 五月激激激综合网色播| 国产毛片一区| 日韩av黄色在线| 精品三级av| 日韩成人亚洲| 9久re热视频在线精品| 蜜臀91精品一区二区三区| 日韩欧美久久| 蜜桃久久久久| 久久九九精品| 麻豆久久精品| 精品一区视频| 不卡一区综合视频|