多模態(tài)AI重新定義人機(jī)交互方式
- 科技日?qǐng)?bào)
- 2024-10-24 20:04:46
據(jù)美國《福布斯》網(wǎng)站近日?qǐng)?bào)道,元宇宙平臺(tái)公司、OpenAI以及谷歌公司等巨頭,都推出了各自的多模態(tài)AI系統(tǒng),正不遺余力地加大對(duì)此類系統(tǒng)的研發(fā)投資,力求提高各種模態(tài)內(nèi)容輸出的精確度,從而改善AI與用戶的交互體驗(yàn)。
多模態(tài)AI標(biāo)志著一種范式變革。它將深刻改變很多行業(yè)的面貌,并重塑數(shù)字世界的格局。
賦予AI“多重感官”功能
人類是如何了解世界的?我們依賴視覺、聽覺和觸覺等多種感官,從無數(shù)來源接收信息。人腦將這些紛繁復(fù)雜的數(shù)據(jù)模式融合,繪制出一幅生動(dòng)的現(xiàn)實(shí)“畫卷”。
IBM公司官網(wǎng)這樣定義多模態(tài)AI:能集成和處理來自多種模態(tài)(數(shù)據(jù)類型)的機(jī)器學(xué)習(xí)模型,這些模態(tài)包括文本、圖像、音頻、視頻等形式的輸入。就像賦予AI一整套感官,使它能從多個(gè)角度感知并理解輸入的信息。
這種跨越不同模態(tài)理解和創(chuàng)建信息的能力,超越此前側(cè)重于集成和處理特定數(shù)據(jù)源的單模態(tài)AI,贏得了各大科技巨頭的青睞。
在今年的移動(dòng)通信大會(huì)上,高通公司將其開發(fā)的多模態(tài)大模型首次部署在安卓手機(jī)上。用戶無論是輸入照片,還是語音等信息,都能與AI助手順暢交流。例如,用戶可以拍一張美食照片向AI助手提問:這些食材都是什么?能做出什么菜?每道菜的熱量是多少?AI助手能基于照片信息,給出詳細(xì)的答案。
今年5月,OpenAI發(fā)布了多模態(tài)模型GPT-4o,其支持文本、音頻和圖像的任意組合輸入和輸出。隨后,谷歌也于第二天推出了自己的最新多模態(tài)AI產(chǎn)品Gemini 1.5 Pro。
9月25日,元宇宙平臺(tái)公司發(fā)布了其最新的開源大語言模型Llama 3.2。公司首席執(zhí)行官馬克·扎克伯格在主題演講中表示,這是該公司首個(gè)開源多模態(tài)模型,可同時(shí)處理文本和視覺數(shù)據(jù),標(biāo)志著AI在理解更復(fù)雜應(yīng)用場景方面取得了重大進(jìn)展。
悄然推動(dòng)各領(lǐng)域變革
多模態(tài)AI正悄然改變著多個(gè)領(lǐng)域的面貌。
在醫(yī)療保健領(lǐng)域,IBM旗下“沃森健康”正對(duì)病人的影像學(xué)數(shù)據(jù)、病歷文本和基因數(shù)據(jù)進(jìn)行綜合分析,幫助醫(yī)生更準(zhǔn)確地診斷疾病,有力支持醫(yī)生為病人制訂個(gè)性化治療方案。
創(chuàng)意產(chǎn)業(yè)也正在經(jīng)歷一場變革。數(shù)字營銷專家和電影制片人正借助這一技術(shù)打造定制內(nèi)容。試想,只需一個(gè)簡單的提示或概念,AI系統(tǒng)就能編撰出引人入勝的劇本,生成故事板(即一系列插圖排列在一起組成的可視化故事)、創(chuàng)作配樂,甚至制作出初步場景剪輯。
教育和培訓(xùn)領(lǐng)域也在多模態(tài)AI助力下向個(gè)性化學(xué)習(xí)邁進(jìn)。美國紐頓公司開發(fā)的自適應(yīng)學(xué)習(xí)平臺(tái)能利用多模態(tài)AI,深入分析學(xué)生的學(xué)習(xí)行為、表情和語音,實(shí)時(shí)調(diào)整教學(xué)內(nèi)容和難度。實(shí)驗(yàn)數(shù)據(jù)顯示,這種方法能將學(xué)生的學(xué)習(xí)效率提高40%。
客戶服務(wù)也是多模態(tài)AI系統(tǒng)令人興奮的應(yīng)用之一。聊天機(jī)器人不僅能回應(yīng)文本查詢,還能理解客戶的語調(diào),分析客戶的面部表情,并用適當(dāng)?shù)恼Z言和可視化線索作出回應(yīng)。這種更接近人類的交流有望徹底改變企業(yè)與客戶的互動(dòng)方式。
仍需克服技術(shù)倫理挑戰(zhàn)
但多模態(tài)AI發(fā)展也面臨諸多挑戰(zhàn)。
AI咨詢公司“隱空間”創(chuàng)始人亨瑞·艾德爾表示,多模態(tài)AI的強(qiáng)大之處在于能夠整合多種數(shù)據(jù)類型。然而,如何有效整合這些數(shù)據(jù)仍是一個(gè)技術(shù)難題。
此外,多模態(tài)AI模型在運(yùn)行過程中往往需要消耗大量算力資源,這無疑增加了其應(yīng)用成本。
更值得注意的是,多模態(tài)數(shù)據(jù)包含更多個(gè)人信息。當(dāng)多模態(tài)AI系統(tǒng)能輕松識(shí)別人臉、聲音乃至情緒狀態(tài)時(shí),如何確保個(gè)人隱私得到尊重與保護(hù)?又該如何采取有效措施,防止其被用于創(chuàng)建“深度偽造”或其他誤導(dǎo)性內(nèi)容?這些都是值得深思的問題。
關(guān)鍵詞:
福建舉行“微光計(jì)劃”行動(dòng)關(guān)愛白血病患兒家庭
- 大數(shù)據(jù)“千里眼”助力搶修復(fù)電“一戶不少”
- 村鎮(zhèn)建設(shè),福建打算這樣做
- 福建出臺(tái)具體措施 加快提升生物醫(yī)藥產(chǎn)業(yè)競爭力和綜合實(shí)力
- 投洽會(huì)協(xié)議總投資額創(chuàng)五年來新高
- 福建:下好全警反詐“一盤棋” 構(gòu)筑全民反詐新格局
- 全國最多!16家閩企上榜2023中國印刷包裝企業(yè)百強(qiáng)
- 奇異福建龍!福建首次發(fā)現(xiàn)恐龍化石
- “福建農(nóng)科優(yōu)秀青年獎(jiǎng)”設(shè)立
- 第八屆中國國際綠色創(chuàng)新發(fā)展大會(huì)舉行
- 多模態(tài)AI重新定義人機(jī)交互方式2024-10-24
- 中國經(jīng)濟(jì)樣本觀察·企業(yè)樣本篇丨打通電子工2024-10-24
- 應(yīng)急救援機(jī)器人:用科技守護(hù)安全2024-10-24
- 共繪數(shù)字新時(shí)代 2024中國程序員節(jié)即將開幕2024-10-24
- 新華網(wǎng)財(cái)經(jīng)觀察·企業(yè)行丨風(fēng)口浪尖的競逐—2024-10-24
- 2024科大訊飛全球1024開發(fā)者節(jié)提前劇透2024-10-24
- 企穩(wěn)回暖 消費(fèi)電子行業(yè)多公司三季度業(yè)績改2024-10-24
- 【好消息】北京協(xié)和醫(yī)學(xué)院張晶博士本周末蒞2024-10-24
- 微眾銀行即將參展“第二十六屆中國國際高新2024-10-23
- 熱血加速 燃情賽道 北京現(xiàn)代N Line體驗(yàn)2024-10-22
- 2024健康人居設(shè)計(jì)藝術(shù)節(jié)特邀VIP嘉賓 | 亙2024-10-22
- “一超多能”年度高端旗艦,vivo X200系列2024-10-22
- 安徽桐城禮讓風(fēng) 六尺巷中見天地2024-10-19
- 廣西梧州推進(jìn)城鄉(xiāng)綠化提升:生態(tài)好地 逐“2024-10-19
- 長三角多城氣溫跳水2024-10-19
- 第三十六屆中國仿真大會(huì)在江蘇揚(yáng)州召開2024-10-19
- 廣西梧州六堡茶“香飄”致富路 勾勒“良方2024-10-19
- “僑家樂”走進(jìn)福建閩清 南洋風(fēng)情溢僑鄉(xiāng)2024-10-19
- 北京市耕地保護(hù)規(guī)劃今起公示 促進(jìn)耕地集中2024-10-19
- 2024北京朝陽國際燈光節(jié)開幕 AI賦能盡顯夜2024-10-19
- 北京城市副中心綠色發(fā)展論壇將首次舉辦綠博2024-10-19
- 廣州雙層巴士增設(shè)英語翻譯服務(wù)海外采購商2024-10-19
- 全球李氏宗親“尋根” 超630冊(cè)族譜匯展“2024-10-19
- 國考報(bào)名時(shí)間將過半:熱門崗位競爭超“兩千2024-10-19
- 中央氣象臺(tái):19日起中東部將有大范圍雨雪天2024-10-19
- 有人文溫度的科技創(chuàng)新 用老年視角“解碼”2024-10-19
- 強(qiáng)冷空氣持續(xù)發(fā)威!周末中東部多地氣溫創(chuàng)新2024-10-19
- 冷!雙休日北京氣溫繼續(xù)下滑 明天小雨來襲2024-10-19
- 層林盡染、云海壯觀、稻浪翻涌……金秋十月2024-10-19
- 內(nèi)蒙古首府邀請(qǐng)?jiān)诤?1國外籍人士秋日訪青城2024-10-19