日前,Gartner發(fā)布了2022年重要戰(zhàn)略技術(shù)趨勢(shì)。其中,生成式人工智能(Generative Artificial Intelligence)位列12項(xiàng)重要戰(zhàn)略之首。同時(shí)Gartner預(yù)計(jì),到2025年,生成式人工智能將占所有生成數(shù)據(jù)的10%,而目前這一比例還不到1%。
而在2020年Gartner發(fā)布《人工智能技術(shù)成熟度曲線報(bào)告2020(Hype Cycle for Artificial Intelligence,2020)》時(shí),生成式人工智能作為新增技術(shù)熱點(diǎn)才首次被提出。
此外,在今年《Hype Cycle for Artificial Intelligence,2021》報(bào)告中,生成式人工智能同樣位列其中。
以上種種跡象表明,生成式AI已經(jīng)成為未來(lái)舉足輕重的技術(shù)趨勢(shì)。那么,生成式AI究竟是什么?生成式AI又能給智能時(shí)代帶來(lái)什么?
Vol.1
生成式AI——訓(xùn)練后的再創(chuàng)造
對(duì)于生成式AI,Gartner這樣定義:通過(guò)各種機(jī)器學(xué)習(xí)(ML)方法從數(shù)據(jù)中學(xué)習(xí)工件的組件(要素),進(jìn)而生成全新的、完全原創(chuàng)的、真實(shí)的工件(一個(gè)產(chǎn)品或物品或任務(wù)),這些工件與訓(xùn)練數(shù)據(jù)保持相似,而不是復(fù)制。
簡(jiǎn)單理解,生成式AI就是利用現(xiàn)有文本、音頻文件或圖像創(chuàng)建新內(nèi)容的技術(shù)。使用生成 AI,計(jì)算機(jī)檢測(cè)與輸入相關(guān)的基本模式并生成類似內(nèi)容。
Vol.2
GANs——生成式AI的核心技術(shù)
生成式對(duì)抗網(wǎng)絡(luò)(GANs, Generative Adversarial Networks ),是生成式AI的關(guān)鍵技術(shù)。其本質(zhì)是一種深度學(xué)習(xí)模型,是近年來(lái)復(fù)雜分布上無(wú)監(jiān)督學(xué)習(xí)最具前景的方法之一。
在原理上,生成式對(duì)抗網(wǎng)絡(luò)使用兩個(gè)神經(jīng)網(wǎng)絡(luò)相互對(duì)立,一個(gè)生成器和一個(gè)判別器。生成器或生成網(wǎng)絡(luò),負(fù)責(zé)生成類似于源數(shù)據(jù)的新數(shù)據(jù)或內(nèi)容,判別器或判別網(wǎng)絡(luò)則負(fù)責(zé)區(qū)分源數(shù)據(jù)和生成數(shù)據(jù)。經(jīng)過(guò)交替周期訓(xùn)練,生成器不斷學(xué)習(xí)生成更逼真的數(shù)據(jù),判別器則更善于區(qū)分假數(shù)據(jù)和真實(shí)數(shù)據(jù)?梢园袵ANs想象成一個(gè)造假者和一個(gè)在貓捉老鼠游戲中的警察,造假者正在學(xué)習(xí)傳遞假幣,而警察正在學(xué)習(xí)檢測(cè)假幣。漸漸地,雙方在對(duì)抗中都不斷完善。
Vol.3
AI生“萬(wàn)物”——生成式AI商業(yè)應(yīng)用
當(dāng)下,生成式AI已在研究和商業(yè)的多種場(chǎng)景得到應(yīng)用,如創(chuàng)建軟件代碼、促進(jìn)藥物研發(fā)和有針對(duì)性的營(yíng)銷等。具體而言:
生成圖形:AI可以從藝術(shù)品中抽象視覺(jué)圖案,然后將這些圖案應(yīng)用到具有該藝術(shù)品特征的虛擬圖像再現(xiàn)中。這些算法還可以將任何粗糙的涂鴉轉(zhuǎn)換為令人印象深刻的繪圖,令其似乎是由描繪真實(shí)世界的專業(yè)人類藝術(shù)家創(chuàng)作的。
生成照片:生成式AI可以通過(guò)生成并疊加到原始任何缺失、模糊或誤導(dǎo)性的視覺(jué)元素上來(lái)自動(dòng)更正照片,還可以將任何低分辨率原始圖像轉(zhuǎn)換為高分辨率版本,也可以通過(guò)混合現(xiàn)有的肖像或從任何特定的肖像中抽象特征來(lái)產(chǎn)生自然的外觀,或者從語(yǔ)義標(biāo)簽中生成逼真的圖像。
生成音頻:生成式AI可以將任何計(jì)算機(jī)生成的聲音渲染成一個(gè)真正聽起來(lái)像是在人類聲帶中自然產(chǎn)生的聲音,也可以將文本翻譯成語(yǔ)音、可以組成音樂(lè)。同樣,生成式AI也可以生成視頻、文本、字幕等。
生成材料:生成式AI甚至可以通過(guò)3D打印、CRISPR和其他技術(shù)從零開始呈現(xiàn)假肢、有機(jī)分子和其他物品。
Vol.4
迪斯尼、Netflix、影譜科技等率先發(fā)力
那么,如今哪些公司在發(fā)力生成式AI呢。通過(guò)其能生成音視頻、字幕等很容易聯(lián)想到,傳媒娛樂(lè)公司一定在使用。
的確,包括迪士尼、Netflix等娛樂(lè)傳媒巨頭均在嘗試用生成式AI代替標(biāo)準(zhǔn)內(nèi)容制作。例如迪士尼借助生成式AI生成動(dòng)畫,只需通過(guò)文本描述某些活動(dòng),而不是注釋數(shù)據(jù)和大量訓(xùn)練就能創(chuàng)建動(dòng)畫、電影劇本視頻。
Netflix會(huì)借助生成式AI抽取符合觀影習(xí)慣和需求的畫面,然后把這些圖片制作成內(nèi)容封面,以降低內(nèi)容搜尋難度,提升視頻制作效率。
去年9月上市的Unity是3D生成型AI的推動(dòng)者。全球有超過(guò)一半的移動(dòng)、PC 和主機(jī)游戲采用了其生成引擎來(lái)制作,其3D-AI技術(shù)也廣泛應(yīng)用于工業(yè)設(shè)計(jì)的3D模型搭建,VR/AR設(shè)備內(nèi)容創(chuàng)作以及影視特效制作。
此外,一家名為Insilico Medicine(英科智能)的AI藥物研發(fā)公司也是生成式AI的應(yīng)用者。作為一家抗衰老及癌癥治療藥物研發(fā)商,Insilico Medicine依托基因組學(xué)、醫(yī)療大數(shù)據(jù)及AI技術(shù)等技術(shù)手段,專注于癌癥治療、抗衰老藥物的研發(fā)、生產(chǎn)及銷售。同時(shí)該公司也是全球第一家應(yīng)用GANs,2015年在全球范圍內(nèi)率先利用生成對(duì)抗網(wǎng)絡(luò)(GANs)和強(qiáng)化學(xué)習(xí)(RL)技術(shù),生成具有特定性質(zhì)的藥物分子結(jié)構(gòu)。
不止國(guó)外,國(guó)內(nèi)的影譜科技在2018年底便發(fā)布AGC智能影像生產(chǎn)引擎,這也是國(guó)內(nèi)最早一批借助生成式AI開發(fā)的技術(shù)框架。
影譜科技的智能影像生成引擎MAGC已率先應(yīng)用在傳媒娛樂(lè)領(lǐng)域,被知名電視臺(tái)、電信運(yùn)營(yíng)商、短視頻平臺(tái)廣泛采納。除此之外,MAGC還廣泛應(yīng)用于數(shù)字人的3D成像,影視特效制作及數(shù)字孿生、虛擬主播、虛擬課堂等數(shù)字產(chǎn)權(quán)場(chǎng)景。
在文娛領(lǐng)域,影譜科技打造的智能文娛解決方案可以幫助產(chǎn)業(yè)推動(dòng)視頻自動(dòng)化生產(chǎn),提高內(nèi)容生產(chǎn)效率,在視頻幀審校、視頻過(guò)濾、內(nèi)容推薦到視頻審核、視頻深度預(yù)測(cè)、流媒體視頻及短視頻內(nèi)容生產(chǎn)、故事可視化等產(chǎn)業(yè)環(huán)節(jié)應(yīng)用。
在傳媒領(lǐng)域,影譜科技推出的智慧傳媒平臺(tái)服務(wù),從內(nèi)容創(chuàng)建到分發(fā),形成以元數(shù)據(jù)為基本單位的一站式智能影像技術(shù)服務(wù),提供包括批量化創(chuàng)建智能影像、視頻資產(chǎn)管理與分析、智能影像運(yùn)營(yíng)、再到智能視頻商業(yè)化的全過(guò)程。
基于影譜科技智能影像技術(shù)的AI方案,可在處理新聞、體育賽事等內(nèi)容發(fā)揮作用。例如,實(shí)時(shí)自動(dòng)繪制虛擬越位線,包括徽標(biāo),識(shí)別名人,提取字幕、人物圖像等。