▲百度虛擬數字人度曉曉
▲度曉曉高考作文《苦練本手,方能妙手隨成》節選
▲ERNIE 3.0 Zeus大模型
要想教會AI寫出一篇完整的高考作文?這可不是件容易事。
無論是AI還是人類,都需要先審題。不過AI的審題方式與人類有所不同,它們主要通過識別網絡和捲積神經網絡從大段的作文素材中提取題目,並將其遞給下一神經網絡。
而難倒無數考生的立意過程,對於AI來說也是不小的挑戰。AI需要通過一整套讀題網絡來猜測哪一個立意更有可能是正確立意。由AI創作的一些搞笑文章,往往都是在這個階段出現了一定偏差。
隨後寫作的過程,則是根據考生的寫作習慣各自選擇的階段。而AI也會在大量的訓練後建立自己的寫作模型。
和人類不同的是,AI可以在極短的時間內“寫完”多篇高考作文,但也比人們多出一個步驟,找到最好的一篇高考作文。而這個“最好”的評判標準,也是AI在大量的訓練中自己得出的一套標準。
AI的創作水平究竟提高到什麼水準?我們可以從高考作文中一窺真相。
早在2016年,微軟小冰就曾挑戰過2016年北京捲高考作文《神奇的書簽》。可以看到,這時候AI寫作還處在比較初級的階段,多生成一些短句,並且病句頻出。而在六年後,度曉曉就已經能夠根據複雜的材料,寫出一篇高分作文。
▲微軟小冰寫高考作文(左)、百度度曉曉寫高考作文(右)
由此可見,AI內容創作的水平正在不斷提升。而這背後正是科技公司持續多年投入研發的成果,百度也已經在這條道路上扎根多年。
你可能沒有發現,在我們日常生活中,已經有不少AI內容創作的產品誕生。
在AI的世界里,很多事物都有了一些新的玩法。你在鍵盤上,敲入幾個節奏,AI就能幫你創造出一段新的旋律;你設定好場景,輸入想要表達的內容,選取好顏色,AI就能以此創造出新的畫作。
而在一些作詞、作詩等文本創作方面,AI已然成為新的內容創作者主體。
百度認為,AIGC是繼UGC、PGC之後一種新型的內容生產方式,主要指運用人工智能技術自動生產內容。很多AI虛擬數字人都是AIGC的重要文化輸出群體。
AI寫出金句頻出的高考作文並非易事,其背後也離不開AI大模型的技術支撐。相較於其他的大模型,百度文心大模型擁有的兩大殺手鐧,“產業級”定位和“知識增強”。
面對AI大模型的“產業級”定位,在百度看來,文心大模型的技術都是根據實際的產業應用場景打造的。
為瞭解決這一痛點,百度打造了自己的第二大殺手鐧“知識增強”。
百度通過“知識增強”的方法,將數據與知識融合,讓百度文心大模型相較於其他大模型學習效率更高、可解釋性更好。
當大模型的通用性更好,泛化性更強時,將會大大降低AI開發和應用的門檻。如果說知識圖譜讓知識之間有着更緊密的內在邏輯,那麼“知識增強”則為減少樣本數據提供新的解決方式。
目前來看,百度文心大模型的升級,為AI創作提供了更多的發揮空間。
▲百度文心大模型全景圖
2022-2023年中國虛擬人行業深度研究及投資價值分析報告
《2022虛擬人產業研究報告》發佈虛擬人發展形態可視化“PROICE模型”