表述明確,文筆犀凌!未來的某天,一早翻看新聞的你,不禁贊嘆起某位記者的高水平。不過你心里也清楚,即便當(dāng)面聽到,這位從不吃飯、睡覺的“作者”也不會說聲謝謝。因為“他”,是機器人。
預(yù)言完畢,讓我們回到今天。奧運會雖然結(jié)束了,但寫稿機器人在新聞界所引發(fā)的震動,乃至恐懼,依然余音未消。有人預(yù)言,在不遠(yuǎn)的未來,寫稿機器人將徹底取代人力記者。
那么,所有的媒體同行,以及看熱鬧的圍觀群眾,寫稿機器人到底是我們的對手還是幫手呢?
機器記者能拿普利策獎
人工智能注定將滲透到各個行業(yè),媒體業(yè)亦不能“幸免”。
奧運會期間,寫稿機器人“張小明”通過直接對接奧組委的數(shù)據(jù)庫信息,實時撰寫新聞稿件,以電視直播的速度發(fā)布稿件,主要報道了乒乓球、網(wǎng)球、羽毛球和女足的比賽,在16天的時間內(nèi)共發(fā)布456篇奧運簡訊和資訊,平均每條新聞生成到發(fā)布時間不到2秒鐘,為103萬讀者提供了第一時間的賽事報道,單篇最高閱讀量超過11萬。
隨著自然語言處理、大數(shù)據(jù)計算等人工智能技術(shù)的發(fā)展,國內(nèi)外許多媒體已經(jīng)開始了機器人報道的探索與實踐。以寫稿機器人為代表的人工智能可讓大數(shù)據(jù)從負(fù)擔(dān)變成便利,重塑媒體的內(nèi)容生產(chǎn)和分散發(fā)布。
美國《紐約時報》在財報季、運動比賽報道中用機器人寫稿已成慣例,其數(shù)字部門開發(fā)的機器人編輯Blossomblot每天推送300篇文章,受推薦文章的平均閱讀量是未推薦文章的38倍;美聯(lián)社在過去一年多時間里均使用Wordsmith系統(tǒng)編發(fā)企業(yè)財報;國際文傳電訊社計劃用雅虎的機器人算法來發(fā)布美式橄欖球回顧式報道;成立于2007年的Automated Insights是一家有美聯(lián)社融資背景的科技公司,2015年寫了150億篇文章,宣稱自己是世界上最大的內(nèi)容生產(chǎn)者;路透社也在嘗試發(fā)表機器撰寫的文章,其負(fù)責(zé)人稱在一次盲測中,機器的作品表現(xiàn)得比人類作品更具可讀性……有專家預(yù)言,機器人將在20年內(nèi)競逐普利策獎。
寫稿機器人在國內(nèi)的發(fā)展也十分迅速。2015年9月,騰訊財經(jīng)一篇名為《8月CPI漲2%創(chuàng)12個月新高》的文章刷爆各大媒體頭條,其作者就是騰訊開發(fā)的自動化新聞寫作機器人“Dreamwriter”。今年5月29日,四川綿陽發(fā)生地震,一條題為《綿陽安州發(fā)生4.3級地震》的新聞開始流傳于網(wǎng)絡(luò),寫下這篇560字的新聞稿件并第一時間發(fā)布在網(wǎng)絡(luò)上的正是國家地震臺網(wǎng)研發(fā)的智能機器人,且全程僅花了6秒鐘,可以說幾乎跑贏了地震波的速度。
人工智能發(fā)展的必然結(jié)果
媒體領(lǐng)域遭遇機器人入侵,原因就在于自然識別和信息數(shù)據(jù)庫技術(shù)已經(jīng)達到了相當(dāng)成熟度,且這種成熟度是和新聞媒體的要求很好地匹配了起來。
寫稿機器人的背后是一個高度結(jié)構(gòu)化的海量信息網(wǎng),無論是文案、信息圖表或其他表達形式,機器人編輯都可以像音樂家擺弄音符一樣去重構(gòu)組裝。無論是天氣預(yù)報還是地震預(yù)警再到賽事報道等各種信息,都最終能夠放入到機器人數(shù)據(jù)庫中去,這樣的系統(tǒng)潛力巨大,可以構(gòu)建無限可能。
北大計算機研究院教授萬小軍告訴記者,寫稿機器人實際上是一種數(shù)字技術(shù)和智能寫稿編程系統(tǒng)。它用機器代替人完成實時監(jiān)控信息源,利用文本解析和信息抽取技術(shù)實現(xiàn)自動信息抽取,采用機器學(xué)習(xí)算法并融合編輯記者團隊的經(jīng)驗和智慧,以模板和規(guī)則知識庫的方式,根據(jù)實時抽取的信息作出判斷,輸出相應(yīng)的模板及規(guī)則知識庫內(nèi)容,從而產(chǎn)生新聞,以此應(yīng)對海量、高速、多樣的大數(shù)據(jù)產(chǎn)生的信息。
和傳統(tǒng)媒體人相比,寫稿機器人可以瞬間完成海量閱讀、海量分析,尤其是針對上市公司的公告、財務(wù)報表、官方發(fā)布、社交平臺、證券行情等信息源。與此同時,又可以根據(jù)互聯(lián)網(wǎng)活躍點擊量數(shù)據(jù),瞬時篩選出下一個熱點新聞,并通過后臺的算法快速合成新聞。整體上看來,寫稿機器人在速度和數(shù)量上有著不可忽視的絕對優(yōu)勢。
依靠海量的大數(shù)據(jù)平臺和不斷演進的算法設(shè)計,生成一篇深度報道的時間已經(jīng)由最初的30秒縮短到2秒以內(nèi),其精度和準(zhǔn)確率還在不斷提升,而且擬人化、情感化的技能也在持續(xù)加強。
“張小明”團隊的技術(shù)總監(jiān)李磊說,近兩年的國際自然語言大會(ACL)給人感受最深的是,在自然語言處理和理解方面,機器深度學(xué)習(xí)的進步非常之大,2016年幾乎超過2/3的論文在研究深度學(xué)習(xí)領(lǐng)域。雖然深度學(xué)習(xí)和自然語言處理在文本方面還沒有達到語音和圖像處理技術(shù)一樣的成熟度,但現(xiàn)在也已有了很大進步。事實上,國外已經(jīng)出現(xiàn)了新一代智能寫作軟件“Narrative”。
“活人”記者依然是師傅
當(dāng)然,純技術(shù)角度做新聞編輯報道還是存在一定局限性。萬年進化而成的人腦,絕非幾十歲的機器人能輕易代替。
美國密蘇里大學(xué)教授唐納德·里諾茲曾表示,大多數(shù)自然語言系統(tǒng)都在簡單描述一個事件,但大多數(shù)新聞都是描繪性的,甚至是事件驅(qū)動型的。人工智能系統(tǒng)在進行新聞創(chuàng)作時需要解決海量技術(shù)難題,包括自然語言處理中的自動摘要、文本分類等,還有知識庫和知識發(fā)現(xiàn)(KDD)等相關(guān)技術(shù),比如實體定義、關(guān)系抽取、問答系統(tǒng)等。簡單來說,就是機器首先需要理解自然語言,然后通過知識管理弄明白新聞中各個要素之間的關(guān)系。
有問題,就有答案。谷歌開源了SyntaxNet,將神經(jīng)網(wǎng)絡(luò)和搜索技術(shù)結(jié)合起來,在解決歧義問題上取得顯著進展,該軟件能像訓(xùn)練有素的語言學(xué)家一樣分析簡單句法;Facebook推出了文本理解引擎DeepText,每秒能理解幾千篇博文內(nèi)容,語言種類多達20多種,準(zhǔn)確度接近人類水平。
今年6月,人工智能創(chuàng)業(yè)公司Maluuba公司發(fā)表了一篇關(guān)于機器理解的論文,提出了目前最先進的機器閱讀理解系統(tǒng)EpiReader,該模型在CNN和童書測試(CBT)兩個數(shù)據(jù)集上的成績都超過了谷歌DeepMind、Facebook和IBM。
EpiReader采取兩個步驟來確定問題答案。第一步(Extractor),使用了一個雙向GPU逐字閱讀故事和問題,接著采用一種類似Pointer Network中的Attention機制在故事中挑選出可能作為答案備選的單詞。第二步(Reasoner),這些備選答案被插入(完型填空)式的問題中,構(gòu)成一些“假設(shè)”,接著卷積神經(jīng)網(wǎng)絡(luò)會將每個假設(shè)與故事中的每個句子加以比較,尋找文本蘊涵(Textual Entailment)關(guān)系。簡單來說,蘊涵是指,兩個陳述具有很強的相關(guān)性。因此,最近似故事假設(shè)的蘊涵得分最高。最后,將蘊涵得分與第一步得到的分?jǐn)?shù)相結(jié)合,給出每一個備選答案正確的概率。
萬小軍教授說,記者聯(lián)系采訪對象,觀察對方,用心去感受人物,再對大量資料進行整理,做出取舍,對這些復(fù)雜細(xì)致的情感工作,目前人工智能機器人用深度學(xué)習(xí)的算法尚不能搞定。由于目前的技術(shù)制約,寫稿機器人還無法開展自行思考,智能寫稿系統(tǒng)在稿件的深度以及稿件個性化上很難在短時間內(nèi)取得突破。從這個意義上講,寫稿機器人為傳統(tǒng)記者節(jié)省了大量查閱資料的檢索時間,有助于人力記者寫出更有深度和富含情感的新聞作品。新聞的字里行間包含著記者的判斷、價值觀與人文關(guān)懷,未來新聞人應(yīng)該把精力重點放在機器人無法完成的調(diào)查性、深度解釋性報道上,這樣雙方才可以真正實現(xiàn)互相補充、相得益彰。
李磊說,新聞機器人并不會取代記者,相反會成為記者的好幫手。機器人寫稿將大大提高記者產(chǎn)出新聞的數(shù)量和速度,節(jié)省媒體的時間成本和運營成本,提升媒體運營的成本收益率。用戶的閱讀興趣呈長尾分布,單篇閱讀量高的新聞可以由人力記者來寫,但是更大量的單篇閱讀量稍低的新聞同樣很有價值,由人來寫則收益率并不高,而請機器人來寫既能彌補這部分閱讀需求,又能降低新聞采編的成本,可謂一舉多得。
——記者觀察——
有了“他”們會更好
撰寫這篇稿件時,我始終無法不去想這樣一個問題:寫稿機器人來了,自己會不會失業(yè)呢?
當(dāng)然,目前還不至于。對于媒體,內(nèi)容是王道,沒有深度的媒體人可能會被寫稿機器人淘汰,而能做出好內(nèi)容的深度報道記者則不會。
人工智能要想達到替代人類的水平,需要好幾個階段的演化。第一階段首先是在各個垂直領(lǐng)域誕生若干超級智能,比如健康和知識問答領(lǐng)域的“沃森”、圍棋領(lǐng)域的“AlphaGo”等。這些垂直超級智能可以在特定領(lǐng)域內(nèi)展現(xiàn)出遠(yuǎn)超人類的能力,但是在擅長領(lǐng)域之外沒有任何作為。不過,他們將為誕生在所有領(lǐng)域內(nèi)具備超人能力的終極智能打下初步基礎(chǔ)。
知識改變命運,技術(shù)改變世界。相信在以寫稿機器人為代表的人工智能技術(shù)引領(lǐng)下,全球終將步入一個全新的信息技術(shù)時代。憑借不斷進步的技術(shù)的力量和更多的試驗、更早的調(diào)整及更好的準(zhǔn)備,人類將會建設(shè)出一個更加智能化的美好世界。
2022-09-13 10:13
2021-10-12 10:11
2021-08-28 10:43
2021-08-28 10:40
2021-08-28 10:33
2021-08-28 08:54
2021-08-28 08:54
2021-08-28 08:48
2021-08-27 10:57
2021-08-26 09:41