施普林格·自然:探索AI技術(shù)對出版流程與服務(wù)模式變革
□本報記者 尹琨
2019年,施普林格·自然出版了一本完全由AI(人工智能)生成,有關(guān)鋰離子電池最新研究進(jìn)展的圖書《鋰離子電池》,成為施普林格·自然AI應(yīng)用的重要里程碑,該書電子版下載量目前已達(dá)41.3萬。
2021年,施普林格·自然采用混合人機(jī)交互方式,出版了另一本AI生成的文獻(xiàn)綜述圖書《氣候、行星和進(jìn)化科學(xué):計算機(jī)生成的文獻(xiàn)綜述》,將人工撰寫的文本和計算機(jī)生成的文獻(xiàn)綜述融合在一起,成為將人機(jī)協(xié)作納入其出版實踐的首次嘗試。
今年,施普林格·自然又出版了采用人機(jī)交互方式生成的圖書《CRISPR——計算機(jī)生成的文獻(xiàn)綜述》,該書基于最新的自動摘要AI平臺,是施普林格·自然首次使用AI摘要生命科學(xué)領(lǐng)域的文獻(xiàn)生成圖書,也是首次有中國學(xué)者參與其AI生成圖書的實驗。該書電子版上線4個多月以來,已有2700多次訪問(包括電子書在線閱讀和下載),平均每章被訪問400多次。
不難看出,施普林格·自然近年來持續(xù)探索和應(yīng)用AI等新技術(shù)。圍繞AI技術(shù)對出版流程與服務(wù)模式帶來的變革,《中國新聞出版廣電報》記者日前對話施普林格·自然集團(tuán)大中華區(qū)總裁暨全球圖書業(yè)務(wù)總裁湯恩平。
應(yīng)對信息過載問題
湯恩平用“試驗”形容3本AI圖書。他希望這些試驗?zāi)軒椭┢樟指?middot;自然更好地了解AI如何用于改善編輯和出版過程,幫助研究人員提高研究效率,甚至引發(fā)討論。
什么樣的主題適合做AI圖書?前提是已經(jīng)擁有很多出版內(nèi)容的主題。“人類無法‘消化’所有出版了的內(nèi)容,但算法可以幫忙提供概覽并在某種程度上幫助研究者理解內(nèi)容,找出聯(lián)系,并在特定情境下告訴他們什么是有趣和重要的。”湯恩平表示,機(jī)器可以比人類更好、更中立、更快地總結(jié)大型文本語料庫,因此可以通過AI幫助研究界應(yīng)對無處不在的信息過載問題。
以CRISPR(規(guī)律間隔成簇短回文重復(fù)序列)及其相關(guān)技術(shù)為例,作為近年來重要的研究熱點,相關(guān)研究成果呈爆炸式增長。截至2022年6月,僅施普林格·自然就已出版了超過5.3萬篇相關(guān)論文。研究人員面臨著如何從大量文獻(xiàn)中快速了解和掌握該領(lǐng)域最新科學(xué)進(jìn)展的挑戰(zhàn),將AI應(yīng)用于學(xué)術(shù)出版的實踐無疑為應(yīng)對這類挑戰(zhàn)提供了解決方案。
《CRISPR——計算機(jī)生成的文獻(xiàn)綜述》主編之一,上??萍即髮W(xué)生命科學(xué)與技術(shù)學(xué)院教授劉冀瓏曾對此表示,CRISPR與鋰電池研究領(lǐng)域一樣,近年來都涌現(xiàn)了大量論文,因此非常適合使用AI更加快速和有效率地生成文獻(xiàn)綜述。相信在不久的將來,這一基于AI的文獻(xiàn)自動摘要系統(tǒng)將會進(jìn)一步促進(jìn)科學(xué)進(jìn)步,為人類的知識傳播作出革命性的貢獻(xiàn)。
人機(jī)交互而非取代人類
AI技術(shù)可以在出版中有各種程度不同的應(yīng)用。施普林格·自然目前出版的3本AI圖書,其中兩本采用人機(jī)交互模式。
湯恩平介紹了《CRISPR——計算機(jī)生成的文獻(xiàn)綜述》的出版流程。首先,主編團(tuán)隊根據(jù)自定的關(guān)鍵詞檢索施普林格·自然近年來出版的該領(lǐng)域的期刊論文,再根據(jù)研究領(lǐng)域知識圖譜計算及主編的理論框架在檢索結(jié)果中篩選出114篇論文。AI平臺在讀取這些論文的全文之后,自動生成摘要。最后,主編團(tuán)隊將這些文章摘要分類和排序后劃分為6章,并人工撰寫各章節(jié)的簡介,以方便讀者閱讀。
“施普林格·自然的目標(biāo)并不是用計算機(jī)取代人類作者或編輯。”湯恩平指出,對于研究界而言,最大的價值在于圖書的大部分仍將由人類作者撰寫,施普林格·自然為作者提供計算機(jī)生成的模板與目錄,從而大量減少作者寫作新書所需的時間,提高出版速度。2021年,已有500位作者在寫作早期從施普林格·自然獲得了這樣的模板支持。從編輯的角度來看,編輯決策終歸是人做出的,機(jī)器不能承擔(dān)責(zé)任,這是一個永遠(yuǎn)無法被替代的工作。
AI圖書可以在很短的時間內(nèi)消化大量已出版的內(nèi)容并用于總結(jié)復(fù)雜的科學(xué)主題,其優(yōu)勢在成書速度,以及中立地使用所有可用的資源。“理想情況下,計算機(jī)生成的書與人類作者寫的書沒有區(qū)別。”湯恩平建議根據(jù)內(nèi)容而不是作者是人類或計算機(jī)來選擇圖書,那對讀者來說會是一件好事。從長遠(yuǎn)來看,這也有助于推動出版業(yè)步入知識創(chuàng)造的領(lǐng)域。
AI是不可或缺的組成部分
用于優(yōu)化工作流程的AI等技術(shù),使出版更快、更容易、更準(zhǔn)確。除了自動生成內(nèi)容之外,施普林格·自然還將AI應(yīng)用于圖書出版過程中的其他許多領(lǐng)域。
比如,自2021年10月以來,施普林格·自然開始利用DeepL AI翻譯工具,為圖書作者提供中文等多種語言譯成英語的免費服務(wù),并無縫整合到圖書出版流程中。翻譯的內(nèi)容會施以人工檢查,以確保準(zhǔn)確性。
在期刊出版中,施普林格·自然使用AI來加速同行評審,以及發(fā)現(xiàn)虛假論文。今年5月,施普林格·自然推出名為PySciDetect的開源軟件,在稿件提交階段就可識別虛假研究和數(shù)據(jù),供整個研究和學(xué)術(shù)界用于應(yīng)對虛假科學(xué)論文。該軟件迄今已為施普林格·自然檢查了超過380萬篇期刊文章和超過250萬個圖書章節(jié)。
“AI是我們系統(tǒng)不可或缺的組成部分,我們必定會繼續(xù)對它予以特別的重視。”湯恩平表示,施普林格·自然會繼續(xù)開發(fā)算法,但不會只出版計算機(jī)生成的內(nèi)容,而是將其視為一種作者服務(wù),讓作者可以按需使用。
“我們非常相信人機(jī)協(xié)作,讓各個方面都做自己擅長的事情。”湯恩平告訴記者,創(chuàng)造力和責(zé)任交給人類,大型文本語料庫的數(shù)據(jù)處理可以由機(jī)器來完成。這將更好更快地帶來科學(xué)產(chǎn)出,并在更短時間內(nèi)取得更大進(jìn)步。
- 2022-08-03有書做伴故事多
- 2022-08-03吉林:退伍軍人變身“真人圖書”
- 2022-08-03浙江:軍地共建“書香筧橋”
- 2022-08-03天津: 線上書香推“八一特輯”