智东西(公众号:zhidxcom)
编译 | 徐豫
编辑 | 心缘
智东西10月12日消息(xi),全球顶尖(jian)科(ke)(ke)学(xue)(xue)学(xue)(xue)术期刊《Nature》于(yu)10月10日发表了(le)一篇科(ke)(ke)学(xue)(xue)家利用人工(gong)智能(AI)工(gong)具(ju)(ju)做(zuo)科(ke)(ke)学(xue)(xue)研究(jiu)(jiu)的行业观察,发现AI工(gong)具(ju)(ju)正在(zai)改(gai)变传统的科(ke)(ke)研工(gong)作方式。目前(qian),许多AI工(gong)具(ju)(ju)可(ke)以帮(bang)研究(jiu)(jiu)人员在(zai)大量(liang)文献中筛选(xuan)出所(suo)需资料,从而使科(ke)(ke)学(xue)(xue)研究(jiu)(jiu)更加高效。
这些用于(yu)科学研究检索(suo)的AI工(gong)具(ju)基于(yu)大语言模(mo)型(xing)(LLM),其不仅(jin)可(ke)以(yi)搜集、筛(shai)选现有研究文献(xian),还可(ke)以(yi)总结、列举文中的关键发现。背后的AI公司不断提(ti)升这些模(mo)型(xing)的性能,并(bing)定期推出新(xin)的AI工(gong)具(ju)。
《Nature》杂(za)志采访了多位AI科学检索工(gong)具(ju)的开发者和使用者后,汇集了他们的实际上手体验(yan),以(yi)及(ji)使用这些AI工(gong)具(ju)的潜在风险。

一、科学家用AI工具了解科研方向、收集科研资料、撰写文献综述
据《Nature》统计,市(shi)面上最受欢迎的AI科学检索(suo)工(gong)具包括Elicit、Consensus和You,它们为(wei)研究人员提(ti)供了(le)多种高效完成文献综述的方式。
1、美国AI论文生成公司Elicit:自动化完成文献综述
当研究人员(yuan)在(zai)Elicit中输入(ru)一个研究问(wen)题后,该AI工具会列出相(xiang)关论(lun)文,并总结这些(xie)论(lun)文的(de)主要发(fa)现。
在(zai)此基础上,研(yan)究人员还可(ke)以针(zhen)对某一篇论文继续(xu)提问,以及指定(ding)留下(xia)某一本(ben)期刊或某一种研(yan)究类型的内(nei)容。
2、美国AI学术搜索引擎公司Consensus:可视化科研行业共识
公(gong)司(si)同名AI工具Consensus可以帮研究人员搜集、整理科学界对某个科学课题有(you)哪些说(shuo)法和争议。
举个例子(zi),当研(yan)究人员输入“氯胺酮可以(yi)治疗抑郁症吗(ma)”这个问(wen)题后(hou),该(gai)AI工(gong)具会生成一(yi)个“Consensus meter(共识度量(liang)器)”,其会总结支持、反(fan)对(dui)(dui)或不确定该(gai)假(jia)设的论(lun)点和(he)论(lun)据,以(yi)显示(shi)科学界对(dui)(dui)上述(shu)问(wen)题的共识程度。

▲Consensus meter(共(gong)识度量器)可(ke)以更直观地展示科研行业(ye)共(gong)识(图源:《Nature》)
Consensus的首席执(zhi)行官(guan)Eric Olson(埃(ai)里克·奥(ao)尔森)称(cheng),其AI工(gong)具(ju)虽(sui)然(ran)不能替代研究(jiu)人员去深入分(fen)析论文(wen)内容,但可以有效帮助他们速览(lan)研究(jiu)动态并归(gui)纳主(zhu)流(liu)研究(jiu)方向。
3、美国AI学术搜索引擎公司You:个性化科研研究
You方(fang)面自(zi)称其同名AI工(gong)具“You”,是第一个结(jie)合(he)了文献(xian)最新引用数据(ju)的AI检(jian)索(suo)(suo)工(gong)具。该AI工(gong)具为研究(jiu)人员(yuan)提供了探(tan)索(suo)(suo)研究(jiu)问题的多种模(mo)式(shi),例如(ru)其“genius mode(天才(cai)模(mo)式(shi))”会(hui)以(yi)图表的形式(shi)反馈检(jian)索(suo)(suo)结(jie)果(guo)。
上(shang)个(ge)(ge)月,You还推出了一款(kuan)允许(xu)多人协作的(de)(de)AI工具。研(yan)发人员(yuan)可(ke)以合作定制、共享个(ge)(ge)性(xing)化的(de)(de)AI聊天(tian)框,令其自动执行(xing)诸如事(shi)实核查之类的(de)(de)特(te)定任(ren)务。
二、AI科研检索工具支持多语种,有望打破学术交流语言壁垒
除了热门的(de)Elicit、Consensus和(he)You外(wai),其他AI检索工具(ju)也在探索利用AI技术提(ti)升科研效率的(de)更(geng)多应(ying)用场景。
美(mei)国AI生物学知识问(wen)答平(ping)台BioloGPT能够(gou)针对生物学问(wen)题,生成总结性的(de)、更有深度的(de)回答,是大量(liang)垂直(zhi)于(yu)单一学科(ke)的(de)AI工具之一。
今年9月,英(ying)国一站式科研(yan)服务公司Clarivate推出(chu)了一个AI检索工具,研(yan)究(jiu)人员可以(yi)用其快速(su)调用Web of Science数据库中(zhong)的(de)内容。Clarivate方面称,基于该AI检索工具,研(yan)究(jiu)人员输入一个研(yan)究(jiu)问题后,可以(yi)以(yi)图谱的(de)形式查看相关的(de)论文摘要、科研(yan)主题和引用文献(xian),并且(qie)能(neng)看到(dao)每一篇参考文献(xian)的(de)标注,从而(er)更高(gao)效地找出(chu)关键论文及其论点。
此外(wai),即(ji)便Web of Science中收录的(de)是英文论文,Clarivate的(de)AI检索工(gong)具也可以(yi)用英语(yu)(yu)外(wai)的(de)其他语(yu)(yu)言(yan)总(zong)结论文中的(de)关键信息。在(zai)Clarivate产品(pin)副总(zong)裁Francesca Buckland(弗朗西斯卡·巴(ba)克(ke)兰德)看来,将多语(yu)(yu)言(yan)的(de)翻译能力融入AI检索工(gong)具背后的(de)大模(mo)型中,是一件(jian)“非常具有潜力”的(de)事情,它可以(yi)减少全球科研资源不平(ping)等的(de)情况。

▲研究人员可(ke)以用Clarivate的AI工具,梳理Web of Science数据(ju)库中的内容(图源:《Nature》)
三、建议利用AI检索工具各自的优势查资料,但要记得核查
当被《Nature》问及“最(zui)好(hao)用(yong)的(de)AI检(jian)索工具(ju)是什么”时(shi),加拿大(da)流行病学家Razia Aliani(拉齐(qi)娅·阿利(li)(li)亚尼)说:“我认(ren)为这通常取决(jue)于实际研究目的(de)。”目前她在(zai)澳(ao)大(da)利(li)(li)亚一家非营利(li)(li)性(xing)的(de)文献综述公司工作,公司名为Covidence。
如果需(xu)要(yao)了解某个科研(yan)主题(ti)的不同观(guan)点(dian)和共识,Aliani会倾(qing)向于(yu)使(shi)用(yong)Consensus。但要(yao)审核大型数据库(ku)时,她会选择(ze)用(yong)其他AI检索工具,比如Elicit。
在(zai)Elicit上(shang)抛出初始研究方向后,Aliani会根(gen)据该(gai)AI工具的(de)(de)检索结(jie)果,排除(chu)与研究方向无关的(de)(de)论文(wen),然后深入剩余的(de)(de)关联性更(geng)强的(de)(de)文(wen)献,以微调初始研究方向。
她认(ren)为,AI科(ke)(ke)研(yan)(yan)检索工具(ju)不仅(jin)节省(sheng)了时(shi)间(jian),还能提高科(ke)(ke)研(yan)(yan)工作质量、激发(fa)创(chuang)造(zao)力并减轻科(ke)(ke)研(yan)(yan)压力。
Anna Mills(安娜(na)·米(mi)尔斯)在美国加利福尼亚(ya)州的(de)马林学(xue)院教授(shou)基(ji)础写作课程,平常也会涉及有关如何开展研(yan)究过程的(de)课程。她(ta)虽(sui)然很(hen)想(xiang)向(xiang)学(xue)生推(tui)荐这些AI检索工具,但同时也担心这些工具会妨碍学(xue)生深入(ru)理解一些学(xue)术(shu)研(yan)究。
相较于用(yong)AI检索工(gong)具获取科研信息(xi),她更希望教会学(xue)生(sheng)如何辨别(bie)AI检索结果中的错误,从而培养他(ta)们辩证(zheng)使用(yong)AI工(gong)具的能力。
美国AI生物(wu)(wu)学(xue)知识问答(da)平(ping)台BioloGPT的(de)创始(shi)人Conner Lambden(康纳·兰登)也认为(wei):“学(xue)会对一切事物(wu)(wu)保持怀疑态度,包括(kuo)你自己(ji)在用的(de)研究(jiu)方法,是成为(wei)一名优(you)秀(xiu)的(de)科学(xue)家的(de)必经之路。”
四、AI错误引用文献,有科学家因此停用,开发者正补救
AI大模型在检索(suo)过(guo)程中(zhong)时(shi)不(bu)时(shi)出(chu)现“幻觉(jue)”,已是一(yi)(yi)个(ge)老(lao)生常谈的(de)问题。在AI界,“”幻觉(jue)(Hallucination)”是指(zhi)AI模型编造、引用、输(shu)出(chu)一(yi)(yi)些(xie)具有误导性的(de)、虚假的(de)、无中(zhong)生有的(de)信息。
而对于ChatGPT等主流AI聊天机器人(ren)回(hui)答准确性(xing)的担忧,也蔓(man)延到(dao)了AI科学检索工具(ju)上(shang)。多(duo)位(wei)研究人(ren)员提(ti)醒应谨慎(shen)使用这(zhei)些AI科学检索工具(ju)。
用AI检索工具做(zuo)科研(yan)时,常(chang)见的(de)(de)错(cuo)误有编造统计数(shu)据(ju)、误解(jie)引用的(de)(de)论(lun)文(wen)、AI大模型的(de)(de)偏见。
体(ti)育科学(xue)家Alec Thomas(亚历克·托马斯)目前在瑞士的(de)洛桑大学(xue)做研(yan)究,他(ta)曾一度(du)“非常欣赏AI检索工具”。
然(ran)而,在(zai)亲(qin)自试用一些AI检索(suo)工(gong)具(ju)(ju)后,他(ta)的态度(du)却(que)发生了180度(du)大转(zhuan)弯。Thomas决定放弃使用这些AI检索(suo)工(gong)具(ju)(ju),原(yuan)因是他(ta)发现AI生成的答(da)案中有(you)“非常严重的基础性错误(wu)”。
例如,他用(yong)AI检(jian)索工(gong)具研(yan)究(jiu)“参与体育活动对患有饮食(shi)失调(diao)的人的影响”时,AI引用(yong)了一篇(pian)与研(yan)究(jiu)问题毫无关(guan)系的论文来(lai)生成研(yan)究(jiu)结论。
Thomas直(zhi)言:“我们不会相(xiang)信一个公(gong)认可能随(sui)时会出现幻觉的(de)(de)人类,那又凭什么(me)去相(xiang)信有(you)类似(si)症状的(de)(de)AI呢?”
据多(duo)位接受《Nature》采访(fang)的AI检索工具开发(fa)者透(tou)露,他们已经采取(qu)了(le)安全措(cuo)施,以(yi)提高(gao)AI检索的准确性。
美国(guo)AI论文生(sheng)成公(gong)司Elicit的项目(mu)开发负责人James Brady(詹姆斯·布拉(la)迪)称,该公(gong)司十分重视AI检索工具的准确性(xing)问题,正在使(shi)用多个安(an)全系统检查AI回答中(zhong)的错(cuo)误。
英国一(yi)站式科研(yan)服(fu)务公司Clarivate产品副总裁Buckland则称(cheng),Web of Science的(de)AI工(gong)具有(you)“可靠(kao)的(de)保护机制”,以规避AI生成(cheng)带(dai)有(you)欺(qi)骗性(xing)的(de)、不准确的(de)内(nei)容。在测(ce)试(shi)(shi)期间,她(ta)的(de)研(yan)发(fa)团队曾与大(da)约(yue)1.5万(wan)名研(yan)究(jiu)人员共同整合(he)反馈,以调试(shi)(shi)AI检索的(de)准确性(xing)。
尽管经过开发者的不断纠偏,AI检索(suo)工具的使用体验有所(suo)改善,美国(guo)AI学术(shu)搜索(suo)引擎公司Consensus的CEO Olson却认(ren)为,这(zhei)非(fei)但不能(neng)根(gen)治AI的“幻觉”,还可能(neng)会加(jia)重“病情”。
Olson解释道(dao),通过人(ren)为反馈调试的(de)AI检索(suo)工具,倾向于得(de)出对人(ren)类有益(yi)的(de)答案(an),并且(qie)会因此自主(zhu)填补一些不(bu)存(cun)在的(de)事(shi)实。
结语:未来的AI工具需要比拼专业度
从《Nature》的(de)(de)调查中,我(wo)们可以看到AI检(jian)索的(de)(de)应用场景,已经逐渐(jian)向细(xi)分(fen)领域渗(shen)透。
这也意味着,类似于AI科研检索领域,未来AI大模型(xing)及(ji)其产品(pin)对(dui)专业性、准确性有着更严格的要求。
目前来看,面向专业领域微调后(hou)的AI模型,出现“幻觉(jue)”的概率(lv)和(he)频(pin)率(lv)会有所(suo)降(jiang)低,而其存在(zai)的偏见问题则不(bu)能(neng)光靠技(ji)术更(geng)新来解决。
李飞飞于2015年(nian)联合(he)创(chuang)建了AI4All项目,旨在吸纳更多诸如女性、有(you)色(se)人种(zhong)、工薪(xin)阶(jie)层(ceng)的(de)AI人才,以减轻(qing)开发AI大模(mo)型(xing)过程中存在的(de)偏见(jian)。
Andrew Hoblitzell(安德(de)鲁(lu)·霍布里策尔)是印度(du)的一(yi)名(ming)生(sheng)成式AI研究(jiu)人员,他(ta)已在多(duo)所(suo)大学开设了(le)围绕AI4All项目(mu)的讲座(zuo)。
在(zai)他看来,AI检索(suo)工(gong)具(ju)可(ke)以在(zai)一(yi)定程(cheng)(cheng)度上为科研(yan)过程(cheng)(cheng)提(ti)(ti)供(gong)支持,但前提(ti)(ti)是科学家要亲自(zi)验证过AI生成的信息(xi)。
Hoblitzell称:“现(xian)阶段,这些AI检(jian)索工(gong)具应(ying)该是科(ke)研(yan)的(de)辅助工(gong)具,而不是最(zui)终的(de)成果来源(yuan)。”
来源:《Nature》