一只暹罗猫竟是论文作者!谷歌学术20岁,创始人首次公开最魔幻学术故事

买车攻略作者:wang1232024-12-16更新:

新智元报道

编辑:静音

【新智元导读】今年是谷歌学术创立20周年,创始人们特意为此撰写了一篇博客,回顾了谷歌学术的成长历程,并分享了一些实用的使用技巧和背后的趣闻轶事。在AI浪潮席卷而来之际,谷歌学术将如何站稳脚跟?

全球最大、最全面的学术搜索引擎,非谷歌学术(Google Scholar)莫属。

根据网络流量测量工具Similarweb的数据,谷歌学术每月的访问量超过1亿次。

今年是它创立20周年,两位创始人Alex Verstak和Anurag Acharya特地为此撰写了一篇博客。

博客地址:https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days

博客中贴心地包含了Scholar的使用指南,还提到了不少轶闻趣事。

先让我们来看看两位创始人为我们提供了哪些Scholar的使用建议吧——

使用tips

1.使用AI提纲高效阅读论文

最近,谷歌学术搜索的PDF阅读器新增了AI提纲功能。

AI提纲是一种论文的扩展目录,为每个关键部分提供几条要点。浏览提纲即可快速了解论文概况。

点击某条要点即可深入阅读感兴趣的内容。

除了AI提纲,Scholar的PDF阅读器还提供了许多功能以帮助你更快阅读:一键预览被引文献、链接的图表和表格引用、引用和相关文献、以及明暗模式切换。

2. 通过「Case law」解锁法律资源

获取法律文件往往是一件困难的事,它们并不容易访问。但谷歌学术搜索拥有全面的案例法合集,任何人都可以搜索。

只需在侧栏选择「Case law」,输入查询即可解锁海量的法律资源。

3. 轻松复制现成的文章引用格式

你无需手动格式化参考文献。点击「Cite」按钮,谷歌学术搜索即可提供多种格式的现成引用。只需选择所需的格式并直接使用。

4. 创建你自己的论文图书馆

在谷歌学术搜索,你只需点击一下即可将文章保存到个人图书馆。

在图书馆中,你可以通过创建自定义标签对收藏的论文进行分类,结构化地组织内容,还能按论文的发表时间进行分组访问。

5. 关注特定作者

在快节奏的学术界,紧跟前沿信息至关重要。在谷歌学术搜索上,你可以关注特定作者,每当他们发表新作品时都会收到邮件提醒。此功能帮助用户实时掌握感兴趣领域的最新研究动态。

AI浪潮中如何幸存?

近年来,利用AI提升学术搜索体验的竞争者纷纷登场,让学术界的搜索方式变得更加多样化。

「谷歌学术对科学的影响是显著的,」美国西雅图华盛顿大学的计算社会科学家Jevin West说道,他几乎每天都在使用谷歌学术。

但他也坦言,「如果说谷歌学术有可能被取代的话,也许就是现在,因为其他产品的创新正在涌现。」

例如,ChatGPT已经成为一些科学家进行文献搜索、审查和总结的首选工具。

Semantic Scholar,生成简洁明了的论文摘要,并识别最相关的引用文献,让用户迅速掌握文章核心。

依托Semantic Scholar数据库的Consensus,则通过AI从多篇文献中提炼和整合信息,精准回答用户提出的具体的研究问题。

还有Undermind,引入「基于代理」的搜索模式,它模拟人类阅读文献的过程,动态调整查询策略,返回更加精准和个性化的结果,颠覆了传统的搜索体验。

针对谷歌学术数据来源不透明、无法全面公开索引内容以及限制批量下载等问题,开放学术数据库OpenAlex于2022年推出。它完全基于开源数据,透明度高,用户可以免费下载其所有记录,非常适合做计量学分析和大规模数据研究。

尽管如此,谷歌学术的联创Anurag Acharya并不把这些新兴工具视作竞争对手。

他表示,任何能让学术信息更容易获取的尝试都值得鼓励,大家做得越多,对科学进步就越有益。

Acharya还提到,谷歌学术也在积极拥抱AI,利用它对文章进行智能排名、推荐相关搜索查询,以及推荐相关文章。

而且,谷歌学术最近还为PDF阅读器引入了AI生成的文章大纲,进一步提升了用户的阅读体验。

他解释道,谷歌学术的搜索工具也在努力理解查询背后的意图和上下文,采用的语义搜索方法基于语言模型,已经运行了大约两年。

不过,谷歌学术目前还没有像普通谷歌搜索那样为查询提供AI生成的简洁答案概述。

Acharya认为,汇总多篇论文的结论,并确保既简洁又包含重要背景信息,仍是个不小的挑战。

「至今我们还没有找到有效的解决方案。」他说。

由来

在以前,获取学术信息非常困难,且常常受限于付费墙。研究人员要么通过图书馆寻找信息,要么通过访问收费的在线服务(如科学引文数据库Web of Science)查找学术论文。

2004年,Alex Verstak和Anurag Acharya希望能打破这一困境,让研究人员能够找到并阅读感兴趣的研究成果。

经过九个月的开发,谷歌学术搜索诞生了。

在这里,动手一搜,你可以轻松地找到在线学术期刊、书籍、会议论文、学位论文、预印本、摘要、技术报告及其他研究成果……涵盖多种语言,来自世界各地。

最重要的是,它们很多都是免费的。

早期,由于网络速度慢且不稳定,收集研究资料、丰富这个在线图书馆的馆藏,是一件极为困难的事情。

为了解决这一问题,团队采用了一种「低技术」方案,称为「Sneakernet」——

出版商将文章加载到物理硬盘上,两位创始人每天上班路上会亲自去取这些硬盘。

可以说,早期的谷歌学术搜索是他们靠脚踏实地「跑腿」跑出来的!

这也力证了他们的初心:帮助全世界的研究人员轻松地「站在巨人的肩膀上」,能够看得更远。

轶闻趣事

在博客里,两位创始人还讲了不少在谷歌学术搜索发生的趣事~

在谷歌学术中,有许多以各种别致风格写成的法律文件。

有一份法律意见是以一系列歌曲的形式写成的,还标注要唱成LeAnn Rimes的曲调。

还有用诗歌开头的意见书。

除了这些有趣的法律文件,还有几篇物理学论文也很爱玩。

在「Can apparent superluminal neutrino speeds be explained as a quantum weak measurement?」(表面上超光速的中微子速度是否可以用量子弱测量来解释?)的题目下,它的摘要只有两个词:「Probably not」(可能不行)。

物理学界,还有一只暹罗猫F.D.C. Willard(又名Chester)作为共同作者出现在一篇论文中,做出了它的「喵」力贡献。

该论文研究了固态氦-3的磁性,以及原子之间的相互作用在极低温下如何影响其行为。

Chester之所以成为作者,是因为他的共同作者兼主人Jack H. Hetherington在完稿后才发现,整篇论文的表述过程中他都使用了第一人称的复数「we」,没有用单数「I」。而期刊会拒绝接受单一作者使用这种写法的投稿。

Hetherington懒得将文章里的「we」改成「I」,就干脆把家里猫咪的名字给署上了。

此外,还有一篇很有趣的论文,关于希格斯玻色子测量的。

它的作者人数超过5000人,正文9页,而鸣谢名单足足24页。

窥一斑而知全豹

两位创始人在博客里写道,在谷歌学术搜索的二十年里,他们还没见过团队规模如此庞大的研究成果。

有些科学发现确实需要「全村的努力」。

有趣的是,这些论文都来自物理学界。

参考资料:

https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days

https://www.nature.com/articles/d41586-024-03746-y