一只暹罗猫竟是论文作者!谷歌学术20岁,创始人首次公开最魔幻学术故事
新智元报道
编辑:静音
【新智元导读】今年是谷歌学术创立20周年,创始人们特意为此撰写了一篇博客,回顾了谷歌学术的成长历程,并分享了一些实用的使用技巧和背后的趣闻轶事。在AI浪潮席卷而来之际,谷歌学术将如何站稳脚跟?
全球最大、最全面的学术搜索引擎,非谷歌学术(Google Scholar)莫属。
根据网络流量测量工具Similarweb的数据,谷歌学术每月的访问量超过1亿次。
今年是它创立20周年,两位创始人Alex Verstak和Anurag Acharya特地为此撰写了一篇博客。
博客地址:https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days
博客中贴心地包含了Scholar的使用指南,还提到了不少轶闻趣事。
先让我们来看看两位创始人为我们提供了哪些Scholar的使用建议吧——
使用tips
1.使用AI提纲高效阅读论文
最近,谷歌学术搜索的PDF阅读器新增了AI提纲功能。
AI提纲是一种论文的扩展目录,为每个关键部分提供几条要点。浏览提纲即可快速了解论文概况。
点击某条要点即可深入阅读感兴趣的内容。
除了AI提纲,Scholar的PDF阅读器还提供了许多功能以帮助你更快阅读:一键预览被引文献、链接的图表和表格引用、引用和相关文献、以及明暗模式切换。
2. 通过「Case law」解锁法律资源
获取法律文件往往是一件困难的事,它们并不容易访问。但谷歌学术搜索拥有全面的案例法合集,任何人都可以搜索。
只需在侧栏选择「Case law」,输入查询即可解锁海量的法律资源。
3. 轻松复制现成的文章引用格式
你无需手动格式化参考文献。点击「Cite」按钮,谷歌学术搜索即可提供多种格式的现成引用。只需选择所需的格式并直接使用。
4. 创建你自己的论文图书馆
在谷歌学术搜索,你只需点击一下即可将文章保存到个人图书馆。
在图书馆中,你可以通过创建自定义标签对收藏的论文进行分类,结构化地组织内容,还能按论文的发表时间进行分组访问。
5. 关注特定作者
在快节奏的学术界,紧跟前沿信息至关重要。在谷歌学术搜索上,你可以关注特定作者,每当他们发表新作品时都会收到邮件提醒。此功能帮助用户实时掌握感兴趣领域的最新研究动态。
AI浪潮中如何幸存?
近年来,利用AI提升学术搜索体验的竞争者纷纷登场,让学术界的搜索方式变得更加多样化。
「谷歌学术对科学的影响是显著的,」美国西雅图华盛顿大学的计算社会科学家Jevin West说道,他几乎每天都在使用谷歌学术。
但他也坦言,「如果说谷歌学术有可能被取代的话,也许就是现在,因为其他产品的创新正在涌现。」
例如,ChatGPT已经成为一些科学家进行文献搜索、审查和总结的首选工具。
Semantic Scholar,生成简洁明了的论文摘要,并识别最相关的引用文献,让用户迅速掌握文章核心。
依托Semantic Scholar数据库的Consensus,则通过AI从多篇文献中提炼和整合信息,精准回答用户提出的具体的研究问题。
还有Undermind,引入「基于代理」的搜索模式,它模拟人类阅读文献的过程,动态调整查询策略,返回更加精准和个性化的结果,颠覆了传统的搜索体验。
针对谷歌学术数据来源不透明、无法全面公开索引内容以及限制批量下载等问题,开放学术数据库OpenAlex于2022年推出。它完全基于开源数据,透明度高,用户可以免费下载其所有记录,非常适合做计量学分析和大规模数据研究。
尽管如此,谷歌学术的联创Anurag Acharya并不把这些新兴工具视作竞争对手。
他表示,任何能让学术信息更容易获取的尝试都值得鼓励,大家做得越多,对科学进步就越有益。
Acharya还提到,谷歌学术也在积极拥抱AI,利用它对文章进行智能排名、推荐相关搜索查询,以及推荐相关文章。
而且,谷歌学术最近还为PDF阅读器引入了AI生成的文章大纲,进一步提升了用户的阅读体验。
他解释道,谷歌学术的搜索工具也在努力理解查询背后的意图和上下文,采用的语义搜索方法基于语言模型,已经运行了大约两年。
不过,谷歌学术目前还没有像普通谷歌搜索那样为查询提供AI生成的简洁答案概述。
Acharya认为,汇总多篇论文的结论,并确保既简洁又包含重要背景信息,仍是个不小的挑战。
「至今我们还没有找到有效的解决方案。」他说。
由来
在以前,获取学术信息非常困难,且常常受限于付费墙。研究人员要么通过图书馆寻找信息,要么通过访问收费的在线服务(如科学引文数据库Web of Science)查找学术论文。
2004年,Alex Verstak和Anurag Acharya希望能打破这一困境,让研究人员能够找到并阅读感兴趣的研究成果。
经过九个月的开发,谷歌学术搜索诞生了。
在这里,动手一搜,你可以轻松地找到在线学术期刊、书籍、会议论文、学位论文、预印本、摘要、技术报告及其他研究成果……涵盖多种语言,来自世界各地。
最重要的是,它们很多都是免费的。
早期,由于网络速度慢且不稳定,收集研究资料、丰富这个在线图书馆的馆藏,是一件极为困难的事情。
为了解决这一问题,团队采用了一种「低技术」方案,称为「Sneakernet」——
出版商将文章加载到物理硬盘上,两位创始人每天上班路上会亲自去取这些硬盘。
可以说,早期的谷歌学术搜索是他们靠脚踏实地「跑腿」跑出来的!
这也力证了他们的初心:帮助全世界的研究人员轻松地「站在巨人的肩膀上」,能够看得更远。
轶闻趣事
在博客里,两位创始人还讲了不少在谷歌学术搜索发生的趣事~
在谷歌学术中,有许多以各种别致风格写成的法律文件。
有一份法律意见是以一系列歌曲的形式写成的,还标注要唱成LeAnn Rimes的曲调。
还有用诗歌开头的意见书。
除了这些有趣的法律文件,还有几篇物理学论文也很爱玩。
在「Can apparent superluminal neutrino speeds be explained as a quantum weak measurement?」(表面上超光速的中微子速度是否可以用量子弱测量来解释?)的题目下,它的摘要只有两个词:「Probably not」(可能不行)。
物理学界,还有一只暹罗猫F.D.C. Willard(又名Chester)作为共同作者出现在一篇论文中,做出了它的「喵」力贡献。
该论文研究了固态氦-3的磁性,以及原子之间的相互作用在极低温下如何影响其行为。
Chester之所以成为作者,是因为他的共同作者兼主人Jack H. Hetherington在完稿后才发现,整篇论文的表述过程中他都使用了第一人称的复数「we」,没有用单数「I」。而期刊会拒绝接受单一作者使用这种写法的投稿。
Hetherington懒得将文章里的「we」改成「I」,就干脆把家里猫咪的名字给署上了。
此外,还有一篇很有趣的论文,关于希格斯玻色子测量的。
它的作者人数超过5000人,正文9页,而鸣谢名单足足24页。
窥一斑而知全豹
两位创始人在博客里写道,在谷歌学术搜索的二十年里,他们还没见过团队规模如此庞大的研究成果。
有些科学发现确实需要「全村的努力」。
有趣的是,这些论文都来自物理学界。
参考资料:
https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days
https://www.nature.com/articles/d41586-024-03746-y