这些人,花钱买垃圾,良心何在
2 月 21 日,曾质疑曹雪涛院士论文造假的知名撤稿观察网站 Retraction Watch 活跃撰稿人,前斯坦福大学助理研究员 Elisabeth Bik 再次在其推特曝出惊人消息:Bik 的团队发现,超过 400 篇来自不同作者和机构的文章可能都是由同一个论文工厂产生的,极有可能存在伪造数据的情况,论文发表单位涉及多家中国三甲医院。
Bik 甚至在其个人博客总结了来自论文工厂的文章的四大特征:Western Blot 条带相似、流式细胞图雷同、柱状图风格接近、标题结构模版化。(详情可点击链接回顾丁香园往期文章:超 400 篇论文被疑造假,涉及多家中国三甲医院:Bik 团队揭论文工厂黑幕)
图源:Bik 本人的博客 scienceintegritydigest.com
一波未平,一波又起。
2 月 27 日,Bik 团队的另一活跃成员(化名 Smut Clyde 的 )又发现了另外 2 家论文工厂,找到可能存在问题的论文共 126 篇,分别来自 20 本学术期刊,作者所在单位保守估计涉及中国 80 多家医院。
涉及期刊名称(作者整理)
2 号论文工厂:学术期刊明码标价
这位化名为 Smut Clyde 的老哥追踪到的 2 号论文工厂,共有 69 篇论文被质疑存在问题。
更夸张的是,这 56 篇论文中有 54 篇都发表在同一本杂志:意大利学术期刊《欧洲医学和药理学评论(European Review for Medical and Pharmacological Sciences, ERMPS)》(注:ERMPS 在 3 号论文工厂也涉及 2 篇,共涉及 56 篇)。
ERMPS 杂志官网截图
这本名气并不大的期刊最新影响因子为 2.721,这大概是其成为论文工厂首要目标的主要原因。
Smut Clyde 在照例吐槽完这五十多篇文章的 WB 条带和流式细胞图后,还对该杂志审稿人的粗心大意十分不解:某篇论文通讯作者的邮箱名甚至不是真实人名的拼音,而是 ppfrrbfbrt@sina.com,竟然没人觉得奇怪?
ERMPS 某篇被疑论文截图
也不知道是破鼓万人捶还是众人拾柴火焰高,独立科学记者、漫画家 Leonid Schneider 也跟进扒皮了这本期刊:ERMPS 的出版方为 Verduci Editore,这家出版方在杂志的投稿说明中直接明码标价地收取出版费用,价格甚至具体到每张图和每张表。如果要加急,那就加钱。
ERMPS 杂志官网截图
这名记者还抖出了 ERMPS 的另一波骚操作:自称是开放获取(OA)期刊,结果在收取出版费用的同时,又要求作者在发文前签署版权转让协议,否则不予出版。协议中明确规定,如果作者在未来的作品里需要复制本杂志刊发的文字、图形、表格或插图,必须首先获得出版方的许可。
ERMPS 杂志官网截图
这才真是又想当那啥,又要立那啥。
3 号论文工厂:部分文章已撤稿
受到 PubPeer 用户 Xylocampa Areola 的启发,Smut Clyde 老哥接着找出了来自 3 号论文工厂的 57 篇论文。
除了那些相似得令人发指的图片结果外,Smut Clyde 还仿照 Bik 博文中「标题生成器」的方式,总结了这类中药研究论文的标题模版:
标题 = [ 传统草药提取的植物化学 / 次级代谢产物 ]+[ 促进肝癌 / 结直肠癌 / 淋巴瘤 / 胶质瘤 / 其他癌细胞系 ] 的 [ 凋亡 / 消除转移 / 阻止增殖 ]。
Smut Clyde 博文截图
在研究 3 号论文工厂的引用文献后,Smut Clyde 发现论文工厂出品的论文之间还出现了超高的「自引率」:引用论文工厂发表于不同杂志的产品,几乎不会被审稿人发现,这有可能暗示了论文买卖中的「三包」服务:包写包发包引用。
图片来自 Smut Clyde 博文
3 号论文工厂涉及的学术期刊多达 15 种,出版方甚至包括 Springer Nature 这样世界知名的学术出版机构。
难得的是,有 7 篇论文「入围」的德国开放获取期刊 Naunyn-Schmiedeberg’s Archives of Pharmacology(影响因子 2.058)很快对质疑做出了回应。
图片来源:杂志官网
杂志主编 Roland Seifert 表示,在得知自家杂志被论文工厂盯上后,自己感到非常吃惊,因为他觉得杂志编辑很优秀且严谨,不太可能放过论文工厂的垃圾论文。
他专门提到,该杂志从 2018 年起就引入 Ithenticate 软件查重,但论文造假者非常「专业」,能够成功绕开软件的审查。主编强调,杂志的任何编辑都不曾参与这些来自中国的论文的造假工作。
该主编表示,目前该杂志已经撤回有问题的论文,且该杂志未来的反欺诈措施已经成型,但暂时对外保密,以防造假者适应新规则。
有组织的造假令,找相同越来越难
寻找论文中存在问题的图片,本质上是个找相同游戏,但这个游戏越来越难。
以前找相同是在同一通讯作者的不同论文中寻找,只需要找到该作者的论文进行比较即可。而面对论文工厂时,则需要从不同通讯作者的不同论文中寻找,难度大大增加。
我们可以换个角度来理解这种难度的变化:前者的图片雷同,可能还属于课题组或通讯作者的「个人行为」;而后者的论文工厂大批发,则属于「有组织行为」——在打击难度上,打击「有组织犯罪」显然更难。
Smut Clyde 也认为论文工厂更难对付,因为它们生产的论文会用不同客户的名字发表在不同期刊上。他用一张关系图说明了追踪论文工厂的复杂性,而这张图展示的利益网络,有可能还只是论文工厂的冰山一角。
图源:Smut Clyde 博文
目前,Smut Clyde 已经摸索出一套发现论文工厂的经验。
方法一:善用 PubMed
PubMed 检索回馈的文章信息下方有个「相似文章(Similar Articles)」列表,右侧也有同样的按钮,利用这个功能可以源源不断地找出同一论文工厂的产品。这个方法的底层逻辑,是利用了论文工厂产品标题、摘要以及关键词提取的高度模式化特征。
PubMed 官网截图
方法二:参考文献的蛛丝马迹
前文提到 3 号论文工厂的参考文献中出现大量「自引」,这也是一条查找论文工厂产品的线索。这个方法的底层逻辑抓住了论文工厂的「三包」业务线。当然,在找到相关文献后,进行严谨的对比和甄别还是很有必要的。
论文工厂背后的学术生态
在对论文工厂的评论中,总少不了深层原因的探讨。
Smut Clyde 对论文工厂的作者进行分析后发现,英文出版物对作者们至少有 2 种作用:一种是「一次性」使用,用来满足毕业的硬性标准;另一种则是为自己的简历镀金。与前者相比,后者的论文特点则更加明显,不但作者姓名在论文工厂中重复出现,而且多数来自水平较高的研究所或医院。
此外,由于对论文需求不同,论文工厂的产品档次也有一定区分。
低端论文产品的数据往往来自比较差的实验室,只要能做到跑胶、细胞实验、美化一下图片数据就能发论文,应付毕业要求;而高端论文产品的数据往往来自一流实验室,这些实验室能独立完成组织实验和动物实验,专门为简历比较难看的人服务。
有了需求,市场自然生根发芽,枝繁叶茂。
纵观 Bik 团队最近几波大动作,目标指向皆为中国研究群体,也许有人会认为这是故意找茬。但事实上,没有什么学术界的阴谋论,有的只是全体学术界对学术造假的对抗。
换个思路想,全球许多领域的研究者都有发表论文的需要,可为什么偏偏是中国?为什么偏偏是医院?
2 月 17 日科技部印发《关于破除科技评价中「唯 SCI」不良导向的若干措施(试行)》,旨在破除科技评价中过度看重论文数量和影响因子高低,忽视标志性成果的质量、贡献和影响的「唯 SCI」不良导向。
--
FROM 202.101.191.*