跳至内容 | 跳至导航

联系信息

中国科学院国家科学图书馆

地址:北京中关村北四环西路33号

邮政编码:100190    

This Logo Viewlet registered to qPloneSkinSchools product
个人工具
您位于: 首页 开放获取研究 投资公共资金资助的研究成果的开放存档的经济和社会回报

投资公共资金资助的研究成果的开放存档的经济和社会回报

John Houghtons等 著 金晶 编译


前言

本研究报告由SPARC资助,旨在勾勒出一种方法,用于衡量美国FRPAA关于在研发方面的公共投资的回报的影响。研究的目标是界定数据收集的要求、建模、构建强壮的能够预估FRPAA开放存档政策的可能的影响的模型。

 

背景和目标

纳税人认为科学、技术和医药(STM)研究的公共资金在经济和社会上的回报会远远超过最初的研究投资。因为发现是一个累积的过程,很多新的知识会在早期的发现中产生,为了确保投资是有回报的,那么将研究成果传播出去是很重要的。

传统意义上讲,期刊是传播研究成果的主要渠道。随着网络的出现,扩大研究成果的传播范围成为了可能,这不仅可以很好地服务现有的科研人员,对于将来可能存在的潜在用户也会帮助很大,如:老师和学生、医生和病人、商业人士、还有公众。现在把知识应用于传统的付费访问或期刊订阅的有限领域之外在技术上是完全可行的。知识(研究论文和其他研究成果)以公共目的进行整合和使用也是可能的。

为应对这些机会,越来越多的公共和私人资助机构实行了强制性政策,让他们所支持的项目的研究成果公开在线存档,让任何人都有机会通过网络免费获取到这些资源。有充足的事实证据表明,这些政策是有益的,但是其结果的影响程度或关系成本还没有被计算过。成本效益和定量数据的可获取性会影响公共政策的制定,这个项目力图去找出公共资金资助的研究成果开放获取的投资回报的计算方法。我们大致描述了一个可行的方法,并确定了将来所需数据集所在的领域。这个方法将定义并审查数据集的要求,为将来建立一个更加强壮的模型做准备,用来评估如FRPAA(联邦研究成果公共获取提案)这样的公共资金资助的研究成本强制存储的潜在影响。

本报告是一个初步研究成果的汇报,将初步估计所使用的模型和数据资源。这些预估是基于编写报告时所获得的信息的程度做出的。它们和在线模型一起发布出来,这些在线模型允许其他人为各种各样的参数选择自己喜欢的值。模型和报告可以在http://www.cfses.com/FRPAA/中找到。

 

模型及其操作

完全量化FRPAA强制存储的利与弊是一件非常困难的事情,但是想要知道政策的潜在影响还是可能的。

标准的Solow-Swan模型设定了一些关键的简化假设,包括(i)所有的研发工作所产生的知识在经济和社会角度都是有用的(研发的有效性),(ii)所有的知识对于所有人都是可获取的,可以有效使用(知识的可获取性)。显然,这些假想都不是现实。在真实世界中,有各种各样的限制和障碍妨碍我们对知识的访问,同时限制我们对知识的使用。所以,在标准模型中我们引入了可访问性和有效性作为摩擦系数,然后再观察通过提高可访问性和有效性降低摩擦系数后研发活动得到的回报。附录I展示了模型的基础和发展的细节。

null

要使模型运作起来,建立可访问性和有效性参数是必须的,同时R&D的回报率和研究活动产生的知识的折旧情况都是必须建立的。附录II展示了模型操作化的细节,同时解释了基础方案值的选择原理和来源(总结见表1)。

为了初步分析,我们选择4.68%作为将来可能增长的可获取性的保守估计。按这个来分析,Ware(2009)报告称当文章是开放获取的时候,有10%到20%的调查对象认为访问有一定难度,20%到40%的调查对象认为引用有一定难度,66%的调查对象认为下载有一定难度(参见附录二)。

null

要解决的第三个问题部分是关于建模过程中所需要输入的数据。主要要求是包括暗含的存档成本、大量的公共资金资助的研究成果(如论文等)、支持科研的公共资金数量、以及支出情况。为进行初步分析,我们使用公众可获取的资源,同时发行预算,并且从中导出我们需要的估计值。附录II展示了这些数据源的详细情况(总结见表2)。

与公共资金的资助、活动和结果相关的数据都来自于最近的《国家科学委员会科学与工程指数2010》(NSB2010)。它展示出了FRPAA代理机构的赞助论文就是一个对基于NIH赞助的文章比率的评估,同时可能扩大文章的产出,从而提高存档成本并低估净效益。我们探索了存储成本的三个来源:

l         LIFE2项目(Ayris等2008)报告了英国机构知识库中存储的论文和其它内容的生命周期成本,发现第一年的平均成本是每篇文章34美元,在随后的几年里是每年每篇文章12美元;

l         从提交论文当量的成本角度,NIH(2008)预计每年将花费45万美元才能支持由NIH基金资助的项目成果产生约8万篇文章,同时还将支出25万美元以支付与该政策相关的人工费用,包含每篇文章59美元的提交成本;

l         从提交论文当量的近似成本的角度,arXiv (2010)指出他们年度预算是40万美元,在2012年将升至50万美元,2009年已经提交了64047篇文章,每篇文章的提交成本约7美元。

为了进行初步估计,我们探索了成本的范围——NIH报告的成本的中间值是我们认为最好的指导。

初步结论

这个部分展示了上面所描述的基本方案的最初模型所得到的结果。但是我们并不是想给出一个确定的结果,而是想要测试一下方法的可行性,定义并且审查数据集的要求和将来对于联邦资助项目的强制开放获取存储的潜在影响进行稳定评估的模型的发展需要,正如FRPAA所提议的那样。

为了解研发回报影响来建模

表3展示了基于对总的R&D花费所带来的回报的可获取性和有效性一次性增加的影响的初步模型评估,这些总的R&D花费包括总的对R&D的联邦支出和由11个FRPAA代理机构在R&D上的支出,同时随着百分比的改变,可获取性和有效性也在不断累积。根据表3展示所得,R&D的社会回报率从20%增长到60%,相应的可获取性和有效性从1%增长到10%。

2008年FRPAA代理机构在R&D上的花费是61美元,回报率是20%,可获取性和有效性一个单独百分点的增长就价值每年24.5亿美元。这其中,大约1.6亿美元是在美国,其余的分布在其他国家。

null

这些都是来自于每年R&D开销影响下反复的年度收益,如果这些变化带来了可获取性和有效性短期内的增长,这些增长就会转换为对增长率的影响。

权衡利与弊

在这个部分我们尝试去比较与FRPAA强制存档储有关的问题的利与弊。关于模型和可操作性的细节,参见附录I和附录II。

有一件事情需要说明的是我们为开放获取存储的过渡影响进行建模已经有30年了。由于研究支出与经济和社会回报的实现是有时间间隔的,所以R&D回报的影响是有延迟的(在基础方案中有10年的间隔),相应的这些回报价值也打有折扣。这反映出一个事实:开放获取存储的影响是可以预期的,但是不可以回溯。可获取性和有效性对于R&D的回报只有在这些回报都实现了的情况下才能反映出来。简单的说,在这个转型期的30年里我们比较30年的弊与20年的利。(图1)

null

 

null

另一种方法是去建模一个假设状态下稳定的系统,在这个系统中,可用性和有效性的收益在第一年就可以进入模型中。当这种转变开始初显成效,同时R&D的回报率没有延迟以后,这会反应出另一个系统的状况。简单的说,在这样的模型中,我们就可以考虑30年中的利与30年中的弊(见图2)。

我们认为建立这样一个转化模型更加现实一些,同时也是当务之急。但是,必须强调的重点是转换模型的收益和成本比率的回报比假设的稳定状态的模型低很多。

强制开放存储的潜在影响

基础方案模型的参数来源和基本原理参见表1和附录II,输入数据的值都总结在表2和附录II中。在这个基础方案中,我们为与R&D相关的影响建模,这些R&D的花费受11个部门所影响,FRPAA报告了arXiv、NIH和上限LIFE 2生命周期存储的成本。这些存储成本多种多样,但是中值NIH成本为我们提供了一个合理的引导。

null

在30年的过渡期中,对所有FRPAA代理机构资助的R&D进行强制开放获取存储所带来的增额利润可能价值16亿美元(净现值),是使用终端生命周期评估成本的4倍,是使用NIH成本的8倍,是使用arXiv成本的24倍。这其中可能有10亿美元是产自于美国,其余的则分布在其他国家。因此,美国的国家收益可能会是其成本的5倍。由FRPAA代理机构资助的R&D开放存储计划所带来的影响可能会比这些渐增的影响强很多,美国的国家收益可能就是成本的8倍多(见表4)。

这些评估假定出版发行和开放获取中间有六个月的时滞期。如果没有时滞期,我们估计渐增的回报就会接近17.5亿美元。因此六个月的时滞期把回报降低了大约1.2亿美元(净现值)。当然,推迟开放获取的时滞期所带来的影响在研究和学科领域是非常明显的,对研究和实践领域的快速转移影响很大,对知识、应用和时间的进步影响很慢。

值得注意的是,这些评估都是基于R&D回报的增长,这些R&D的增长是由可获取性的增长所带来的,同时这些评估也不考虑对联邦资助的研究项目进行更深层次的开放获取后所带来的潜在活动成本的影响(像节省了研究人员在研究、发现和访问这些领域的过程中所花费的时间)。他们同样关注实现过后的转型期,正如上面所述(见图1和2),一旦开放存档有了收益,那么就会比刚实现的时候和转型期以后的收益大很多。例如,在一个假设的稳定状态下,预计的美国的国家收益就会是成本的50多倍。

但是,还是应该指出,在经济学领域,以R&D回报的增长作为收益的形式在自然界传播是很自然的。他们随着时间积累,有时会延迟到研究支出和发布几年以后。相反,成本也是本地和直接的。因此,为了最大化公众对研究的投资,成本必须预先知晓。同时也指出,这些评估事实上都是很初级的,都是为了测试方法的可行性,定义和审查数据集的需求以及为了将来建立更加强壮的评估系统模型的发展,这些评估系统是用来评价对联邦资助的R&D进行强制开放获取所带来的影响。这里有很多说明与提示(详见附录I和附录II)。

模型的灵敏度

在这里要阐述的是模型的灵敏度,以重点考虑将来数据集和模型发展的先后次序。通过使用NIH中期的存储成本报告并一次转换一个特定参数,我们发现:

l         文章产出的数量是导致存储成本增加的重要因素。然而,在基础方案中如果当前每年的文章产量超过100万篇,那么美国的国家收益将会超过成本,和R&D的资助是一个级别的了。这100万篇的文章是现在文章产出的6倍。

l         存储成本也是很重要的,将来还需要进一步建立模型计算各部分确切的成本。然而,基础案例模型都会返回国家净收益,每篇文章有超过375美元的提交成本(包括作者的存储成本)。

l         对于开放存档的可获取性和有效性回报的潜在增长是一个重要的输入值,增长越多,收益也会越多。但是,对于可获取性和有效性的一个联合的总的改变只有不到1%的净收益。

l         社会对于公众资助的R&D平均回报率是一个很重要的参数,但是平均回报率低至美国国家净收益的4%。

l         研究产生的知识的折旧率是根据建立的公式制定的,这些公式是美国劳动统计局使用的,当然所选择的比率都是有本质上的区别的(低比率却有高收益),效益成本比大于1的利率每年仍高于16%——这个比率高于通常用于公众资助的R&D。

l         研究花费和它所产生的经济影响之间是有一定的时间间隔的,这些影响会在将来的5~15年的滞后期后开始起作用,通常这些影响服从正态分布在10年左右。滞后时间越短,影响就会越大,但是滞后15年仍然会带来超过两倍于成本的收益。

总的来说,即使在过渡期,也会出现效益大范围超过成本,同时很难想象一个看似合理的输入数据和模型参数会带来一个从根本上不同的答案。

编译自:Economic and Social Returns on Investment in Open Archiving Publicly Funded Research Outputs

http://www.arl.org/sparc/publications/papers/vuFRPAA/index.shtml

http://www.arl.org/sparc/bm~doc/vufrpaa.pdf [2011-8-5]

(金晶编译)

文档操作