当前位置:首页 > 研发投资 > 正文

基于大数据算法的企业研发投资影响因素分析

2018-11-28 来源:《财会月刊》 作者:山东女子学院经济学院 李艳艳(副教授)北京大学光华管理学院 孙存一(博士) 点击:
      【摘要】以2010~2014年创业板上市公司数据为样本,从大数据的理念出发,选用既能代表最新技 术水平,又能和我国实际相结合的相关性算法,基于多视角对企业研发投资主要影响因素及其影响程度 进行综合研究。研究结果表明,企业进行研发投资更看重的是其自身的资本资源与风险等,组织冗余、风 险、资产收益率以及负债水平是创业板上市公司研发投资的重要影响因素。
      【关键词】研发投资;相关性;大数据;组织冗余
      一、引言
      在经济发展新常态下,实施创新驱动战略、实现 经济增长方式转变已成为我国经济健康发展的重要 举措。企业作为重要创新主体之一,其研发投资是实 现技术创新的重要途径。据统计,2013年以色列、韩 国和日本企业研发投资占工业增值税的比重分别为 5.92%、 4.72%、 4.09%,同期我国仅为2.03%,企业研发 投资水平较低。激励企业进行研发投资以促进技术 创新成为我国宏观调控政策的重要目标,财政补贴、 税收优惠作为政策激励企业研发投资的重要手段, 是影响企业研发投资的制度驱动。然而,制度驱动 仅仅是企业进行研发投资的外部动因。Peneder、 Woerter(2014)认为,企业进行研发投资的目的是提 高技术创新能力,最终增强其在市场中的竞争力。 因 此,制度驱动应在企业本身具有投资意愿的基础上 发挥效应。根据产业组织理论,融资约束是造成企业 研发投资不足的主要原因。而根据企业行为理论, 企 业行为变量如所拥有的组织冗余、面临的破产风险 等,亦会影响企业的研发投资决策。因此,企业研发投资会受到制度驱动、融资约束以及企业行为等多 种因素的影响。那么,目前我国企业研发投资的主要 影响因素是什么?各影响因素对企业研发投资的影 响程度如何?作为政府激励研发投资主要手段的所 得税优惠政策能否有效发挥其对企业研发投资的激 励效应?本文从大数据的理念出发,选用代表最新技 术水平及与我国实际相结合的相关性算法,对以上 问题进行了系统的研究,得出了有一定可靠性的结 论,为促进企业研发投资以及企业进行研发投资决 策提供了政策借鉴和技术支撑。
      二、文献综述
      有关企业研发投资影响因素的现有文献主要分 为以下三个方面:
       其一,财政补贴与税收优惠作为研发投资的主 要制度驱动,是影响企业研发投资的重要因素。大量 文献利用不同的评价方法对我国研发投资的财政补 贴和税收优惠的政策效应进行了实证检验,结果表 明我国的财税激励政策有利于促进企业研发投资 (戴晨、刘怡,2008;卜祥来,2014)。然而,亦有研究得出相反的结论,如夏杰长、尚铁力(2006)提出,由于 我国所得税优惠政策设计存在缺陷,企业研发投入 增长变化率与企业所得税变化率之间的关系并不显 著;李永等(2015)基于省际面板数据进行实证检验 后指出,由于制度约束,目前我国的政府补助对企业 研发投资会产生挤出效应。陆攀、朱和平(2016)从企 业面临的财务危机视角出发,研究了政府财政补贴 对研发投资强度的影响。 
      其二,企业面临的融资约束影响企业研发投资。 根据产业组织理论,在内源资金不足而外源融资获 取困难的情况下,企业容易面临研发投资的融资约 束,造成研发投资不足。卢馨等(2013)以2007~2009 年披露研发投资的高新技术企业为样本,检验了融 资约束的存在及其对企业研发投资的影响,证实研 发投资与现金持有量之间存在正相关关系。曹献飞 (2014)以中国工业企业数据库2005~2007年规模 以上工业企业统计数据为研究样本,进一步对企业 研发投资对内源和外源融资的依赖程度进行了实证 检验。
       其三,基于企业行为理论,组织冗余、风险等影 响企业研发投资决策。目前国内学者主要针对组织 冗余与研发绩效的相关性进行研究,而对组织冗余 与研发投资的关系研究并不多见,且得出的结果并 不统一,如连军(2013)提出不同类别的组织冗余对 研发投资的影响不同,或存在促进作用或存在挤出 效应。少数国内学者针对研发投资与风险相关性也 进行了研究,如张信东、姜小丽(2008)验证了企业研 发投资与系统风险的相关性;黄曼行等(2014)则以 国外研究中用于衡量破产风险的Z指数为被解释变 量,检验了企业研发投资对企业财务风险的影响。
       现有文献主要从产业组织理论、企业行为理论 等视角,采用“理论分析或者提出假设——建立模型 ——实证检验”的思路,对影响研发投资的因素进行 研究。然而在相同的假设前提下,若使用的数据或选 取的变量不同,很可能得出截然相反的结论。研究若 限于单一视角,难以综合厘清企业研发投资的影响 因素并对各因素的影响程度进行比较。本文在借鉴 相关研究的基础上,基于大数据的理念,以我国 2010~2014年创业板上市公司数据为研究样本,运 用相关性分析中经典的关联规则算法对企业研发投 资强度的影响因素及影响程度进行比较分析,结果 表明,影响企业研发投资的因素很多,但应重点关注 营运资金、流动比率、管理费用、破产风险、资产负债率等对企业研发投资决策的影响,而制度驱动对企 业研发投资决策的影响则远小于其他因素。
      三、研究设计
      (一)样本数据 
      在创业板上市公司的年度报告中,公司能够全 面、规范地披露其年度研发支出信息,并且年度报告 已经过注册会计师审计,数据具有可靠性。因此,本 文以2010~2014年创业板上市公司为样本对企业 研发投资影响因子进行研究。上市公司财务数据来 源于国泰安经济金融研究数据库,公司年度研发投 资数据根据巨潮资讯网公布的上市公司年度报告整 理。因后期需根据Apriori算法要求对数据进行离散 化处理,因此,仅对缺失数据进行数据清理,为保证 数据的准确性,由于数据的缺失值较少,采用技术方 法填充缺失值。
       (二)变量描述 
      1. 目标变量。研发投资强度,用“企业研发投 资/营业收入”衡量。
      2. 自变量。选择可利用冗余、可开发冗余、破产 风险、税收补贴、自由现金流作为核心解释变量,具 体如下:
      组织冗余:将组织冗余分为可利用冗余与可开 发冗余。其中:可利用冗余是指若出现闲置可考虑将 其用于研发投资的资金,如流动资产、流动负债;可 开发冗余是指已被吸收利用但可恢复到正常成本中 的资源,如管理费用。借鉴Chen、Miller(2007),用营 运资金收入比(营运资金/营业收入)与流动比率(流 动资产/流动负债)衡量可利用冗余变量,取管理费 用的自然对数衡量可开发冗余变量。
 风险变量:用滞后一期修正Z指数(Altman, 2000)衡量破产风险, Z指数越小,企业面临的破产 风险越大。
       税收补贴:所得税优惠相当于给予企业的额外 补贴,因此称为税收补贴。以名义税率25%乘以税前 利润,再减去当期所得税费用,然后取其自然对数, 用以衡量企业得到的税收补贴。 
      自由现金流:(经营活动产生的现金流量净 额-分配股利、利润或偿付利息支付的现金) /年末 总资产。
      除以上自变量外,还可选取行业、资产回报率、 资产负债率、资产负债率的平方项等作为解释研发投 资影响因子的其他变量。处理后的数据情况见表1。
表 1 样本数据情况
      (三)模型构建 
      在大数据相关性分析中,Apriori算法是一种 比较成熟的算法。该算法是从一个大型的数据集 (Dataset)中发现相关(Correlation)关系,即从数据集 中识别出频繁出现的属性值集(Sets of AttributeValues),也称为频繁项集(Frequent Item sets,简称 “频繁集”),然后再利用这些频繁集创建关联规则的 过程。数学描述如下:
      设I={i1, i2,…, im}是m个不同项目的集合,每 个ik(k=1, 2,…, m)为数据项(Item),数据项的集合 I成为数据项集(Item set),其中的元素个数为数据 项集的长度,长度为k的数据项集称为k-项集(kItemset)。事务T(Transaction)是数据项集I上的一个 子集,即T⊂I,每个事务均有一个唯一的标识符TID与之相联,不同事务的全体构成了全体事务集D(即 事务数据库)。设X⊂I为数据项集, B为事务集D中 包含X的事务的数量, A为事务集D中包含的所有事 务的数量。在关联分析中,所产生的规则(Association Rule)可以表示为: R: X⇒Y,其中: X⊂I, Y⊂I,并且 X∩Y=Ф,它表示如果项集X在某一事务中出现,则 必然会导致项目集Y也会在同一事务中出现,其中 X称为规则的先决条件, Y为规则的结果。在产生的 规则中,通常用支持度、置信度和提升度来描述有效 性。其中,支持度定义为:Support(X)=B/A,项集X 的支持度Support(X)描述了项集X的重要性。置信 度定义为:Confidence(R)=SupportX∪Y/SupportX, 置信度描述了规则的可靠程度。提升度定义为:lift (R)=conf (X->Y)/supp (Y)=conf (Y->X)/supp (X) = P (XandY) / (P(X) P (Y)),表示事件XY在X约束下 出现的概率相对XY自由出现的比(一般来讲,Lift> 1,规则就是有效的)。从以上算法介绍中可以看出, 关联规则可以穷举k-Itemset,挖掘出意想不到的信 息,完全由数据推导出结果而不受理论假设的制约, 适合进行数据分析。
       由以上算法介绍得知,关联规则所分析的对象 为数据项集的元素,而样本数据中诸多变量为数值 变量,即连续变量。所以必须对样本数据进行离散化 预处理,从而将其转化为可供分析的项集。运用经离 散化处理的数据可使后期模型分析结果更加稳定, 使自变量和目标变量之间的关系变得更加清晰。在 此将数据变量统一按照数值大小划分为5个区间 (不包括小于等于0的数值统一划分为“<=0”的元 素),如表2所示。
      进行数据预处理之后,生成可供分析数据集,按 照关联规则算法的原理,运算之前应该做必要的参数设置。如何做合理的参数设置则需要结合专家判 断和输出结果质量。基于多次试验结果,最终确定支 持度>=0.01、置信度>=0.5、 K∈[3, 5],设置Y为研发 强度=5/5:[0.0898, 0.9839],以此来找出与研发强 度“高”与项集X之间的相关性,运行过程如下:
 Parameter specification: 
confidence minval smax arem aval
 0.5 0.1 1 none FALSE 
originalSupport support minlen maxlen 
TRUE 0.01 3 5 
targetext
 rules FALSE
 Algorithmic control: 
filter tree heap memopt load sort verbose 
0.1 TRUE TRUE FALSE TRUE 2 TRUE 
apriori-find association rules with the apriori algorithm
表 2 样本数据离散化处理之后的情况
      version 4.21 (2004.05.09) (c) 1996-2004 Christian Borgelt
      set item appearances ...[1 item(s)] done [0.00s] . 
      set transactions ...[514 item(s),1918 transaction (s)]done[0.01s] . 
      sorting and recoding items ...[82 item(s)] done[0.00s] .
      creating transaction tree ... done[0.00s] . 
      checking subsets of size 1 2 3 4 5 done[0.03s] .
      writing ...[272 rule(s)]done[0.00s] . 
      creating S4 object ... done[0.00s]
      基于以上所设置的条件,运行过程在数秒内生 成了272条规则,信息量很大,但对成本资源的耗费 并不多。值得注意的是,关联分析所产生的诸多规 则容易造成信息冗余、降低规则的可利用率。本文先 后以主观和客观两种方法对关联规则中的冗余信息 进行修剪。首先从主观方法入手,将缺少经济学意义 解释的冗余规则去除。在此基础上,运用ADRR算 法对冗余规则进行修剪。
      四、结果输出与解析
      (一)结果输出
      研发强度作为目标变量,以营运资金、流动比 率、管理费用、破产风险、资产收益率、资产负债率、 税收补贴等为影响因子,运用Apriori算法推导影响 企业研发强度的因子,输出的关联规则如表3所示。
      表3是基于支持度>=0.01、置信度>=0.8,按照 提升度降序排列的关联规则前10名的结果。关联规 则实际为数据推导的过程,即验证了哪些影响因子 影响企业的研发投资强度,以及这些影响因子影响 过程的可信程度。不同于其他的实证研究,本文运用 关联规则算法在研究假设的基础上验证了研发投资 强度与其影响因子的相关性。表3所列示的关联规 则可提供的信息分别为:营运资金充足、管理费用较 高而资产负债率较低的企业研发强度较高;营运资 金充足、流动比率较高且管理费用较高的企业研发 投资强度强高;资产收益率越高,破产风险越小,企 业的研发投资强度越高,然而资产收益率对研发投 资强度的影响受到企业所处行业的影响。
表 3 关联规则
      输出结果产生有效关联规则272条,说明影响 企业研发投资的有效因素很多,从所列举的前10条 规则看,营运资金、流动比率、管理费用、破产风险、 资产负债率等为影响我国创业板上市公司研发投资 的主要影响因子。在大数据分析方法中,数据的可视 化也是重要的表现形态,数据的可视化可以提高结 论的可读性和逻辑性。现选取提升度较高(>=89%) 的关联规则,如图所示。图的上半部分为有向图,可 直观地体现影响因子、置信度、提升度,以 及最终的结论,其中起点为影响因子,圆 圈表示各影响因子的共同指向(圆圈的大 小表示置信度,置信度较高则圆圈较大; 圆圈的颜色深浅表示提升度,颜色深则提 升度高),共同指向的下一步指向为结论。 其中,管理费用、资产收益率、资产负债 率、营运资金、表示破产风险的滞后一期 的Z指数等共同指向了研发强度。图的下 半部分为平行坐标图,箭头最终指向最终 结论,所输出的平行坐标图仍能体现营运 资金、资产负债率、流动比率、管理费用、 资产收益率等为企业研发投资最重要的 影响因子。
      (二)结果解析
      在大数据分析中,对结果的有效解析 是不容忽视的环节,由以上输出结果可得 出如下结论:
       第一,可利用冗余(营运资金、流动比 率)、可开发冗余(管理费用)、破产风险 (滞后一期的Z指数)均体现出与企业研发 投资强度显著的正相关性。以往研究表 明,不同类别的组织冗余对企业研发投资 的影响不同,根据本文中Apriori算法所显 示的关联规则,可开发冗余与可利用冗余 水平高的企业,其研发投资积极性和研发 投资强度较高。企业拥有的组织冗余可以 促进企业研发投资。亦从另一个角度证明 企业研发投资资金来源的首选为内源资 金,若内源资金充裕,则企业更愿意进行 研发投资。破产风险与研发投资强度呈负 相关关系,企业面临的破产风险影响了企 业的研发投资决策,破产风险较小时,企 业的研发投资积极性较高。
       第二,所处行业不同的企业,其资产收益率对研发投资强度的影响不同。可能的解释是, 不同行业对风险的偏好会有不同,风险偏好型企业 的资产收益率较低时,企业倾向于增加研发投资, 以 增加资产收益率提高的机会;而对于风险厌恶型企 业,当资产收益率较低时,企业不愿过多地进行高风险 与高不确定性的研发投资,因此研发投资水平较低。 
      第三,资产负债率对企业研发投资强度产生了 重要的影响。资产负债率较低时,企业财务风险较小,其研发投资积极性较高。可能的解释是,创业板 上市公司或由于风险规避意识而不愿负债进行研发 投资,或由于金融市场失灵而难以获得外源融资进 行研发投资。
关联规则图
      五、结论与政策建议
      本文基于大数据理念的关联规则算法,推导出 企业研发投资的主要影响因子及各影响因子的影响 程度。研究结果表明:我国创业板上市公司研发投资 主要倾向于运用内源融资,不同行业风险偏好不同, 企业收益水平对研发投资的影响不同。在内源融资 充足而负债较少、财务风险较低的情况下,企业具有 较大的研发动力。当然,从大数据的角度来讲,本文 所采用的数据量偏小,所得出的结论存在局限性, 在 数据可得的情况下,笔者会进一步推进相关研究。 
      从现状来看,我国政策激励研发投资的主要手 段——企业所得税优惠对企业研发投资产生了一定 的影响,但影响程度较低,这说明企业对优惠的敏感 度并不高,难以有效发挥其政策效应。鉴于此,本文 提出如下政策建议:
       1. 国家宏观层面的研发投资促进政策。①重视 企业的主体地位,充分评估政策的有效性。政策激励 企业研发投资的效应,不仅仅取决于政策制度本身 的设计,还取决于企业对政策制度的敏感性,脱离企 业实际情况的激励会由于缺乏着力点而失去政策本 身的效应。②加大财税政策激励研发投资的力度。 目 前我国激励企业进行研发投资的财税政策尚存在诸 多不完善之处,激励效果有限。因此,应在对企业进 行调研的基础上提出切实可行的税收优惠政策,使 税收优惠落到实处。 
      2. 企业微观层面的研发投资促进建议。①提高 企业冗余资源的利用效率。企业组织冗余作为研发 投资潜在的、可利用的资源,为企业研发投资提供了 资金缓冲。而关键的问题是企业应对冗余资源进行 计划、监督,适时将冗余资源转化为研发投资资本, 提高冗余资源的利用效率。②科学预测企业风险, 加 强内部控制。企业面对的风险是企业研发投资的重 要影响因子,加强内部控制以及对风险的衡量和预 测,有助于提高企业研发投资决策的精准度。③优 化研发投资决策流程。企业研发投资决策一方面需 要考虑投资项目的资本来源、风险、收益,以及企业整体面临的财务风险,另一方面也需要充分利用国 家财税优惠政策,提高企业投资税后收益。
      主要参考文献:
      Peneder M.,Worter M.. Competition,R&D and innovation:Testing the inverted-U in a simultaneous system[ J ]. Journal of Evolutionary Economics,2014 (3). 
      戴晨,刘怡. 税收优惠与财政补贴对企业R&D 影响的比较分析[ J ]. 经济科学,2008(3). 
      卜祥来.财税激励政策影响企业R&D支出的 实证研究[ J ].税务研究,2014(3). 
      夏杰长,尚铁力.自主创新与税收政策:理论分 析、实证研究与对策建议[ J ].税务研究,2006(6).
      李永,王砚萍,马宇.制度约束下政府R&D资 助挤出效应与创新效率[ J ].科研管理,2015(10).
      陆攀,朱和平.政府研发补助、公司治理因素与 R&D投资强度的关系检验——基于江浙中小民营 企业的经验数据[ J ].财会月刊,2016(10).
       卢馨,郑阳飞,李建明.融资约束对企业R&D 投资的影响研究——来自中国高新技术上市公司的 经验证据[ J ].会计研究,2013(5).
      曹献飞.融资约束与企业研发投资——基于企 业层面数据的实证研究[ J ].软科学,2014(12).
      连军.组织冗余、政治联系与民营企业R&D投 资[ J ].科学学与科学技术管理,2013(1).
      张信东,姜小丽. .企业R&D投资与系统风险研 究[ J ].研究与发展管理,2008(3). 
      黄曼行,任家华,严娱.我国中小企业R&D投 资与企业财务风险——基于分位数回归方法[ J ].科 技管理研究,2014(14). 
      Chen,Wei -Ru,Kent D. Miller. Situational and institutional determinants of firms' R&D search intensity[ J ]. Strategic Management Journal,2007(4). 
      Altman,Edward I..Predicting financial distress of companies:Revisiting the Z-score and ZETA models[ J ].Journal Administrasi Bisnis,2000(9). 
      孙存一,赵瑜.基于大数据算法的纳税遵从风 险识别以及影响因子分析[ J ] .现代财经,2015(11).
分享到:

免责声明:
  1、研发管理评论发布的所有资讯与文章是出于为业界传递更多信息之目的,并不意味着赞同其观点或证实其描述。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请浏览者仅作参考,并请自行核实相关内容。
  2、本站部分内容转载于其他网站和媒体,版权归原作者或原发布媒体所有。如文章涉及版权等问题,请联系本站,我们将在两个工作日内进行删除或修改处理。敬请谅解!

延伸阅读:

RDMR-本站推荐

more

RDMR-会议活动

more

RDMR-公开课

more

RDMR-项目管理

Copyright ©2017-2019 研发管理评论 版权所有 京ICP备17062359号-5 如转载本站文章,请注明原作者和原发布媒体

本着互联网分享精神,本站部分内容转载于其他网站和媒体,如稿件涉及版权等问题,请联系本站进行删除或修改处理

客服电话:010-89506650 89504891 非工作时间可联系:18701278071(微信) QQ在线:511524637

新闻与原创文章投稿:tougao#cpmta.com 客服邮箱:info#cpmta.com(请将#换成@)

研发管理评论——我国最大的研发管理门户网站,隶属卓橡公司

研发管理评论官方微信

PMO大会官方微信

PMO大会官方微信