第二节 税收大数据分析和税收大数据分析技术

一、税收大数据分析概述

(一)税收大数据分析的内涵

税收大数据分析是税收大数据治理的核心重要内容,是依据征管数字化转型及税收治理现代化的总体要求,是对税收大数据价值的挖掘与分析应用。税收大数据分析是有效运用大数据分析技术,通过对海量税收大数据进行加工、处理、挖掘和利用,分析发现税收遵从风险,科学开展税收风险预警评估,有效实施税收风险防控;分析发现税收征管工作成效及存在的问题,预测未来发展变化趋势,为税收治理现代化提供决策依据。

税收大数据价值的挖掘与分析应用能力是现代税收治理能力的重要标志,只有不断提升税收大数据分析能力,才能获得更多有价值的税收信息,获得更高的税收洞见,不断提升税收的知识管理能力,提升科学的税收决策能力,改进和提高税收征管工作质效,不断推进智慧税务及税收现代化的建设和发展。

(二)税收大数据分析在税收治理中的主要应用

1.税收形势分析

税收形势分析是由收入规划核算部门牵头负责、其他业务部门配合开展的一项税收大数据分析应用工作。主要通过计算宏观、中观及微观不同层面税收指标及相关分析方法,针对一定时期内、一定区域、行业及纳税人不同范围内税收的总量规模、结构特点、质量及增减变动趋势进行分析预测,客观反映税收的数量特征及发展变动趋势,剖析收入增减变化原因,查找组织税收收入、税收征管及经济运行中存在的问题,提出加强组织收入、税收征管的建议及措施。

各级收入规划核算部门采用税收收入简报,月度、季度、半年度、年度分析报告等方式,反映和说明税收数量特征及增减变化原因,组织税收收入计划的进度、完成情况及税收收入的质量,为更好地完成税收收入计划,提高组织税收收入的主动性和前瞻性,发挥税务部门的基础性、支柱性和保障性作用提供决策依据。

2019年1月1日以来,社保费及非税收入划归税务部门征收后,根据实际管理的要求,需要针对所有税费种开展税费收入分析和预测,客观反映一定时期内、一定区域或行业及纳税人不同范围内税费收入的总量规模、结构特点、税收治理及增减变动趋势。

2.经济税源分析

经济税源分析简称税源分析,根据分析的视角,在有些情况下又称经济形势分析。主要通过计算宏观、中观及微观不同层面涉税经济活动指标及相关分析方法,针对一定时期内、一定区域或行业及纳税人不同范围内涉税经济活动的总量规模、结构特点、税源质量及增减变动趋势进行分析预测,客观反映涉税经济活动的数量特征及发展变动趋势。如某地区的国内生产总值、增加值的产业结构、社会消费品零售额、固定资产投资额等。通过开展税源分析,能够客观反映涉税经济活动的总量规模、结构、质量及增减变动等数量特征,涉税经济数据对税收产生的关联影响,查找税源管理中存在的问题,分析影响税收增减变化的主要原因,为更好地优化营商环境、完善税制、加强征管、促进经济税收协调高质量发展提供决策依据。

3.税收经济分析

税收经济分析是站在税务机关的角度分析经济运行的变化及税收经济之间的关联影响关系。通过有效获取税收大数据,运用税收经济分析指标,分析经济运行对税收的影响,同时透过税收大数据反映经济运行发展状况及经济结构调整变化情况,反映税收与经济发展的协调程度,查找税收征管中存在的问题,有针对性地采取加强税收治理的措施,为税制改革完善、加强税收征管、组织税费收入,促进和推动经济、税收协调高质量发展提供决策依据。税收经济分析是从税收视角观察和反映经济运行的状况,做好税收经济分析可以有效提升税务机关的话语权。

4.税收风险分析

税收风险分析是税收大数据应用的重要核心领域,是指围绕税收风险管理目标,依据掌握的税收大数据,构建税收风险指标体系,运用大数据的量化模型及智能化现代信息技术,对潜在的税收风险进行分析识别,探究税收风险特征规律,寻找发现税收风险可能发生的区域、行业、纳税人及具体的税收风险发生环节的过程,并对可能产生的税收风险进行预警预测,为科学有效地防范规避税收风险,有效实施税收风险应对控制和排查提供具体的明确指向和决策依据。税收风险分析可以从宏观、行业及微观不同层面范围开展和实施。

5.税收政策效应分析

税收政策效应分析是从事前、事中和事后,密切跟踪税制改革和税收政策发展变动及实施效果等情况,测算税收政策变动、减税降费政策实施等对税收和经济社会发展、产业结构优化调整、动能转换等的定量影响,并提出进一步完善税收制度政策,进一步促进经济结构调整优化、经济社会协调高质量发展的建议措施,充分反映税收对经济社会发展的重要调控职能作用,发挥税收在国家治理体系和治理能力现代化建设中的积极促进作用。

(三)税收大数据分析的意义

1.为组织收入服务,提高组织收入的前瞻性

税收大数据分析是宏观经济分析的基础。通过税收大数据分析,可以更好地从宏观层面剖析税收收入增减变化的原因,研判经济运行发展态势。利用税收大数据分析的优势,可以更精准地从税收视角观察、反映我国经济运行状况,供给侧结构性改革及产业结构转型升级的发展情况,更好地把握经济发展方式转变进程,折射经济社会发展中值得关注的问题。税收大数据分析可以反映宏观经济形势变化对税收收入的影响,有助于推动科学开展税收经济分析预测,更科学合理地制订税收收入计划,提高组织收入的前瞻性和掌控能力。

2.优化纳税服务,提升现代化、专业化、精细化纳税服务水平

通过税收大数据分析可以为纳税人缴费人画像,分析诊断纳税缴费需求,总结提炼的共性需求和个性化需求的特点规律,进而为纳税人缴费人提供更有针对性的优质、高效、便捷的专业化、精细化服务。在满足普遍的共性纳税服务要求的同时,也为纳税人缴费人提供更有针对性、更精细的个性化服务,提升现代化、专业化、精细化纳税服务水平。

3.是实施税收风险管理,提高税收遵从度的重要手段

降低征纳成本、提高税收风险管控能力是促进提升税收遵从度的根本途径。通过大数据风险分析方法开展税收风险画像,识别税收遵从风险可能发生的区域、行业及风险企业,做到事前有效预防,事中及时开展风险预警评估,对无风险户不打扰、对低风险户进行风险提醒服务,对高风险户重点实施有效风险监管,从而降低征纳成本,有效规避防范税收遵从风险,提高税收风险管控能力,实现征纳共赢。

4.为加强税收执法监督服务,有效防控税务执法风险

通过对税收大数据的深度分析应用,可以及时发现税收执法过程中的不规范行为,有效实施税务执法风险预警监控,从而实施针对性执法责任监督,有效防范和阻止执法不规范行为的发生,从而防控税务执法风险,提高税务执法的精确性和规范性。

5.为税制改革服务,推进税收制度、政策的不断改革完善

从事前、事中和事后全程密切跟踪税制改革和税收政策调整实施的进程和执行情况,测算税制改革、税收政策变动对经济、税收的定量影响,加强定量分析和预测,为完善税制改革提出调整优化的建议措施。

6.为经济社会高质量发展服务,发挥税收在国家治理体系和治理能力现代化建设中的积极作用

围绕经济决定税收,税收反映经济,旨在通过税收放眼经济,反映经济运行过程的数量特征及发展趋势。通过税收大数据分析,可以正确反映税收经济发展的相关性和协调性,对税收经济协调运行发展状况进行客观分析评价,及时发现不协调缺口及成因,提出改善和调整其中不协调因素的具体建议措施。缩小税收收入与经济指标之间的缺口,促进税收经济协调、高质量发展,有效增强税务机关的话语权,充分发挥税收调控经济的重要职能作用,发挥税收在国家治理体系和治理能力现代化建设中的重要的积极促进作用。

二、常用的税收大数据分析类型

(一)描述型税收数据分析

描述型税收数据分析主要是分析税收业务发生了什么,是最常用的分析方法,用于对各类涉税业务情况的基本了解、掌握和展现。这种方法为税收管理人员提供了重要分析指标和分析业务的衡量方法。典型应用有金税系统的各类查询、报表,以及一户式全景展示、一局式信息展现等基本情况分析。例如,对某大企业每月进行税收收入分析,企业的经营利润增减变动的数据是多少,税收收入是增长还是下降等,都属于描述型税收数据分析。利用可视化分析工具,能够更有效地增强描述型分析所反映的信息内容。

(二)识别评估型税收数据分析

识别评估型税收数据分析主要是分析税收业务为什么会发生。它是基于税收大数据比对产生的经验知识,是税收大数据分析的重要方法之一,主要应用于对税收风险成因的分析、诊断评价,对税收风险进行分析识别、判断和评估的过程,又称税收风险评估。通常是在描述型税收数据分析的基础上对税收风险开展的深入分析和评价,依据掌握的税收风险特征构建税收风险指标体系,运用量化模型及现代信息技术手段,对潜在的税收风险进行深入分析识别,探究规律。寻找发现税收风险可能发生的区域、行业、纳税人及具体的税收风险发生环节和目标的过程,并对税收风险进行评估排序,为科学有效地实施风险应对、控制和排查提供具体指向和决策依据。典型应用有大数据风险管理部门开展的专项税收风险分析监控、重点行业税收风险评估等。

(三)探究型税收数据分析

探究型税收数据分析又称税收数据深度挖掘分析,主要是围绕税收征管中存在的问题、税收遵从风险等开展进一步深入挖掘,依据掌握的数据分析挖掘工具和方法进行层层递进、抽丝剥茧的深入挖掘和分析,钻取数据的核心、问题及风险的根源,挖掘出事实真相及更深入细致的税收风险点、风险成因,提炼出特征规律,进而采取有效措施实施问题及风险的应对排查。典型应用有大企业税收风险应对、基层税源管理部门风险应对中的案头风险分析,税务执法风险监督分析等。

(四)预测、预警型税收数据分析

预测、预警型税收数据分析主要是分析未来可能发生什么税收业务。税收大数据分析最重要的应用领域之一就是预测、预警。通过科学构建预测、预警税收数据分析模型,通过较长时期的时间数列,对税源、税收收入、税收风险开展预测和预警分析,预测未来可能发生什么税收业务、发生的时间点及发生的概率等,预测一个可量化的阈值区间。主要包括对税收经济发展趋势进行预测判断,如税源经济指标、税收收入分析预测分析应用,以及对税收风险进行预测预警分析等。

在充满不确定性的税收环境下,预测、预警型税收数据分析能够帮助税收管理人员提高税收管理的前瞻性和主动性,未雨绸缪,防患于未然,增强税收风险的防控意识,科学做出各项税收工作的决策,提高现代税收征管能力。典型应用有大数据风险管理、收入规划核算、税收经济分析部门的税收风险预警分析、税收收入分析预测、税收经济预测分析等。

(五)决策型税收数据分析

决策型税收数据分析主要是分析税收业务需要做什么。是在“发生了什么”“为什么会发生”“可能发生什么”的基础上,进一步分析“需要做什么”,帮助税收管理人员决定应该采取哪些措施应对和解决问题,辅助管理者进行更科学决策。通常情况下,决策型分析不是单独使用的方法,而是在前面的所有分析步骤完成之后,最后需要完成的分析方法。典型应用有两种:一是大数据风险管理部门在对税收风险识别评估后,将企业的涉税风险点推送至税收稽查部门或基层税收管理部门,帮助税收管理人员找到企业的涉税风险点,选择最好的风险应对措施控制排查企业的税收风险,实现征纳共赢;二是税收政策部门、税收经济分析部门开展的政策效应分析,主要分析税收政策落实执行的效果,对区域经济发展产生的积极影响,存在哪些问题,需要采取哪些措施进一步改进完善等。

(六)综合型税收数据分析

综合型税收数据分析是指对多种类型、多维度分析方法的有机结合和综合运用,又称360度全方位分析方法。典型应用有360度税收风险画像分析,基于多个分析维度和视角,将税收风险指标分析、涉税财务指标分析,第三方信息比对分析等多种分析方法的综合运用。综合型税收数据分析可以更全面、系统、深入地对税收风险进行分析识别、评估判断,有针对性地对税收风险进行有效控制和排查。

三、税收大数据分析技术概述

(一)税收统计分析技术

税收指标分析:主要包括税收经济分析、税收风险指标分析、税收收入预测分析、税收聚类分析、税收主成分因子分析、税收关键指标判别分析等。

税收统计分析:主要包括均值分析、离散分析、决策树法、假设检验、参数检验、显著性检验、均衡及差异分析、相关分析、T检验、方差分析、离散分析、简单回归分析、多元回归分析、回归预测与残差分析、岭回归、logistic回归分析、判别分析、主成分分析、因子分析、快速聚类法与聚类法、判别分析、多元对应分析(最优尺度分析)、Bootstrap技术、时间序列分析等。

(二)税收数据挖掘技术

税收数据挖掘技术包括分类(classification)、聚类(clustering)、预测(prediction)、估算(estimation)、相关回归或关联规则(Affinity grouping or association rules)、描述和可视化(Description and Visualization)、复杂数据类型挖掘、网络数据挖掘(Text,Web,图形图像,视频,音频等)。

(三)税收大数据模型分析技术

税收大数据模型分析技术主要包括基于机器学习训练的人工神经网络模型、回归预测、估算模型、仿真统计建模技术等。在税收征管数字化转型背景下,迫切需要在由普通机器组成的大规模集群上实现高性能的以机器学习算法为核心的智能化数据分析技术,为实际的税收业务提供更好的决策支持智能化服务,实现税收业务到税收数据,最终到税收知识管理及智慧税务的转变。

与传统的在线联机分析处理OLAP不同,对税收大数据的深度分析应用主要是基于大规模的机器学习技术。一般而言,机器学习模型的训练过程可以归结为,最优化定义于大规模训练数据的目标函数,并且通过一个循环迭代的最优化模型算法实现,因而与传统的联机分析处理OLAP相比,基于机器学习训练的税收数据模型分析技术具有独特的优点和更高的精准性。

聚类分析、税收关联指标模型挖掘算法、人工神经网络模型、回归预测估算模型等各种大数据挖掘模型算法,都是基于不同的数据类型和数据格式,可以科学地反映税收数据本身具备的数量特征和规律。这些被全世界统计学家所公认的、可以称之为真理和规律的各种统计算法模型,让我们一方面可以更快速地处理税收大数据,另一方面还可以深入税收大数据内部,挖掘提炼出有价值的税收信息和税收数量和规律。