关于基层审计机关如何快速上手大数据审计的几点思考

浏览次数: 信息来源: 电子数据审计科 发布时间:2023-06-02 18:11
字号:

习近平总书记在中央审计委员会第一次会议上指出,要坚持科技强审,加强审计信息化建设。在信息技术蓬勃发展的当下,数据在社会管理、企业管理中起着越来越重要的作用。随着越来越多的被审计单位业务量成指数级的增长,产生的业务、财务资料以表格数据的形式存储于相关信息系统中,这就需要审计机关进一步解放思想、与时俱进,加快从“传统审计”向“数据审计”转型。而基层审计机关计算机专业人才匮乏,财会背景的审计人员又面临繁重工作,无暇进行脱产数据审计培训,因此在面对大量数据分析需求时,存在着不小的困难。下面就如何推动审计人员在日常审计过程中快速上手,进行简易数据分析,提高审计质效,浅淡几点思考。

一、高效甄别审计类型,建立数据分析思维。

大数据无时无刻不在产生,在和审计相关的各个行业中无一例外,对海量数据进行查询、处理、分析也成为必然。尤其随着信息化程度的提高,金财、金税、金保、金盾、金农工程等的发展,涉及的也不再只是财务数据,还有大量业务数据。“总体分析、系统研究、发现疑点、分散核实、精确定位”的数字化审计方式成为发展的必然趋势,所以审计方法要从传统审计方法向大数据审计方法转变,主要表现在:1.审计资料不再只是抽查部分纸质资料,更多的是海量电子数据。2.审计思路不再只是财务审计而是综合绩效审计。3.审计时效由事后审计转变为实时监督。4.审计覆盖面由部分被审计单位转变为审计全覆盖。

针对上述特点,结合近几年数据审计案例,整理总结出在以下几类审计中可以运用简易的大数据分析快速入手。

一是涉及民生工程专项资金类的审计,如社保审计、医保审计以及涉农补贴资金、民生救助资金、公积金审计等。这类审计特点是所涉及的数据量巨大、传统审计方式无法开展、政策规定相对明确、容易形成分析思路,如社保审计中涉及全市居民养老保险明细数据有4亿条,根据政策确定审计思路,简单数据比对分析,即可快速得到高质量的疑点线索,形成事半功倍的效果。

二是企事业单位审计,如公交公司、高校、中学等。这类审计涉及大量收费,有单独的信息系统全流程产生、存储数据,同样有详细明确的政策支撑容易形成分析思路。

三是经济责任审计,如法院、民政局等业务部门。日常产生大量业务数据,涉及大额财政资金的收支,也可根据相关业务规定开展简单数据分析。

二、精准提出数据需求,安全进行“数前”准备。

数据审计首先是政策研究,明确需要查出的问题疑点,形成思路。然后根据思路,确定需要的字段数据,可以设计成标准表的形式要求被审计单位提供。从数据安全性考虑,建议不要直接从被审计单位的信息系统提取备份数据,可以列出所需要的字段,以标准表的形式,交由被审计单位提供。如审计署针对社保审计设计的标准表:

三、巧用国产办公软件,降低分析比对门槛。

目前,国产办公软件WPS已经成为审计人员日常工作中最常用的软件,但我们往往忽略了其包含的强大数据处理和分析能力。

一是表格整合能力。wps中的Excel表格可以进行多表格多功能合并,如种粮补贴审计中,由于县区乡镇众多,采集来的数据是以乡镇为单位,需要合并到一起分析。这就可以选中每个表格,右键文档合并到一张工作簿,再进入工作簿通过数据栏——合并表格——合并到一张表或者根据相同列内容合并等功能完成数据整合。

二是数据统计能力。在审计中,经常需要统计每个身份证号下的补贴金额等,可以通过数据栏——分类汇总功能和筛选环境下,计数统计导出项数和条数。

三是数据比对能力。在遇到需要比对两表中的重复项时,就可以通过数据栏——数据比对——筛选重复项/筛选唯一项进行所需比对。

四、熟用基础分析语句,切实提高审计效能。

其实日常审计过程中运用到的数据分析技术大多比较基础,通过计算机中级培训的审计人员均可直接上手。对于未接受过省厅或审计署计算机中级培训的业务骨干,可以通过网络如“b站”搜索、学习SQL数据库下载、安装教学视频。下面介绍两类常用且简易的分析语句。

第一是两表相连,根据身份证号相同,查找两张不同表格之间的重复项。这个是日常审计中最为常用的。如:

SELECT a.*,b.*

from dbo.[低保资金发放名单] a,dbo.[财政供养人员名单] b

where a.[身份证号码]=b.[公民身份号码]

低保资金发放名单和财政供养人员名单这两张表,通过身份证号关联,如果产生结果,说明同一个人在两张表里都出现,即财政供养人员领取低保资金补贴。这种方法还可以用于社保审计,筛选出某人重复领取职工养老金和居民养老金的疑点;也可以用于保障房专项审计,筛选出某人拥有住房但同时还申请到了公租房。

第二是简易函数的应用。

如医疗机构在接诊重症或需长期治疗患者时,将一次住院人为拆分为多次,分解后可多次进行医保结算,从而套取医保基金、增加医疗收入。

我们可以通过简单的窗口函数进行排序,将一段时间内多次住院、出入院时间间隔极短,且每次住院治疗项目、就诊科室、主治医生等情况相对稳定单一的患者筛选出来:

with i as(select row_number() over(partition by 身份证号 order by 入院时间) 序号,病人ID,姓名,住院号,入院时间, 身份证号,出院时间,医疗付款方式

from 病人信息 where to_number(to_char(入院时间,'yyyy'))=2020 and 医疗付款方式 not like '%全自费%'  and 住院号 is not null)

select * from 病人信息 where 住院号 in (

select a.住院号 from i a join i b on a.身份证号=b.身份证号

where (to_number(b.入院时间-a.出院时间)<15 and a.序号+1=b.序号) or (to_number(a.入院时间-b.出院时间)<15 and a.序号=b.序号+1))

order by 身份证号,入院时间

如果病人一年内多次住院,这个函数可以把这类病人一年内按照入院时间排序,再将第一次住院和第二次住院时间间隔计算出来,少于15天的即可作为分解住院的疑点进行核实。

五、筑牢数据审计理念,克服畏难心理状态。

(一)敢于使用数据分析手段。目前,对于大部分审计项目简易比对技术,基本满足筛选疑点的要求,仅需掌握导入导出、简单语句和个别常用函数即可。关键在于强化数据审计理念,敢于探索使用数据分析技术。同时,积极学习省厅每年下发优秀数据审计分析案例,构建数据分析模型,遇到类型相似项目,完全可以直接借鉴使用。

(二)数据审计吃透政策是前提。数据分析归根到底是审计辅助手段,对业务的精通、政策的了解才是大数据审计的首要前提。所以数据分析的前期步骤是重中之重,首先需要我们花费大量精力,结合政策法规和审计实施方案,对被审计单位业务流程进行深入学习,做到对审计重点内容了然于心,形成数据分析思路;其次根据审计思路,列出需要采集的数据字段,交由被审计单位提供,数据完整的提取标志着数据分析工作已过半,后续只需要简单的导入,比对分析、函数分析后导出,即可得到疑点线索。

(三)大数据审计前景广阔。数据爬虫技术、聚类分析、区块链技术、人工智能等新时代信息发展的产物,必将引领着传统审计的发展与变革,使得跨行业、跨领域、跨地区、多维度、多层次审计得以实现,也使得复杂性、隐蔽性、趋势性问题更容易被发现并采取有效预防手段。未来,大数据审计将会给审计工作带来更多的机遇,切实实现审计是保障国家经济社会健康运行的“免疫系统”要求,为国家治理贡献力量!

标签:
关联信息