基于损失分布法的健康保险欺诈风险度量研究

学术研讨

主页 > 学术研讨 >

基于损失分布法的健康保险欺诈风险度量研究

时间：2018-04-19 14:27 来源：【未知】

魏超

（潍坊市潍城区委党校）

刘喜华

(青岛大学经济学院）

[摘要]健康保险欺诈严重扰乱了保险市场秩序，侵害了诚实投保人的合法权益，威胁着保险行业的健康发展。本文利用2006年至2013年的新农合欺诈损失数据，借鉴损失分布法原理，以VaR方法为基础，对欺诈损失频率和欺诈损失强度分别建模，拟合出它们的最优分布函数，根据这两个分布函数拟合总损失的最优分布函数，并采用蒙特卡洛模拟方法进行拟合，从而计提欺诈风险损失准备金。结果表明：在一年内新农合欺诈损失金额有99%的可能性不会超过1749.46万元，即在99%的置信水平下，新农合基金每年需要计提1749.46万元的欺诈风险损失准备金。

[关键词]保险欺诈；损失分布法；蒙特卡洛模拟；度量

一、引言

健康保险欺诈是指投保人故意虚构保险标的，在没有发生保险事故的情况下谎称发生了保险事故，或者故意制造保险事故，或者在保险事故发生后以伪造、虚构的有关证明、资料和其他证据来编造虚假的事故原因，或者夸大损失程度，向保险人提出索赔或给付请求的行为^[1]。近年来保险诈骗案件不断发生，如重庆市秀山县一个欺诈团伙一年多的时间内诈骗新农合基金450万元；陕西省洋县妇幼保健院的职工利用职务便利通过伪造资料骗取新农合38万元；江苏省溧阳市新农合管理办公室职工勾结社会诈骗团伙骗取新农合基金130余万元等。据保险业内人士估计，在我国每年发生的保险诈骗案损失金额大约占到赔付总金额的20%~30%。

对于健康保险欺诈问题的研究学者们是从理论和实证两方面入手的。主要的理论研究问题包括健康保险欺诈的表现形式及其成因、欺诈的经济学分析和反欺诈措施等。赵曼（2006）等认为，易滋生欺诈的社会医疗保险道德风险主要分为需方道德风险（过度消费）和供方道德风险（诱导需求）,在准确界定了社会医疗保险的各参与方关系基础上，可通过设立针对供方提供医疗服务的约束性机制来降低道德风险发生的概率^[2]。李亮（2009）等人针对社会医疗保险欺诈现象设计调查问卷，根据理论基础成本——收益决策树模型，提出从成本——收益角度入手制定合理的社会医疗保险制度^[3]。实证研究目前主要集中于健康保险欺诈的识别研究和度量研究。王珺（2010）利用国内一家保险公司健康险保单数据，通过普通保险和重大疾病保险建立Probit模型，实证分析了健康保险市场中的道德风险^[4]。李连友（2011）利用2006年至2009年的部分新农合欺诈损失数据，借鉴高级计量模型中的VaR方法，在得出新农合欺诈损失频率拟合分布和欺诈损失强度拟合分布的基础上，借助SAS软件对新农合欺诈损失数据进行了实证分析，上述研究方法对本研究具有重要的借鉴意义^[5]。

本文在借鉴相关文献的基础上，着重对健康保险欺诈的风险度量进行实证研究，研究主要以我国新型农村合作医疗保险为例，通过对收集到的新农合欺诈数据进行分析和推演，来预提新农合基金的欺诈风险准备金。本文希望可以在一定程度上揭示我国健康保险欺诈的内在特征与规律，提高保险机构识别欺诈风险的能力与水平，促进健康保险市场的稳定发展及保障医疗保险政策的有效实施。

二、研究设计

本文采用损失分布法的基本思路是：在一定时期内（通常为一年），给定置信区间，以VaR方法为基础，对欺诈损失频率和欺诈损失强度分别建模，拟合出它们的概率分布函数，然后根据这两个概率分布函数拟合总损失的概率分布函数，并采用蒙特卡洛模型进行拟合，从而计算预提欺诈损失风险准备金。

利用损失分布法计算欺诈风险准备金可以分成以下几个步骤进行：

（1）估计健康保险欺诈损失频率的概率分布；

（2）估计健康保险欺诈损失强度的概率分布；

（3）估计健康保险欺诈总损失分布；

（4）总损失分布的蒙特卡洛模拟；

（5）计提欺诈风险准备金。

损失分布法的一般模型为：

（1）

其中，L_i表示第i次保险欺诈造成的损失金额，即损失强度；N表示一定时期内发生保险欺诈的次数，即损失频率，在本研究中指一年内发生的健康保险欺诈的次数；S表示在一定时期内保险欺诈造成的总损失，本研究中指健康保险欺诈在一年内造成的总损失金额。

损失分布法应用于健康保险欺诈度量的基本假定为^[6]：

（1）损失强度L_i之间独立同分布；

（2）L_i是随机变量且独立于N；

（3）欺诈风险损失频率和损失强度的统计分布短期内是不变的。

N的分布是离散的，可选用二项分布、泊松分布等离散型分布模型；L的分布通常选用正态分布、对数正态分布、指数分布、Weibull分布等连续型分布模型；S的分布可以通过特征函数法、Fourier转换、蒙特卡洛模拟或者其他解析近似方法获得^[7]。本文中，对于N和L的分布将根据实证数据选择拟合效果最好的分布模型，对于S的分布，先利用特征函数法将其进行Fourier转换得出便于下一步模拟的密度函数公式，然后进行S的蒙特卡洛模拟分布（图1）^[8]。

蒙特卡洛模拟又称随机模拟，对数据的随机模拟有很好效果，国际金融机构经常用其来预测风险发生和度量风险造成的损失概率分布。可采用Matlab软件或者Eviews软件实现蒙特卡洛模拟，步骤如下：

（1）在得到健康保险欺诈频率的分布函数后，进行一定次数的模拟，模拟次数n根据需要确定，这样就可以产生符合该分布的随机数m₁，m₂，···m_n，对每个m值进行下一步模拟；

（2）假设m取值m₁，即在一定时期内损失事件发生m₁次，对健康保险欺诈损失金额进行m₁次模拟，得到m₁个欺诈损失金额值L₁，L₂，···L_m1，它们代表一定时期内每一次保险欺诈造成的损失金额；

（3）将m₁个保险欺诈损失金额相加，得到一定时期内健康保险欺诈总损失的模拟结果S；

（4）将m₂至m_n重复步骤（2）和（3），我们可以得到n个可能的健康保险欺诈损失值；

（5）利用这n个健康保险欺诈损失值，健康保险欺诈的损失分布情况便可获得，根据欺诈损失分布可以在VaR模型的基础上，得出不同置信水平下健康保险欺诈的损失情况。

图1 蒙特卡洛模拟示意图^[9]

三、实证研究

（一）数据来源和调整说明

1.数据来源说明

考虑到数据的可得性和研究结论的实用性，本文选择采用单一的新农合欺诈损失数据，时间跨度从2006年到2013年，主要数据收集内容包括欺诈时间、欺诈次数、案发时间、涉案金额、损失金额、欺诈实施主体、欺诈实施手段，共收集报道127篇。

2.数据调整说明

由于数据来源于公开媒体报道，不同媒体报道的案例形式各不相同，因此需要对收集的案例进行整理，使案例中所需数据按同一规则呈现，具体调整如下：

（1）欺诈实施主体说明

新农合欺诈案例的统计分析表明，欺诈实施主体主要有四类：新农合参合农民、新农合管理人员、定点医疗机构医务人员、社会专门欺诈团伙。在统计分析过程中，将不明确属于以上四类欺诈实施主体的做如下处理：1）本人是新农合的参与人，借用亲戚新农合医保卡实行欺诈的行为视为新农合参合农民欺诈；2）本人虽是新农合的参与人，但骗取陌生人新农合医保卡进行欺诈的行为视为社会专门欺诈团伙欺诈；3）本人不是新农合参与人，借用他人的新农合医保卡进行欺诈的行为视为社会专门欺诈团伙欺诈；4）报道中未提及欺诈人是否是新农合参与人、新农合管理人或定点医疗机构医务人员的，视为社会专门欺诈团伙。

（2）欺诈时间说明

欺诈时间是指新农合欺诈的作案时间，本文研究的时间跨度从2006年到2013年，收集的新闻报道中的作案时间都在此阶段，并非指新闻报道的时间，对于欺诈时间有争议的欺诈案件，本文做出如下处理：1）对于同一欺诈主体在数年里进行的一次欺诈案件且无法确定具体作案时间的，以其中期时间为欺诈时间；2）对于同一欺诈实施主体数年发生多次的欺诈案件，将欺诈次数和欺诈损失金额按每年时间长短按比例单独计入；3）对于报道中欺诈时间未做说明的欺诈案件，可以从文中推测得出的，以推测所得为依据；无法从文中得到欺诈时间的，以案发时间往前推两个月为欺诈时间（统计数据表明大部分欺诈案件的案发时间要迟于作案时间一个月以上，三个月以下）；4）对于文中无任何提示作案时间或者案发时间的欺诈案件，以新闻报道时间往前推两个月为欺诈时间。

（3）欺诈次数说明

不同的媒体对于新农合欺诈的报道形式各不相同，欺诈次数的说明也各不相同，为研究需要，本文做出如下说明：1）有明确的说明作案次数或件数的，以明确说明的为准；2）收集的报道中出现多少余次的，视为具体到的整数（例如，作案30余次，视为30次）；3）同一欺诈实施主体多年进行的多次欺诈案件，将多次欺诈案件按时间比例分摊至各年（例如，某一社会欺诈团伙在2008年7月至2009年12月共实施36次欺诈行为，则2008年计入欺诈次数12次，2009年计入24次）；4）对于欺诈实施主体以户、份、套为单位的虚假资料作为欺诈材料的，将每户、份、套虚假资料分别作为实施一次欺诈行为的依据；5）对于欺诈次数未作出说明的媒体报道，视为一次欺诈行为。

（4）欺诈金额说明

本研究收集到的金额有涉案金额、损失金额和追回金额，其中，欺诈金额指的是损失金额，是由于具体欺诈行为实施后，给新农合基金造成的具体损失，对此，做出如下说明：1）收集的报道中欺诈金额是不确定的，采用确定的数据表示（例如，欺诈损失金额30余万元，视为30万元）；2）同一欺诈实施主体数年进行的多次欺诈行为，欺诈金额按次数分摊到各年；（3）欺诈金额没有明确说明的，但是报道中有涉案金额的，以涉案金额作为欺诈金额；4）对于金额较小且确定的欺诈金额，为便于研究，将其四舍五入到百位（例如，欺诈损失金额2980元，近似为3000元）。

（二）欺诈损失数据的描述性统计分析

1.不同年份的欺诈损失情况统计分析

利用表格形式将2006年至2013年发生的新农合欺诈次数、涉案金额及损失金额表示如下：

表1 不同年份的欺诈损失数据

年份	欺诈次数（次）	涉案金额（万元）	损失金额（万元）
2006	203	138.00	117.00
2007	96	237.10	149.60
2008	413	1637.27	553.87
2009	338	925.57	360.70
2010	237	459.60	326.70
2011	350	579.30	442.80
2012	319	790.61	634.81
2013	114	455.77	401.57

观察上表可知，从欺诈次数来看，欺诈次数最少的为2007年的96次，占欺诈总次数的4.63%；欺诈次数最多的为2008年的413次，占欺诈总次数的19.95%。从欺诈涉案金额来看，涉案金额最少的为2006年的138万元，占欺诈涉案总金额的2.64%；涉案金额最多的为2008年的1637.27万元，占欺诈涉案总金额的31.35%。从欺诈损失金额来看，损失金额最少的为2006年的117万元，占欺诈损失总金额的3.92%；损失金额最多的为2012年的634.81万元，占欺诈损失总金额的21.25%。由此可见，2006年新农合欺诈现象较少，主要原因在于新农合制度在2003年开始试点，2006年刚开始在全国范围内推广，犯罪分子的作案手段还不娴熟；在2008年欺诈较为严重的主要原因是重庆一欺诈团伙通过伪造病历资料骗取大额新农合基金。

2.欺诈行为统计分析

欺诈行为主体主要有四类：新农合参合农民、新农合管理人员、定点医疗机构医务人员、社会专门欺诈团伙。新农合欺诈案件有的是某一类欺诈主体单独实施的，有的是两类或三类欺诈主体共同实施的，根据欺诈类型对欺诈次数、涉案金额、损失金额分类的直观表示如下图：

图2 欺诈行为人类型划分

对2006年至2013年发生的新农合欺诈案件统计可得，单一类型的欺诈主体作案次数最多，达到1297件，占比62.66%。欺诈涉案金额、欺诈损失金额占比最多的同样是单一类型欺诈，这说明新农合欺诈实施主体主要集中于某一类欺诈行为人，因此，接下来本文主要分析单一类型欺诈行为人的欺诈情况。

图3 单一类型欺诈行为人欺诈次数占比

图4 单一类型欺诈行为人欺诈损失金额占比

从欺诈行为人欺诈次数来看，社会专门欺诈团伙共欺诈837次，占比64.53%。社会专门欺诈团伙的欺诈手段主要是伪造新农合定点医院的住院病历、住院费用明细，通过骗取新农合参合农民的医保卡来实施犯罪行为。作案主体主要是多人，且同一伙欺诈人作案次数多于2次的比例高达98%。此外，新农合参合农民欺诈手段主要是虚报医疗费用，有少数人冒用熟人的医保卡实施欺诈行为；定点医疗机构医务人员通过虚列收费项目、伪造“患者”住院证明等方式骗取社保基金；而新农合管理人员则多是利用工作上的便利侵吞新农合基金。

从欺诈行为人造成的损失金额来看，社会专门欺诈团伙的欺诈行为造成的新农合损失金额是最多的，高达到1307万元，占比80.83%；最少的是新农合管理人员，欺诈金额达33余万元，占比2.10%。分析认为，团伙作案仍是新农合基金损失的主要原因，且团伙作案欺诈金额普遍较大，欺诈成功率较高，并且欺诈手段较为复杂。

此外，在两类欺诈行为主体联合欺诈的案件中，新农合参合农民联合社会专门欺诈团伙的欺诈给新农合基金造成的损失比较严重，在统计的期间内，欺诈达到323次，欺诈损失金额达487万元，在两类欺诈主体联合欺诈总案件中的占比分别是89.23%和73.12%。欺诈方式主要是新农合参合农民持欺诈团伙提供的虚假报销资料，使用自己的新农合医保卡或者近亲属的新农合医保卡行骗，一般分多次进行且数额平均在1万/次左右，病种大多是纳入全国范围的大病统筹。两类欺诈行为主体联合欺诈的案件中，新农合管理人员联合社会专门欺诈团伙给新农合基金造成的损失也比较大，欺诈方式主要是新农合管理人员利用自身职务的便利，通过勾结社会专门欺诈团伙，采用其提供的虚假资料侵吞新农合基金。

在三类及以上欺诈主体联合欺诈案件中，新农合参合农民、新农合管理人员和社会专门欺诈团伙共同欺诈现象较为严重，统计期间内，欺诈次数高达304次，造成损失449万元，在三类及以上欺诈案件中占比分别达到82.83%和90.71%。欺诈手段主要是新农合管理人员对于参合农民利用虚假报销资料进行医保卡报销的行为持消极态度，放纵犯罪行为的发生，之后三类欺诈行为主体对于欺诈所得进行分摊。

（三）欺诈损失频率的拟合分布

2006年至2013年的新农合欺诈损失频率直方图如下：

图5 新农合欺诈损失频率分布直方图

对于损失频率的拟合，优先考虑常用的二项分布和泊松分布。二项分布的应用前提是n和p（n是指事件总数，本研究中指所有新农合报销件数；p是指新农合欺诈发生的概率）已知，但由于新农合报销件数并无完整的统计记录，故n和p都无从得知，二项分布对于损失频率的拟合分布研究失效。泊松分布是二项分布中的n值很大，p值很小时候的特殊形式，适用于本研究中的新农合数据。在图5数据的基础上，利用Matlab软件进行泊松分布拟合，在0.05的置信度水平下，得出Kolmogorov-Smirnov检验值为0.7497，大于临界值0.6239，故新农合欺诈损失频率拒绝服从泊松分布。

由于离散型分布未能拟合出欺诈损失频率的分布，考虑用正态分布、对数正态分布、指数分布和韦伯分布尝试拟合。四种分布均通过了检验（表2），其中，正态分布的KD值最小，p值最大，拟合效果最优，故选用正态分布来拟合新农合欺诈损失频率的概率分布（图6）。

正态分布的密度函数为：

（2）

其中，均值为258.75，标准差为115.30。

表2 欺诈损失频率分布的拟合优度检验结果

Test for Distribution
Distribution	Kolmogorov D	CV	P	Test Conclusion
Normal	0.1994	0.4543	0.8701	接受
Lognormal	0.2238	0.4543	0.7627	接受
Exponential	0.3100	0.4543	0.3579	接受
Weibull	0.2190	0.4543	0.7853	接受

图6 欺诈损失频率的正态分布拟合q-q图

（四）欺诈损失强度的拟合分布

2006年至2013年的新农合欺诈损失金额分布直方图如下：

图7 新农合欺诈损失强度分布直方图

对于新农合欺诈损失强度分布的拟合考虑用正态分布、对数正态分布、指数分布和韦伯分布。将欺诈损失金额分成九组的直方图显示（图8），欺诈损失强度集中在0-5万元的欺诈高达1987次，而欺诈强度高于20万元的仅有两次，可见，大部分的损失金额在5万元/次以下。故选用欺诈损失金额的对数进行概率分布拟合，描述结果较为理想。

图8 欺诈损失金额分组分布直方图

欺诈损失强度取对数进行正态分布、对数正态分布、指数分布和韦伯分布的拟合优度检验。其中，对数正态分布和指数分布未通过检验，正态分布和韦伯分布通过了检验（表3）。其中，韦伯分布的KD值最小，p值大，拟合效果最优，故选用韦伯分布来拟合新农合欺诈损失强度分布概率（图9）。

韦伯分布的密度函数为：

（3）

其中，形状参数α值为3.20，尺度参数β值为2.73。

表3 欺诈损失强度分布的拟合优度检验结果

Distribution	Kolmogorov D	CV	P	Test Conclusion
Normal	0.0698	0.1196	0.6783	接受
Lognormal	0.1538	0.1196	0.0048	拒绝
Exponential	0.3346	0.1196	0.0000	拒绝
Weibull	0.0571	0.1196	0.7943	接受

图9 欺诈损失强度的韦伯分布拟合q-q图

（五）总损失分布

在得出新农合欺诈损失频率和欺诈损失强度的概率分布函数之后，可以求出总损失的概率分布函数。对于新农合欺诈损失的分布情况，本研究将使用蒙特卡洛模拟方法在Matlab软件上实现。

（六）蒙特卡洛模拟过程

由上文研究得知，新农合欺诈损失频率服从正态分布，欺诈损失强度服从韦伯分布，总损失的分布可在欺诈损失频率和损失强度的基础上，利用蒙特卡洛方法来模拟。过程如下：

（1）根据新农合欺诈损失频率的分布函数产生服从正态分布的随机数m1，将m1作为下一步迭代的次数；

（2）根据新农合欺诈损失金额对数值的分布函数产生服从韦伯分布的随机数m1个，将其对数值还原并加总，得到一年内的模拟欺诈损失总额；

（3）重复以上步骤10000次，得到10000个模拟欺诈损失金额。

（七）实证结果

从蒙特卡洛模拟的结果来看，欺诈损失金额最大值为1994万元，最小值为0，平均损失金额为864万元，其他相关值见表4。

表4 蒙特卡洛模拟欺诈损失描述 单位（万元）

	均值	最小值	最大值	标准差	中位数
N=10000	864.04	0.00	1994.00	379.62	863.72

除此之外，还可根据其分布情况得到欺诈风险损失的VaR值，进一步得出欺诈损失金额在不同置信水平下的大小（表5）。根据VaR模型定义，在一年之内，欺诈风险损失金额有一半的可能性不会超过862.72万元，有95%的可能性不会超过1502.34万元，有99%的可能性不会超过1749.46万元。据此，新农合基金管理部门可根据具体的情况确定预提的风险准备金。此外，其他的健康保险欺诈管理部门也可通过此方法预提欺诈风险准备金。

表5 不同置信水平下保险欺诈损失金额 单位（万元）

置信水平	1%	10%	50%	75%	90%	95%	99%
VaR值	0	373.04	862.72	1115.11	1367.42	1502.34	1749.46

四、结语

通过新农合欺诈度量的实证研究发现，每年因新农合欺诈而造成的损失金额巨大，社会各界必须采取必要的措施来遏制新农合欺诈行为的发生。要改革现有的医疗保险费用支付方式，由后付制向预付制、由按项目收费向总额预算制转变。要建立合理的医疗成本分担机制，设置合理起付线，设置最高支付额，设置合理的自负比例。要提升医疗服务质量水平，推进医药分离制度改革，解决目前存在的“以药养医”问题，抑制药品价格和医疗服务费用过度上涨。要加强保险的法制建设，严厉打击保险欺诈行为。要在全国范围内建立新农合信息库，弥补我国社保制度受制于地域的缺陷。要加大保险诚信宣传力度，推进保险诚信体系建设，通过公益讲座、宣传栏、宣传页等向公众传达正确的保险信息。此外，要构建完善的保险监管体系。

参考文献：

[1]全国保险业标准化技术委员会制定. 保险术语[S].北京: 中国财政经济出版社, 2007: 106.

[2]赵曼,吕国营. 社会医疗保险中的道德风险[M].北京: 中国劳动社会保障出版社, 2006.

[3]李亮,李连友. 基于成本-收益理论的社会医疗保险欺诈问题研究[D].湖南: 湖南大学, 2009.

[4]王珺,高峰,冷慧卿. 健康险市场道德风险的检验[J].管理世界,2010（6）:50-55.

[5][8]李连友,林源. 新型农村合作医疗保险欺诈风险度量实证分析[J].中国软科学,2011（9）:84-93.

[6]樊欣,杨晓光. 我国银行业操作风险的蒙特卡洛模拟估计[J].系统工程理论与实践, 2005（5）:12-19.

[7]刘睿,詹原瑞,刘家鹏. 基于贝叶斯MCMC的POT模型——低频高损的操作风险度量[J].管理科学,2007（3）:76-83.

[9]张宏毅,陆静. 运用损失分布法的计量商业银行操作风险[J].系统工程学报,2008（4）:411-416.

Abstract：The health insurance disrupts the order of the insurance industry infringes the legitimate rights and interests of the bona fide insured, threatening the healthy development of the insurance industry. The paper made a model for the fraud loss frequency and intensity respectively and fit out their optimal distribution function with a year as a cycle in a given confidence interval, based on the loss distribution method and VaR method, by using the 2006 to 2013 NCMS fraud loss data. Then it fit out the optimal distribution of the total loss of function based on these two distribution functions and calculate the accrued fraud risk boss reserves by using Monte Carlo simulation method. The empirical results show that NCMS fraud losses amount likely won't exceed 17.4946 million yuan with 99% chance, namely the NCMS fund need to withdraw 17.4946 million yuan for risk loss reserves every year under the confidence level of 99%.

Key words: insurance fraud; loss distribution approach; Monte Carlo simulation; measure

上一篇：我国实施强制医师责任保险可行性研究

下一篇：供给侧结构性改革背景下的保险业发展与监管趋势