一、研究的理论框架
理论上讲,保险产品作为一种商品,和其他商品一样,价格在本质上是由市场的供求关系决定的。它的特殊性仅仅体现在它不是在对有形的产品而是要对无形的“风险”定价。这里可以把风险理解为理赔或损失随机变量。因此,研究的理论框架首先从对风险的认识谈起,引入损失分布,以及确定损失分布的方法。另一方面,当风险被理解为损失随机变量时,保险定价在形式上就是要建立一种(价格)尺度,使得可以用一种确定的量(保费)去衡量一个不确定的损失,由此引出了关于森林火灾保险的保费精算原理的讨论,即如何通过从合理决策的角度出发来确定保险定价方式。
(一)损失分布函数
1.风险的含义。
人们习惯用“风险”这个词来表达各种可能发生的灾害和不利事件,认可我们确实生活在一个充满风险的自然环境和社会环境之中。保险学中,风险通常被定义为“潜在损失的概率”或“不确定后果之间的差异程度”等。在决策学理论中,风险和与之相关的当事人(决策者)及其所面临的某个决策问题联系在一起,比如,某地某幢大楼是否发生火灾只对和该厂有相关关系的人有风险,而对于其他人来说则不构成风险。因此,风险是对于那些面临着某种不确定状态的某个人或某些人而言的。风险与三个因素直接相关:自然状态的不确定性、人的主观行为以及两者结合所蕴涵的潜在后果。在讨论风险以及对它进行度量时,可以从不同的角度特别地强调某个因素。
(1)从当事人(决策者)的角度出发讨论潜在后果有其所对应的不确定性,而且往往是关心不利的潜在后果。这时候的风险概念正是保险学中的风险,承保人要评估某一项工程项目的大小,首先需要分辨清楚究竟可能出现哪些不利后果?它们相对而言于当事人的严重程度如何?以及发生这些不利后果的可能性究竟有多大?即风险由不利后果的严重程度及其对应的概率所构成。图中的横轴表示不利后果相对于当事人的严重程度,即损失大小;纵轴表示其对应的概率,象限区域中点的位置就刻画了风险的分布情况,损失程度大而且发生的概率也大则属高风险,反之则属低风险。
(2)从某个决策问题出发,讨论一个决策者面对某种风险的反应或态度,常称之为风险态度(RiskAttitude),或者比较一群人各自的风险态度之间的差异程度。因为不同人对于同一潜在后果会有不同反应,其承受能力不同,价值判断也不同,有人属于“冒险型”,有人属于“保险型”。决策者对风险的态度和反应直接影响到他的决策行为。从保险学的角度讲,了解保险消费者的风险态度无疑是保险人设计保险产品和确定产品价格的重要依据。因此,度量和比较决策者对风险的态度是风险研究的重要组成部分。
(3)参照某个决策者的问题和目标来讨论每项备选方案的风险大小。例如,保险公司在研究其投资组合策略时,每项组合的风险大小是决定该组合优劣的关键指标之一;又如,要考虑两个或多个承保项目时,也需要评估这些备选标的各自的风险大小。因此,研究对策略风险的大小进行度量以及对决策分析的影响一直是投资分析和管理决策学的核心内容。
2.损失分布的定义。赔付(理赔)与损失是两个不同但又密切相关的概念,损失通常指承保标的可能发生的实际损失大小,而赔付则指保险人按承保合同规定的保险责任所支付的实际费用,赔付应小于或等于实际损失。损失和赔付都是不确定并可以用货币来衡量的,因此常用一个随机变量来描述(考虑时间因素时,可动态地用一个随机过程来描述),可称之赔付分布和损失分布。从概率统计中知道,对于一个随机变量,都必然有其相应的分布函数,并将其称为赔付分布函数和损失分布函数。
3.损失分布的数学工具。
4.确定损失分布函数的基本步骤。
(1)数据的初步整理及经验分布的拟合。对经验数据的统计分析一般是从构造样本的直方图和拟合经验分布函数开始的,它们都是对样本的基本特征的最直观描述。对于离散和连续两类随机变量,直方图和经验分布的函数的构造方法稍有不同,从分布函数的角度看,离散型随机变量只需要考虑随机变量的可数个取值点的情况,而连续型随机变量则要考虑随机变量取值范围内的所有点。下面以连续型随机变量为例进行说明。
设某损失数据的观测样本为:x1,x2,…,xn,考虑x轴的k+1个分割点,0≤c0<;<c1<…<ck,且有0≤c0<min(xi)和ck≥max(xi),分割点cj(j=0,1,2,…,k)不一定是等距离的且不与任何xi(i=1,2,…,n)重合。
若用fn(cj)表示样本x1,x2,…,xn落入区间(cj-1,cj]的个数,j=1,2,…,k。则可以按照如下的方法定义样本的频率直方图和经验分布函数Fn(x)。
基于分割点0≤c0<;<c1<…<ck的经验分布函数如式(11-4)所示。显然,式(11-4)定义的经验分布函数是间断不连续的,若希望对其进行光滑处理,则必须使连接以下各点:[c0,Fn(c0)],[c1,Fn(c1)],…,[ck,Fn(ck)]的折线可以较光滑地拟合经验分布函数Fn(x)。
经验分布光滑曲线较经验分布函数更为直观,可以大致看出该样本可能属于的分布函数族。
由频率直方图可以获得一条频率折线,频率直方图和频率折线都是密度函数的近似,通过光滑过程就能得到频率密度函数曲线和相应的累计频率分布曲线。
此外,由于在非寿险中常考虑巨灾损失引起的准备金提留和再保险安排等问题,损失分布的尾部常常受到特别关注,且这也是森林火灾中非常重要的问题。
(2)分布的选择及参数估计。在保险精算中常用的损失分布通常具有不对称、定义域非负并且尾部较厚的特点。一般选用双参数模型。选择分布模型时可将观察数据的直方图与理论概率分布相比较,得到适当的初始选择。
有了初步的分布选择之后,采用相应估计法估计相应参数。统计学主要的两类参数估计为:矩估计(Method of Moments)和极大似然估计(Maximum Likelihood)。此外,还有一类被称为分位点估计法也是比较常用的。
(3)拟合分布的检验。实际上,对于一组给定的数据,可以有许多的分布族被选择进行分布拟合(参数估计),因此,非常有必要检验对损失分布的拟合是否恰当,常用统计检验方法是检验。
(二)损失分布函数的拟合方法
获得一个随机变量的概率分布通常有数理统计方法、贝叶斯方法和随机模拟方法。数理统计方法又称为频率学派方法,它主要是依靠样本信息来估计未知参数,从而获得概率分布。经验分布就是一种数理统计法,它主要是依靠样本信息的一种方法。在理论上,比如非寿险中经常开拓各种新业务,对新险种的损失分布往往没有提供样本信息,这时就可以采用Bayes方法与随机模拟法等。以下再分别就这三个方法作简要介绍。
1.数理统计方法。用数理统计方法获得损失变量的概率分布通常按以下步骤进行:
(1)充分利用所获得的历史记录作为线索,获得损失分布的大体轮廓,比如从一组损失数据中先确定最大损失、最小损失、中位数、平均值、众数、分位点等特殊值来画出损失分布的大致形状。
(2)从各种已知的理论概率分布中选择一种分布类型作为所寻求的概率分布,比如选择伽玛分布、韦伯分布等。
(3)估计所选择分布类型中所包含的参数,从而确定损失分布;可以用数理统计学中的矩方法、极大似然法以及分位点法等。
(4)步骤(1)是统计学中处理观察数据的基本方法;步骤(2)中所采用的理论分布可能不是概率统计教材中常见的分布,非寿险精算中还需要采用一些特殊的分布类型,如负二项分布,帕累托分布等;步骤(3)中提及的参数估计方法在数理统计课程中有系统介绍。
除了用上述基本步骤外,有几点需要特别强调:
①获得了损失分布的估计以后,通常还要利用观察数据对步骤(3)中得到的概率分布进行统计检验,以确信所选择的分布类型和参数估计是否恰当。比如,可以采用数理统计学中的检验。
②对损失分布的估计应考虑获得损失分布的具体精算目的,在不同的精算目的下对损失分布估计的精度不一样,代价也就不一样。比如,如果是为了制定费率,则对损失分布的中间即主要部分的分布情况要求较高;如果是为了考虑自留额,则对损失分布的尾部要作更细致的估计。
③此外,损失分布可能既不是离散型分布也不是连续型分布而是一个混合型的概率分布,这种情况下的分布拟合更为复杂。
2.Bayes方法。在保险实务中,尤其是在非寿险中,往往难以获得足够的样本信息,或者因为仅有的理赔记录不符合对统计样本的理论要求。这时,对损失分布的估计就需要掺入评估人的主观判断,并利用新获得的分布来修正原来的估计。这就是估计损失概率分布的贝叶斯原理。
统计推断通常可以利用三种信息:总体信息、样本信息和先验信息。仅仅使用前两种信息的统计学派称为经典统计,三种信息都使用的是贝叶斯统计。
贝叶斯统计方法起源于英国学者贝叶斯(Bayes,T.R.1702-1761)的一篇论文《论有关机遇问题的求解》。贝叶斯在该文中提出了着名的贝叶斯公式和一种归纳推理的方法。此后,数学家拉普拉斯用贝叶斯的方法导出了重要的相继律。随后,贝叶斯方法逐渐得到人们的广泛重视。伴随着近代概率论的发展,贝叶斯方法从20世纪30年代逐渐发展成为一个有影响的统计学派,在工业、经济、管理等领域中得到了广泛应用。在非寿险精算中,贝叶斯方法主要用于估计损失分布、调整费率、校正保费等问题。
设损失变量X的分布类型为,在连续情形下相应的密度函数族为,估计参数的贝叶斯方法与经典的数理统计方法的一个基本区别就是把参数看做随机变量而不是普通变量,因而可以记作黑体的,这样本身应有一个概率分布。在此假定下,参数估计的贝叶斯方法可概括为以下步骤:
步骤1:选择先验分布。设的分布函数和密度函数分别为和,称为先验分布和先验密度,它反映了评估者对参数的情况有一个初步的看法或者信念。这种信念可能建立在研究者过去关于的经验认识之上,也可以看成是一种纯主观的判断。
步骤2:确定似然函数。
步骤3:确定参数的后验分布。
步骤4:选择损失函数。选择一个函数,比如平方函数来刻画参数的真实值与估计值之间差距的严重程度,习惯上称该函数为“损失函数”。但它的含义不是指赔付损失,它在本质上是评估人的“效用函数”。
步骤5:估计参数。根据所选择的损失函数和参数的后验分布,通过求损失函数的期望值的最小值的解作为参数的贝叶斯估计值。
与数理统计方法相比,贝叶斯方法明确地认可研究者的主观判断。如果把参数估计的贝叶斯方法分成两个阶段,第一个阶段是根据所选择的先验概率并利用新的观察信息求出后验概率,第二个阶段是根据所选择的损失函数并利用求最小平均损失来求未知参数的贝叶斯估计。第一阶段的主观性体现在对先验分布的选择上,第二阶段的主观性则体现在对损失函数的选择上。
未知参数估计值记作,由于建立在后验分布的基础之上,因而与先验分布有关且是观察值的函数。如何确定这个函数呢?数理统计中的矩方法通过令样本矩等于总体矩来确定,这里确实也隐含着某种主观性。而贝叶斯估计方法则是明确地承认确定估计量过程中的主观性,这种主观性表现为未知参数的估计值与真实值之间的误差对研究者来说究竟有多严重,或理解为会造成多大的损失,而这只能由研究者自己来判断。
3.随机模拟法。客观世界的某些现象之间存在着某种相似性,因而可以从一种现象出发研究另一种现象。比如在分析一个系统时,可先构造一个与该系统相似的模型,通过在模型上进行试验来研究原系统,这就是模拟。随机系统可以用概率模型来描述并进行试验,称为随机模拟法,又称为蒙特卡罗(MonteCarlo)方法或统计试验法。
模拟在非寿险精算中的用途非常广泛,即可以用于确定性问题,又可用于随机问题。当某一问题用传统的方法处理有较大难度或计算过于繁杂时,就可以采取模拟方法。例如在分析保险资产与负债比策略、聚合理赔风险等问题时,都可用到模拟方法。一般来说,在以下几种情况下,模拟方法将发挥其独特的作用:
(1)在费用和时间上均难以对风险系统进行大量实测;
(2)由于实际风险系统的损失后果严重而不能进行实测;
(3)难以对复杂的风险系统构造精确的解析模型;
(4)用解析模型不易求解;
(5)为了对解析模型进行验证。
模拟的基本步骤是:(1)建立恰当模型;(2)设计实验方法;(3)从一个或多个概率分布中重复生成随机数;(4)分析结果。