洛阳师范学院数模B题(公开).doc
《洛阳师范学院数模B题(公开).doc》由会员分享,可在线阅读,更多相关《洛阳师范学院数模B题(公开).doc(27页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、2012“深圳杯”全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的参赛报名号为(如果赛区设
2、置报名号的话): 所属学校(请填写完整的全名): 洛阳师范学院 参赛队员 (打印并签名) :1. 段永芳 2. 马 喆 3. 谢春阳 指导教师或指导教师组负责人 (打印并签名): 数模指导组 日期: 2012 年 6 月 8 日赛区评阅编号(由赛区组委会评阅前进行编号):2012“深圳杯”全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):手机用户的精准识别摘要随着电信企业的发展,手机已成为人们日常生活中所不可或缺的必备品之一
3、,想要在激烈的竞争中快速发展,就需要对手机用户进行研究。对于本网手机用户,首先根据题目所给数据建立了本网手机用户数据库,从用户信息中筛选出9个指标作为细分变量,运用K-means聚类算法将本网手机个用户分为五类,分别为:上网族,业务族,短信族,一般消费族及参与优惠族,并对分类结果进行研究,得出了本网手机用户的行为特征。其次,结合运营商的商业背景和运行实际,综合了手机用户当前价值和手机用户潜在价值,提出了手机用户价值评价体系,建立了基于BP网络的手机用户价值评价模型。运用MATLAB神经网络工具箱进行处理,得到用户价值,根据其价值将其分为九类,其中价值最高的三类属于高端用户。其营销优先级根据其价
4、值高低而定,价值高的优先级高,反之则低。最后,随机从本网用户中抽取10人,运用所建模型计算出每个人的价值,根据其所在价值区间判别出其相应所在类别,进而识别出是否为高端用户并根据实际对结果进行了评估。对于异网手机用户,首先通过数据处理筛选出被叫人为异网的手机用户,对影响用户消费的主要因素通话量、短信量及联系人个数进行研究,提出一种基于小波神经网络的月均消费预测模型,给出具体的网络学习算法,并结合算法对异网手机用户的月均消费额进行估算,估算结果为43.28元。接着以主要影响因素为细分变量,运用K-means聚类算法将异网个用户进行细分,最终分为四类,并对分类结果进行分析,给出了异网手机用户的行为特
5、征。最后,基于异网高端用户的通话量、短信量及联系人个数建立了异网高端用户价值评价体系。经计算得出手机用户价值不低于31.28的均属于异网高端手机用户。其营销优先级根据其价值而定,价值高的优先级高,反之则低。本文随机从异网手机用户选出10个对其进行识别,同时对高端手机用户的判别标准进行评估。 对于手机号码的靓号分级问题,根据已有的网络资料数据,本文给出了靓号等级的判别准则及相应算法,并用自行搜集的手机号码验证了其合理性。关键词:精准识别;K-means聚类;BP神经网络;小波神经网络;价值评价体系一问题重述随着电信企业的发展,手机已成为人们日常生活中不可或缺的一部分。在本网和异网的手机用户中,高
6、端手机用户在消费力度,通话量、以及手机交往圈(与之有通信行为的所有手机用户构成其手机交往圈)大小等方面均远高于整体平均水平。高端用户往往更关注信号强度和通话质量,追求个性化服务。他们往往是企业的骨干、家庭的核心,对电信业务发展有着重要意义。根据附件数据完成以下任务:1.研究本网手机用户行为特征,给出本网高端手机用户的判别准则以及营销优先级。2.估算异网手机用户的月均消费金额,研究异网手机用户行为特征,并给出异网高端手机用户判别准则以及营销优先级。3.评估本网、异网高端手机用户的判别准则是否合理以及异网手机用户月均消费金额的估算是否准确,有哪些需要改进的地方,改进方法是什么,还需要什么信息。4.
7、自行收集手机号码,研究手机号码的靓号分级工作,给出分级标准并评估其合理性。二问题分析随着信息技术的发展,电信企业积累了用户海量的数据,这些海量数据中包含着大量的客户信息和消费数据,它们能够真实、客观地反映用户的活动。而这些活动中包含了许多重复的动作,也就是说,用户的行为是有规律可循的。如此,基于这些数据就可以对手机用户进行研究。对于本网及异网手机用户行为特征的研究,因为用户数过多,所以首先应将其分类,再对分类结果进行分析和研究,进而得出各类手机的用户行为特征。聚类分析恰能够将一批样本按照它们在性质上的亲疏程度,在没有先验知识的情况下自动进行分类,故本文采用了K-means聚类算法对手机用户进行
8、了细分。对于本网及异网高端用户的判别准则,也就是如何判别一个手机用户是高端用户,可以通过建立一个用户价值判别体系,根据其向营运商提供价值的多少,来判别用户的价值。通过对所给数据进行分析,可得出一个价值标准,高于这个标准的用户即是所需识别的高端手机用户。而营销优先级就根据其价值体现来定,手机用户价值越高,其营销优先级就越高,反之越低。对于异网手机用户月均消费额的估算,由于所给数据主叫方(包括短信和通话)均为本网手机用户,故应先从被叫方中将异网手机用户筛选出来,基于这些信息构建适合的模型来对其消费金额进行估算,小波神经网络预测模型较为合适,故据此建模得出最终结果。对于手机靓号的分级及评估其合理性,
9、可通过对各运营商靓号分级的调查,建立靓号分级的标准,根据分级标准运用MATLAB进行编程,并对搜集到的手机号码进行训练,验证其合理性。三模型假设(1)假设2月份新年过后这段时间用户的消费水平与平时无异;(1)假设异网手机用户月消费金额中只包含通话费及短信费;(2)假设异网手机用户计费标准为市话0.2元/分,被叫免费,短信0.1元/条,彩信0.5元/条。四符号说明:第个单元节点的输出的误差;:总误差;:节点的期望输出值;:节点实际输出值;:隐层上,输入第个样本时,第个节点的输出;:第个节点输入;:各层神经元之间的权重;:输入层到隐层的权值;:输出层上,输入第个样本时,第个节点的输出;:中间层到输
10、出层的权值;:单个的权值;:时刻的负梯度;:收敛误差界值;:一个小波;:小波的小波基函数;:网络连接权值;:输出层的输入;:隐含层的输出;:小波;:序列最小值;:序列最大值;:异网高端用户的总价值;:异网高端用户的通话总量;:异网高端用户的信息总量;:异网高端用户的联系人总量。五模型的建立与求解5.1 本网手机用户的研究本文通过对所给数据进行预处理后,选定客户的呼叫行为和消费行为属性作为细分变量,采用K-means聚类的算法将本网手机用户进行分类,并对分类结果进行研究。5.1.1数据的处理本文建模所采用的用户数据及通话记录数据都属于典型的关系型数据。其中起主要作用的是数值型数据及由此产生的统计
11、型数据。因数据量较大,在此,根据题目所给数据,建立统一的应用于数据挖掘的数据库。为使数据挖掘的效率更高,结果更合理,用于挖掘的数据应该更准确、简洁且易处理,故在建立挖掘模型前需要对数据进行一系列处理:1)数据的抽取,即将数据读入数据挖掘软件。2)数据的净化,即清除数据源中不正确、空值、不完整等不能达到数据挖掘质量要求的数据。由于题中所给数据源的客观数据质量基本达到要求,只有用户本身的身份证归属地、性别、城乡标识等信息较多,这些数据不参与聚类,所以对结果基本没有影响。3)衍生变量。有些变量用其它的形式表达更为直观,易于分析。如市话费、长途费、漫游费,可以分别用其占通话费的比例来表示;通话费、流量
12、费、短信费,可以分别用其占消费总额的比例来表示。4)定义细分变量。在应用聚类模型前,需要将细分变量即参与聚类的变量设定为输入变量。本文的细分变量为:通话费、市话费、长途费、漫游费、流量费、短信费、套餐档次、消费金额。5.1.2本网手机用户的行为特征的研究所谓手机用户行为特征是指描述手机用户使用商品情况的一系列指标,如市话和长途使用状况、上网功能的使用状况及短信使用状况等。本文采用K-means聚类算法,将具有相似行为特征的用户划分为若干个群,根据聚类结果,研究了本网手机用户的行为特征。聚类分析实质是一种建立分类的方法,它能够将一批样本按照它们在性质上的亲疏程度在没有先验知识的情况下自动进行分类
13、。这里,一个类就是一个具有相似性的个体的集合,不同类之间具有非相似性。聚类过程中,不必事先给出一个分类标准,聚类分析能够从用户数据出发,根据所采用的聚类方法产生分类标准,最终,按照相似性的大小使那些具有相同特征的客户组成客户群,同时使不同客户群中的客户差异性最大化,将具有相似行为特征的用户划分为若干个群。K-means算法是以平均值作为类的“中心”的一种分割聚类方法。假设有个对象,将其分为类。其中,分成的聚类个数,是采用K-means算法必须预先指定的参数。聚类的过程可以通过下述几个步骤来描述:1)首先随机地选择个对象,每个对象作为一个类的“中心”,分别代表将分成的个类;2)根据距离“中心”最
14、近原则,寻找与各对象最为相似的类,将其它对象分配到各个相应的类中;3)在完成对象的分配之后,针对每一个类计算所有对象的平均值,作为该类的新的“中心”;4)根据距离“中心”最近的原则,重新进行所有对象到各个相应类的分配;5)返回步骤3),直到没有变化为止。另外,聚类一般都要求预先估计聚类的个数。在实际应用中一般依据专家的经验结合比较分析加以指定,衡量标准也一般采用主观分析方法,考察聚类的结果是否能够解释。本文采用了SPSS Clementine提供的方法来确定聚类个数;在K-means模型中分别设定不同的聚类数目,应用SPSS软件得到3-10个类的表,并比较其各类F值(平均组间离差平方和除以平均
15、组内离差平方和)差异的大小(见表1),观察到聚4类与5类时所得F值的差异不太大,因此将聚类个数定为5,聚类结果见图1,最终聚类中心见表2。表1中属性1-8依次代表上文所提到的9个细分变量,分别为:通话费、长途费、市话费、漫游费、流量费、短信费、增值费、套餐档次、消费金额。表1 聚类个数为3-10类的F值比较F(3)F(4)F(5)F(6)F(7)F(8)F(9)F(10)属性1136.41184.44187.31143.23165.93149.82155.23159.03属性248.6751.2550.2817.6259.3442.7345.3149.73属性312364.9017654.83
16、17819.6412657.6516732.6316530.1115274.9215782.03属性41123.231234.721243.341258.041374.271372.281342.721218.20属性5132.80165.30177.16145.87149.28128.92162.22172.46属性665.3572.5973.0387.2383.3484.2977.2982.29属性718.0919.3120.6217.8717.3919.2318.2317.32属性8196.37108.79111.04139.35137.42127.29126.73102.33图1 聚类
17、结果表2 最终聚类中心最终聚类中心聚类12345通话费10.6359.801.9620.4138.29短信费2.535.8342.830.474.6流量费32.170.1753.790.2620.5消费金额43.3367.4798.5937.631398.72市话费7.7010.51.9626.8423.69长途费2.1338.604.511.79漫游费0.8010.700.22.8套餐档次109129129129199增值费10001329.33 根据聚类结果,我们对各类本网手机用户的行为进行了具体研究,如下所示:第一类用户,属于上网族。该类用户在月消费金额中,上网费达到总金额的85%以上,
18、而通话费、短信费所占份额都较少。并且在通话中,产生费用的大部分都是市话,用户等级均处于较低水平,年龄相对年轻化,套餐平均水平在119.5左右。第二类用户,属于业务族。该类用户在月消费金额中,通话费所占比重最大,在通话费中,长途费和漫游费所占比重相对较大。用户等级均处于较高水平,年龄在29-45之间,套餐平均水平在131.7左右。该类用户人数虽少,但其给供应商提供的价值却非常可观。第三类用户,属于短信族。该类用户在月消费金额中,上网费、通话费均处于较低水平,短信费所占份额较大。套餐水平在76.8左右。由于所给信息均是在二月份,正是春节过后之际,亲戚朋友通过短信方式慰问较多,所以其中有一部分客户在
19、平时的消费中,短信占用量可能并不大。第四类用户,属于一般消费族。该类用户在月消费金额中,通话费所占份额相对较大,上网费、短信费相较其它类别而言,处于平均水平,年龄各个阶段的都有,并且该类用户是人数最多的一类。第五类用户,属于参与优惠族。该类用户增值费较高,但是通话费、上网费、短信费均处在较低水平,套餐费也处于一般的平均水平,所以该类用户可能是参与话费赠机等运营商推出的话费优惠活动。5.1.3本网手机高端手机用户的识别及评估本文基于用户对运营商的价值贡献对本网的高端手机用户进行识别。首先,建立了用户价值评价体系;然后,基于评价体系建立了BP网络的手机用户价值评价模型,进而得出用户的价值,根据其价
20、值识别出高端用户及其营销优先级;最后,抽取数据对高端用户的判别准则进行实际评估。5.1.3.1 本网手机用户价值评价体系的构建手机用户价值感受的主体为运营商,即从运营商的角度来看手机用户的价值。手机用户的价值可以衡量手机用户对于营运商的重要程度,其价值体系的构建有利于运营商在长期盈利最大化的目的下,为手机用户提供更好的营销方案及问题解决方案。本文建立的手机用户价值评价体系,是结合运营商的商业背景及运行实际,综合了手机用户当前价值和手机用户潜在价值,提出了如表3所示的手机用户价值评价体系。该体系主要从手机用户当前价值和手机用户潜在价值两个方面来评价手机用户对运营商的贡献。其中,利润贡献指标和成本
21、占用指标可以综合评价手机用户的当前价值,而忠诚度和信用度可以显示出手机用户的未来短期价值,即为运营商创造利润的稳定性和可能性。表3 用户价值判别准则指标用户价值判别准则指标项当前价值利润贡献指标月消费支出套餐等级增值费未来短期价值忠诚度指标在网时长信用度指标欠费停机次数5.1.3.2基于BP网络的手机用户价值评价模型 BP网络是由Rumelhart,Hinton和Williams完整提出的,它是一种单向传播的多层前向网络,解决了多层网络中隐含单元连接权的学习问题。输入信号从输入节点依次传过各隐含层,然后传到输出节点,每一层节点的输出只影响下一层节点的输出。为了加快网络训练的收敛速度,可对输入矢
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 洛阳 师范学院 数模 公开
限制150内