《气泡水工程项目数据分析与挖掘(工程项目管理).docx》由会员分享,可在线阅读,更多相关《气泡水工程项目数据分析与挖掘(工程项目管理).docx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、泓域咨询/气泡水工程项目数据分析与挖掘气泡水工程项目数据分析与挖掘xx有限责任公司一、 数据分析与挖掘概述(一)信息分析信息分析是根据咨询问题的具体需要,对与之有关的信息进行整理、鉴别、评价、分析和综合,以便取得咨询所需新信息的过程。信息分析有如下几种用途:1跟踪。所谓跟踪,就是及时了解各领域新动向、新发展,从而发现问题、提出问题。2比较。比较各种事物的内部矛盾之后,把握事物间的联系,认识事物的本质,从而提出问题、确定目标、拟定方案并作出选择。3预测。利用已掌握的信息、知识和手段,推断事物的未来或未知方面。4评价。进行评价时应选择合适的变量和评价指标,应当考虑评价对象之间的可比性。信息分析所用
2、方法,可分为定性和定量分析两种。定性方法主要靠逻辑推理;而定量方法涉及数据间的数量关系,要建立数学模型,计算、求解。如今,信息越来越复杂,定性与定量分析已无法单独奏效,只能越来越多地结合起来。(二)数据分析数据分析是信息分析的一部分,数据分析是对收集数据进行系统的分析,建立适当的模型,揭示数据中隐含的技术、经济、社会和其他关系,以及发展趋势,为有关的咨询活动提交的有用的数字、信息或建议。数据分析的对象可分为时间序列和截面数据。如企业历年的咨询收入、利润总额等就是时间序列。截面数据是在同一时间的数据,如企业同一年咨询业务数目、营业额、费用、收入、人工耗费等。两种数据都要注意样本容量大小。对于截面
3、数据,常用线性或非线性回归模型体现数据之间的各种关系。数据分析属定量分析,包括数据统计分析、时间数据分析、空间数据分析。(三)数据挖掘数据挖掘就是从数据中挖掘出隐含、先前未知、有潜在用途,最终可为人理解的关系、模式、趋势和其他有用信息,并建立模型,用于预测、判断或决策,帮助企业更好地适应变化并做出更明智的决策的过程。数据挖掘广泛应用于制造、金融、零售、保健、中医药及电信等行业的客户关系管理、风险防范、供应链管理、竞争优势分析、部门分析等领域。数据挖掘要用到统计分析、人工智能、数据库和神经网络等方面的知识,如记忆推理、聚类分析、关联分析、决策树、神经网络、基因算法等。数据挖掘需要用户参与,并非某
4、种单一工具、技术或软件即可独自完成。另一方面,并非所有信息查询都可视为数据挖掘。例如,使用数据库管理系统查找个别记录,或用搜索引擎查找互联网特定的网页,属于信息检索,不能视为数据挖掘。当然,数据挖掘技术也有强大的信息检索能力。二、 大数据系统和数据挖掘技术(一)数据挖掘概述1大数据大数据是指超过既往数据库系统规模、传输速度和处理能力,或者既往数据库系统结构无法容纳的数据。大数据常以万亿或EB衡量,且种类多、实时性强,蕴藏的商业价值大。很多现有的新或旧的信息基础设施、工具和技术可用来开发和利用大数据中蕴藏的价值。大数据有各种各样的来源:传感器、气候信息、公开的信息、如杂志、报纸、文章、买卖记录、
5、网络日志、病历、事监控、视频和图像档案,及大型电子商务。大数据是数据挖掘产生与生存发展的土壤。如今数据每五年翻一番,面对前所未有的海量数据,为了从中发现有用的信息必须进行数据挖掘。此外,计算机存储、处理大量数据,以及运算的能力大为增强,为数据挖掘创造了条件,使其成为一门独特的学科和技术。2数据挖掘与数据分析的区别数据挖掘与数据分析的主要区别在于:(1)处理工作量。数据分析的数据量可能并不大,而数据挖掘的数据量极大。(2)制约条件。数据分析是从某些假设出发,建立方程或模型,而数据挖掘不作假设,可以自动建立方程。(3)处理对象。数据分析往往是针对数字型数据,而数据挖掘对象类型繁多,例如图像、声音、
6、文本等。(4)处理结果。数据分析可以解释结果的含义;数据挖掘的结果不易解释,着眼于预测未来,并提出决策建议。想要从数据中发现规律(即认知),往往需将数据分析和数据挖掘结合起来。(二)数据挖掘步骤按挖掘对象,数据挖掘分为数据库与数据仓库挖掘和网络挖掘两种,各自步骤分述如下。1数据库与数据仓库挖掘数据挖掘一般有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘、模式评估和知识表示8个步骤。(1)信息收集。从确定的挖掘对象中提取特征,然后选择合适的收集方法,将收集到的信息存入数据库。对于海量数据,必须选择合适的数据仓库。(2)数据集成。把来源、格式、特点、性质不同的数据按逻辑或物理属性加以编
7、排,以便以后使用。(3)数据规约。多数数据挖掘算法耗时很长,商业数据往往较多,数据挖掘更耗时间。数据规约就是简化已有可用数据集的表示,规约后数量大减,但仍能保持原数据的完整性,对规约数据的挖掘结果,与对规约前数据的挖掘结果相同或几乎相同。(4)数据清理。有些数据不完整(属性缺少属性值)、含噪声(属性值错误),不一致(同一信息有多种表示),需要清理,使其完整、正确、一致后存入数据仓库。(5)数据变换。将数据变换成适合数据挖掘的形式。实数型数据,可将其分层和离散化。(6)数据挖掘。根据数据格式、属性与特点,选择合适的处理工具,例如统计方法、事例推理、决策树、规则推理、模糊集,甚至神经网络,取得有用
8、的信息。(7)模式评估。由行业专家核实数据挖掘结果是否合理、是否可用。(8)知识表示。将数据挖掘得到的信息以可视方式交给用户,或作为新的知识存人知识库,供其他应用程序使用。并非所有的数据挖掘都要走上述的每一步。若只有一个数据源,则可以省略数据集成。数据规约、数据清理、数据变换合称数据预处理。数据挖掘至少60%的费用要花在信息收集阶段,而至少60%以上的精力和时间要花在数据预处理上。数据挖掘是一个反复多次的过程,若一次未满足要求或未得到有用结果,则需回到前面,经过调整后重新开始。2,网络挖掘网络挖掘可分为网络用户行为挖掘与网络信息挖掘。前者基本不在工程咨询人员关心之列。后者可理解为“从WWW中发
9、现和分析有用的信息”。网络信息挖掘是在已知数据样本的基础上,通过归纳学习、机器学习、统计分析等发现挖掘对象间的内在关系与特性,进而在网络中提取用户感兴趣的信息,获得更高层次的知识和规律。网络信息挖掘沿用了Robot,全文检索、人工智能的模式识别、神经网络等技术。现在的搜索引擎使用了这些技术,能够在网页或网站数据库中为用户搜寻有用信息。网络信息挖掘具体步骤如下:(1)确立目标样本。由用户选择目标文本,提取特征信息。(2)提取特征信息。根据目标样本的词频分布,从统计词典中提取挖掘目标的特征向量并计算出相应的权值。(3)网络信息获取。先利用搜索引擎站点选择待采集站点,再利用Robot程序采集静态We
10、b页面,最后获取被访问站点网络数据库中的动态信息,生成WWW资源索引库。(4)信息特征匹配。提取索引库中的源信息特征向量,并与目标样本的特征向量对照,将符合要求的信息交给用户。三、 项目名称及建设性质(一)项目名称气泡水工程项目(二)项目建设性质本项目属于技术改造项目四、 项目承办单位(一)项目承办单位名称xx有限责任公司(二)项目联系人万xx(三)项目建设单位概况公司依据公司法等法律法规、规范性文件及公司章程的有关规定,制定并由股东大会审议通过了董事会议事规则,董事会议事规则对董事会的职权、召集、提案、出席、议事、表决、决议及会议记录等进行了规范。 经过多年的发展,公司拥有雄厚的技术实力,丰
11、富的生产经营管理经验和可靠的产品质量保证体系,综合实力进一步增强。公司将继续提升供应链构建与管理、新技术新工艺新材料应用研发。集团成立至今,始终坚持以人为本、质量第一、自主创新、持续改进,以技术领先求发展的方针。当前,国内外经济发展形势依然错综复杂。从国际看,世界经济深度调整、复苏乏力,外部环境的不稳定不确定因素增加,中小企业外贸形势依然严峻,出口增长放缓。从国内看,发展阶段的转变使经济发展进入新常态,经济增速从高速增长转向中高速增长,经济增长方式从规模速度型粗放增长转向质量效率型集约增长,经济增长动力从物质要素投入为主转向创新驱动为主。新常态对经济发展带来新挑战,企业遇到的困难和问题尤为突出
12、。面对国际国内经济发展新环境,公司依然面临着较大的经营压力,资本、土地等要素成本持续维持高位。公司发展面临挑战的同时,也面临着重大机遇。随着改革的深化,新型工业化、城镇化、信息化、农业现代化的推进,以及“大众创业、万众创新”、中国制造2025、“互联网+”、“一带一路”等重大战略举措的加速实施,企业发展基本面向好的势头更加巩固。公司将把握国内外发展形势,利用好国际国内两个市场、两种资源,抓住发展机遇,转变发展方式,提高发展质量,依靠创业创新开辟发展新路径,赢得发展主动权,实现发展新突破。公司以负责任的方式为消费者提供符合法律规定与标准要求的产品。在提供产品的过程中,综合考虑其对消费者的影响,确
13、保产品安全。积极与消费者沟通,向消费者公开产品安全风险评估结果,努力维护消费者合法权益。公司加大科技创新力度,持续推进产品升级,为行业提供先进适用的解决方案,为社会提供安全、可靠、优质的产品和服务。五、 项目实施的可行性(一)长期的技术积累为项目的实施奠定了坚实基础目前,公司已具备产品大批量生产的技术条件,并已获得了下游客户的普遍认可,为项目的实施奠定了坚实的基础。(二)国家政策支持国内产业的发展近年来,我国政府出台了一系列政策鼓励、规范产业发展。在国家政策的助推下,本产业已成为我国具有国际竞争优势的战略性新兴产业,伴随着提质增效等长效机制政策的引导,本产业将进入持续健康发展的快车道,项目产品
14、亦随之快速升级发展。六、 项目建设选址本期项目选址位于xx(以选址意见书为准),占地面积约94.00亩。项目拟定建设区域地理位置优越,交通便利,规划电力、给排水、通讯等公用设施条件完备,非常适宜本期项目建设。七、 建筑物建设规模本期项目建筑面积110994.74,其中:主体工程72810.03,仓储工程18561.47,行政办公及生活服务设施15371.91,公共工程4251.33。八、 项目总投资及资金构成(一)项目总投资构成分析本期项目总投资包括建设投资、建设期利息和流动资金。根据谨慎财务估算,项目总投资34393.21万元,其中:建设投资28132.41万元,占项目总投资的81.80%;
15、建设期利息316.54万元,占项目总投资的0.92%;流动资金5944.26万元,占项目总投资的17.28%。(二)建设投资构成本期项目建设投资28132.41万元,包括工程费用、工程建设其他费用和预备费,其中:工程费用23963.29万元,工程建设其他费用3500.81万元,预备费668.31万元。九、 资金筹措方案本期项目总投资34393.21万元,其中申请银行长期贷款12920.13万元,其余部分由企业自筹。十、 项目预期经济效益规划目标(一)经济效益目标值(正常经营年份)1、营业收入(SP):58100.00万元。2、综合总成本费用(TC):47522.69万元。3、净利润(NP):7
16、726.67万元。(二)经济效益评价目标1、全部投资回收期(Pt):6.24年。2、财务内部收益率:15.80%。3、财务净现值:5610.76万元。十一、 项目建设进度规划本期项目按照国家基本建设程序的有关法规和实施指南要求进行建设,本期项目建设期限规划12个月。十四、项目综合评价主要经济指标一览表序号项目单位指标备注1占地面积62667.00约94.00亩1.1总建筑面积110994.74容积率1.771.2基底面积40106.88建筑系数64.00%1.3投资强度万元/亩280.202总投资万元34393.212.1建设投资万元28132.412.1.1工程费用万元23963.292.1
17、.2工程建设其他费用万元3500.812.1.3预备费万元668.312.2建设期利息万元316.542.3流动资金万元5944.263资金筹措万元34393.213.1自筹资金万元21473.083.2银行贷款万元12920.134营业收入万元58100.00正常运营年份5总成本费用万元47522.696利润总额万元10302.237净利润万元7726.678所得税万元2575.569增值税万元2292.2710税金及附加万元275.0811纳税总额万元5142.9112工业增加值万元18377.0913盈亏平衡点万元22162.81产值14回收期年6.24含建设期12个月15财务内部收益率
18、15.80%所得税后16财务净现值万元5610.76所得税后十二、 层次分析法的基本步骤当一个决策者在对问题进行分析时,首先要将分析对象的因素建立起彼此相关因素的层次系统结构,这种层次结构可以清晰地反映出相关因素(目标、准则、对象)的彼此关系,使得决策者能够把复杂的问题顺理成章,然后进行逐一比较、判断,从中选出最优的方案。运用层次分析法大体上分成四个步骤:建立层次结构模型;构造比较判别矩阵;单准则下层次排序及其一致性检验;层次总排序及其一致性检验。(一)建立层次结构模型层次分析法先将决策的目标、考虑的因素(评价准则)和决策对象(行动方案)按它们之间的相互关系分为最高层、中间层和最低层,其中最高
19、层称为目标层,这一层中只有一个元素,就是该问题要达到的目标或理想的结果;中间层为准则层,层中的元素为实现目标所采用的措施、政策、准则等,准则层中可以不止一层,可以根据问题规模的大小和复杂程度,分为准则层、子准则层;最低层为方案层,这一层包括了实现目标可供选择的方案。据此绘出层次结构模型图,模型中,目标、评价准则和行动方案处于不同的层次,彼此之间关系用线段表示,评价准则可细分多层。在层次结构模型中,各层均由若干因素构成,当某个层次包含因素较多时,可将该层次进一步划分成若干子层次。通常应使各层次中的各因素支配的元素一般不超过9个,这是因为支配元素过多会给两两比较带来困难。一个好的层次结构模型对解决
20、问题极为重要,因此,在构建层次结构模型时,应注意以下四点:1自上至下顺序地存在支配关系,用直线段表示上一层次因素与下一层次因素之间的关系,同一层次及不相邻元素之间不存在支配关系;2整个结构不受层次限制;3最高层只有一个元素,每个元素所支配元素一般不超过9个,元素过多可进一步分层;4对某些具有子层次结构可引入虚元素,使之成为典型层次结构模型。(二)构造比较判别矩阵层次结构建立后,评价者根据自己的知识、经验和判断,从第一个准则层开始向下,逐步确定各层不同因素相对于上一层因素的重要性权数。层次分析法在确定各层不同因素相对于上一层各因素的重要性权数时,通常使用两两比较的方法。(三)单准则下层次排序及其
21、一致性检验层次分析法的信息基础是比较判断矩阵。由于每个准则都支配下一层若干个因素,这样对于每一个准则及它所支配的因素都可以得到一个比较判断矩阵。因此,根据比较判断矩阵如何求出各因素对于准则的相对排序权重的过程称为单准则下的排序。计算权重的方法有多种,其中和法和根法是比较成熟并得到广泛应用的方法。1和法2根法3判断矩阵一致性检验由于客观事物的复杂性,会使我们的判断带有主观性和片面性,完全要求每次比较判断的思维标准一致是不大可能的。事实上,在构建比较判断矩阵时,我们虽然不要求判断具有一致性,但一个混乱的,经不起推敲的比较判断矩阵有可能导致决策的失误,所以我们希望在判断时应大体上的致。而上述计算权重
22、方法,当判断矩阵过于偏离一致性时,其可靠程度也就值得怀疑了,故对于每一层次作单准则排序时,均需要作一致性的检验。(四)层次总排序及其一致性检验1层次总排序计算同一层次中所有元素对于最高层(总目标)的相对重要性标度(又称排序权重向量)称为层次总排序。2总排序一致性检验人们在对各层元素作比较时,尽管每一层中所用的比较尺度基本一致,但各层之间仍可能有所差异,而这种差异将随着层次总排序的逐渐计算而累加起来,因此需要从模型的总体上来检验这种差异尺度的累积是否显著,检验的过程称为层次总排序的一致性检验。十三、 项目背景分析所谓气泡水是在压力下注入二氧化碳气体的饮用水,随着饮料的健康化趋势逐渐明显,高糖分的
23、传统碳酸饮料增长乏力,相应的,以气泡水为基础,各大品牌从产品设计的角度在产品口味上进行不断升级创新,气泡水正在逐渐成为碳酸饮料市场的支柱产品。数据显示2013年-2019年我国碳酸饮料首次出现增长乏力,年均增长速度仅为2%,预计2020年碳酸饮料零售市场规模约为900亿元,在新式茶饮及茶饮料等产品的冲击下,国内碳酸饮料行业面临转型难题。但是在绝对规模上碳酸饮料依然是国内饮料行业的重要组成部分,数据显示2020年我国各类饮料总产量16347万吨,而碳酸饮料产量达到1971.3万吨,占比超过10%。事实上自2017年饮料产量出现下滑以后以碳酸饮料为代表的传统饮料市场就面临需求不振的情况。而气泡水的
24、出现反映出饮料市场年轻一代中形成一种不可逆的新潮流,各类竞争者迅速涌入,不仅可口可乐、娃哈哈、农夫山泉等大牌纷纷入局,喜茶等众多新兴饮料品牌也从“无糖”的健康理念,切入该市场。而像娃哈哈、青岛啤酒、中沃、秋林等企业都相继推出苏打气泡水新品。而从市场分类来看,气泡水当中气的来源有两种,一种是来自天然,一种是人工加气,通过二氧化碳池压入水中。例如天然气泡矿泉水因为源自天然,一个品牌应该只有一个水源/气源,所以价格贵些,这时就有了相对便宜的替代品,也就是普通水中冲入二氧化碳形成的气泡水,而目前市场上消费者认识程度更多的则主要是苏打气泡水。相比于传统碳酸饮料而言,目前市场上主要的气泡水饮料都宣传自己“
25、无糖”或者“低糖”,特别是对注重控制体重的女性而言,这种低糖分且带有创新混搭口味的饮料符合当下年轻人追求新奇的口味偏好。以元气森林为代表的气泡水饮料以多口味、无负担、弱风味、重触感的定位填补起高糖分重口感的碳酸饮料与瓶装水之间的空白,成为模糊二者边界的新式饮品代表之一。目前国内的气泡水消费依然处于起步阶段,气泡水基本是传统碳酸饮料的价格的两倍。但是目前业内创新产品层出不穷,快速推新驱动市场持续扩容,数据显示2015-2020年我国气泡水销售规模从24.6亿元增长至58.1亿元,其中主要是线上市场贡献最多。在售的气泡水产品往往搭配桃子、荔枝、橙子、葡萄等清甜水果,吸引着年轻消费者不断进行新口味尝
26、试与品牌复购。同时市场创新口味层出不穷,比如酸梅汤、乳酸菌、海盐等,新品的滚动迭代也不断为市场增加活力,驱动市场持续扩容。而在市场竞争程度方面,近两年元气森林在饮品行业以一己之力成功破圈并不断创新口味,行业领跑优势较为显著。而气泡水会从以往的小众、高端品类晋级为快速增长的大众品类,成为饮料公司扩张市场和提升利润率的新引擎。未来集中度有望经历整合-分散-整合周期。气泡水饮料行业有望经历由多品牌入局带来的初期分散,而后具备持续创新力、渠道覆盖力和品牌打造力的企业有望进一步整合市场,长期市场集中度有望介于碳酸饮料与包装饮用水之间,二线品牌当中喜茶已经逐步脱颖而出成为第二大气泡水销售品牌。目前大多数气
27、泡水宣传产品“无糖”的秘密就是采用了代糖类产品,其中被气泡水产品应用最多的代糖类产品就是赤藓糖醇和三氯蔗糖,其中赤藓糖醇甜度约为蔗糖的60%-70%左右,在水中溶解时有很强的制冷作用,食用时口感凉爽,因此非常适合被用于添加在饮料当中。但是对于绝大多数代糖类甜味剂而言,最大的问题是难以被人体吸收。尽管有研究证明摄入的赤藓糖醇90%经过尿液排出,剩下的10%经过肠道但肠道的菌群也不能代谢赤藓糖醇,所以不会搞乱肠道菌群平衡,暂时是最安全的甜味剂。但是对于三氯蔗糖而言会影响血糖和胰岛素分泌,对健康造成影响。随着元气森林产品被越来越多的人质疑其“无糖”宣传的真实性,未来气泡水饮料产品的健康属性能否保持依然是个未知数。