大数据常见术语解释(2).docx

上传人:太** 文档编号:63207556 上传时间:2022-11-23 格式:DOCX 页数:3 大小:12.65KB
返回 下载 相关 举报
大数据常见术语解释(2).docx_第1页
第1页 / 共3页
大数据常见术语解释(2).docx_第2页
第2页 / 共3页
点击查看更多>>
资源描述

《大数据常见术语解释(2).docx》由会员分享,可在线阅读,更多相关《大数据常见术语解释(2).docx(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、大数据常见术语解释(2)胡经国24 仪表板(Dashboard)仪表板是指使用算法分析数据,并将结果用图表方式显示于仪表板中。25 数据聚合工具(Data Aggregation Tools)数据聚合工具是指将分散于众多数据源的数据转化成一个全新数据源的过 程。26、数据分析师(Data Analyst)数据分析师是指从事数据分析、建模、清理、处理的专业人员。27、数据库(Database)数据库是指一个以某种特定的技术来存储数据集合的仓库。28 数据库即服务(DatabaseasaService)数据库即服务是指部署在云端的即用即付数据库服务,例如亚马逊云服务 (AWS, Amazon We

2、b Services,直译:亚马逊网络服务)。29 数据库管理系统(Database Management System)数据库管理系统(DBMS)是指收集、存储数据,并提供数据访问的数据 库系统。30、数据中心(DataCentre)通常,数据中心是指全球协作的特定设备网络,用来在internet网络基础设 施上传递、加速、展示、计算、存储数据信息。维基百科给出的数据中心定义是:”数据中心是一整套复杂的设施。它不 仅仅包括计算机系统和其它与之配套的设备(例如数据中心通信和存储系 统),而且还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安 全装置”。31、数据清洗(Data Clea

3、nsing )数据清洗是指对数据进行重新审查和校验的过程,其目的在于删除重复信 息、纠正存在的错误,并提供数据一致性。32、数据管理员(Data Custodian )数据管理员是指负责维护数据存储所需技术环境的专业技术人员。33、数据道德准那么(Data Ethical Guidelines )数据道德准那么有助于组织机构使其数据透明化,保证数据的简洁、平安及 隐私。34 数据订阅(Data Feed)数据订阅是指一种数据流,例如Twitter订阅和RSSo35、数据集市(Data Marketplace)数据集市是指进行数据集买卖的在线交易场所。36、数据挖掘(Data Mining )数

4、据挖掘是指从数据集中开掘特定模式或信息的过程。37、数据建模(Data Modelling)数据建模是指使用数据建模技术来分析数据对象,以此洞悉数据的内在涵 义。38、数据集(Data Set)数据集是指大量数据的集合。39、数据虚拟化(Data Virtualization)数据虚拟化是指数据整合的过程,以此获得更多的数据信息。这个过程通 常会引入其他技术,例如数据库、应用程序、文件系统、网页技术、大数据技 术等等。40、去身份识别(Deidentification)去身份识别又称为匿名化(Anonymization),是指确保个人身份不会通过 数据被识别。41、判别分析(Discrimin

5、ant Analysis)判别分析是指将数据分类;按不同的分类方式,可将数据分配到不同的群 组、类别或者目录。它是一种统计分析法,可以对数据中某些群组或集群的已 知信息进行分析,并从中获取分类规那么。42 分布式文件系统(Distributed File System)分布式文件系统是指提供简化的、高可用的方式来存储、分析,处理数据 的系统。43、文件存贮数据库(Document Store Databases )文件存贮数据库又称为文档数据库(Document Oriented Database),是指为 了存储、管理和恢复文档数据而专门设计的数据库。这类文档数据又称为半结 构化数据。44、

6、探索性分析(Exploratory Analysis )探索性分析是指在没有标准的流程或方法的情况下从数据中开掘的模式, 是一种开掘数据和数据集主要特性的方法。45、E 字节(EB, ExaBytes)E字节(EB)约等于1000PB (PetaBytes),约等于10。万GB。如今全球 每天所制造的新信息量大约为lEBo46、提取一转换一加载(ETL, Extract,Transform and Load)提取一转换一加载是指一种用于数据库或者数据仓库的处理过程,即从各 种不同的数据源提取(E)数据,并转换(T)成能满足业务需要的数据,最后 将其加载(L)到数据库中。47 故障切换(Failover)故障切换是指当系统中某个服务器发生故障时,能自动地将运行任务切换 到另一个可用服务器或节点上。48、容错设计(Fault-Tolerant Design)容错设计是指一个支持容错设计的系统,应该能够做到当某一局部出现故 障也能继续运行。2016年6月5日编写于重庆

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁