《16个用于数据科学和机器学习的顶级平台.docx》由会员分享,可在线阅读,更多相关《16个用于数据科学和机器学习的顶级平台.docx(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、16个用于数据科学和机器学习的顶级平台调研机构Gartner公司将数据科学和机器学习平台定义 为“具有凝聚力的软件应用程序,它提供了创立多种数据科 学解决方案以及将这些解决方案合并到业务流程、周围根底 设施和产品中所需的基本构建块的混合体J这样的平台支持数据科学家在整个数据和分析管道中 执行任务。这些任务包括与数据访问和接收、数据准备、交 互式探索和可视化、功能工程、高级建模、测试、培训、部 署和性能工程相关的任务。考虑到这一点,Gartner公司发 布了一份魔力象限报告,其中介绍了数据科学和机器学习这 一领域的16个领先厂商和平台。领导者Gartner公司分析师写道:“魔力象限中的领导者在数
2、据 科学和机器学习市场中拥有强大的影响力和重要的知识分 享能力。他们在整个探索、模型开发和实施过程中展示了深 度和广度的优势。在提供出色服务和支持的同时,领导者也 能灵活应对瞬息万变的市场环境。熟练使用领导者平台的数 据科学家专业人员数量巨大并且不断增长。领导者在影响市 场增长和方向方面处于有利的地位。它们涉及所有行业、地 理位置、数据域和用例,因此,对该市场有着扎实的理解和 战略。他们不仅能够根据当前的市场条件,专注于有效地执 行,而且他们还拥有坚实和强大的路线图,以利用这一快速 转型行业的新开展和先进技术。他们提供思想领导和创新差 异化,经常在实施过程中颠覆市场。”SAP总部位于德国瓦尔多
3、夫。Gartner公司分析师表示, “SAP公司再次将其平台重新命名为:SAP Business Objects Predictive Analyticso该平台具有许多组件,例如用于数 据集准备和特征工程的Data Manager,用于公民数据科学家 的Automated Modeler,用于更复杂机器学习的Predictive Composer 以及用 于操作的 Predictive Factory。 SAP Leonardo机器学习和SAP Leonardo生态系统的其他组件对 SAP在此魔力象限中的执行能力没有奉献。在过去的一年中, SAP公司在几个方面取得了很好的进展,但在其他方面仍
4、然 落后。它是一个利基企业,因为相对于其他公司来说,其客 户满意度低,缺乏思想共享J(4) Teradata 公 司Teradata公司总部位于加利福尼亚州圣地亚哥。 Gartner公司分析师表示,“Teradata公司统一数据架构(UDA) 是一个企业分析生态系统,它结合了开源和商业技术,提供 分析功能。UDA 包括 Aster Analytics、Teradata 数据库、 Hadoop和数据管理工具。尽管Teradata公司具有强大的运 营能力,但它仍然缺乏统一的端到端技术平台。Teradata公 司保持了其内在的性能和可靠性优势,但其在数据科学开发 方面缺乏凝聚力和易用性,削弱了其执行
5、能力和在视觉完整 性方面取得的进展。它仍然是一个利基企业J(1)Alteryx 公司Alteryx公司总部位于加利福尼亚州欧文市。Gartner 公司分析师表示,“Alteryx公司提供统一的机器学习平台 Alteryx Analytics,使公民数据科学家能够在单一工作流 程中构建模型。20*年中期,Alteryx公司收购了专注于模 型部署和管理的数据科学供给商Yhat公司。Alteryx公司于 20*年初在纽约证券交易所发行公开募股(IP0),加强了其 投资扩展和增强其平台的能力。Alteryx公司已经从挑战者 象限开展到领导者象限。这得益于强大的执行力(在收入增 长和客户获取方面),其具
6、有令人印象深刻的客户满意度, 以及专注于帮助组织灌输数据和分析文化J(2)H20. ai 公司H20. ai公司总部位于加州山景城。Gartner公司分析师 表示,“H20.ai公司提供了一个开源的机器学习平台,对于 这个魔力象限,我们评估了核心组件H20 Flow, H20 Steam; 用于Spark集成H20 Sparkling Water;以及提供深度学习能 力的H20 Deep Water H20. ai已从先前魔力象限的梦想者 开展为领导者。它通过重大的商业扩张继续取得进展,并牢 固了其作为思想领袖和创新者的地位J(3) KNIME 公司KNIME公司总部位于瑞士苏黎世。Gartn
7、er公司表示, “KNIME公司提供开源的KNIME分析平台,全球有超过 100,000人使用。KNIME提供商业支持和商业扩展,以促进 企业部署的协作、平安性和性能。在过去的一年中,KNIME 公司为AWS和Microsoft Azure引入了其云平台版本,更加 注重数据质量,扩展了其深度学习功能,并将其局部商业功 能转换为开源。KNIME正在加速其产品开发和客户获取工作。 KNIME的平台被大多数行业和世界上大多数地区使用。该供 给商展示了对市场的深刻理解,强大的产品战略和所有用例 的优势。这些属性共同牢固了其作为领导者的地位JRapidMiner 公司RapidMiner公司总部位于马萨
8、诸塞州波士顿。Gartner 公司分析师表示,“RapidMiner公司的平台包括RapidMiner Studio 、 RapidMiner Server 和 RapidMiner Radoop o RapidMiner Studio是模型开发工具,提供免费版和商业版; 它的价格取决于逻辑处理器的数量和模型使用的数据量。通 过采用免费版,客户可以获得一个逻辑处理器和10,000行 数据。RapidMiner Server旨在共享、协作和维护模型。 RapidMiner Radoop 将 RapidMiner 的执行直接扩展到 hadoop 环境中。RapidMiner公司仍然是一个领导者,为
9、全方位的数 据科学家和数据科学团队提供全面且易于使用的平台。 RapidMiner通过引入新的生产力和性能能力,继续强调核心 数据科学以及模型开发和执行的速度JSAS公司SAS公司总部位于北卡罗来纳州卡里市。Gartner公司 分析师表示,“SAS公司为分析和数据科学提供了许多软件产 品。对于这个 Magic Quadrant,我们评估了 SAS Enterprise Miner (EM)和 SAS Visual Analytics 产品套件,其中包括 Visual Statistics 和 Visual Data Mining 以及 Machine Learningo SAS仍然是领导者,但
10、在视觉完整性和执行能力 方面已经失去了 一些根底。Visual Analytics套件因其Viya 云就绪架构而显示出开展前景,该架构比以前的SAS架构更 加开放,并且使得广泛的用户更容易访问分析。然而,其令 人困惑的多产品策略影响了 SAS的视觉完整性,并且高许可 本钱的感知削弱了其执行能力。随着市场焦点转向开源软件 和灵活性,SAS公司提供有凝聚力的开放平台的速度缓慢, 并已经为此付出了代价J挑战者Gartner公司分析师表示,“挑战者拥有稳固的存在、可 信度、可行性和强大的产品能力。然而,他们可能不会像领 导者那样展示思想领导力和创新能力。挑战者主要有两种类 型。长期建立的数据科学和机器
11、学习供给商,因其稳定性、 可预测性和长期客户关系而取得成功。他们需要振兴开展愿 景,以便与市场开展保持同步,并变得更具影响力和创新性。 如果他们继续做一直在做的事情,其业务增长和市场存在可 能会受到损害。在相关市场*立良好根底的供给商,正在进 入数据科学和机器学习市场,其解决方案可扩展现有客户的 现有平台,但对许多潜在新客户而言也是合理的选择。由于 这些供给商证明他们可以影响这个市场,并提供明确的方向 和愿景,他们可能会开展成领导者JMathWorks 公司MathWorks公司是一家总部位于马萨诸塞州内蒂克的私 营公司。Gartner公司分析师表示,Mathwork的两个主要 产品是MATL
12、AB和Simulink,但只有MATLAB符合此魔力象限 的入选标准。MathWorks公司仍然是挑战者。它的执行能力得益于其在一般高级分析领域的持续可见性,重要的安装根 底和强大的客户关系,但受到参考客户对关键能力的平均分 数的影响。其完整的愿景受限于其对工程和高端财务用例的 关注。”(1) TIBCO Software 公司TIBCO Software公司位于加利福尼亚州的帕洛阿尔托。 Gartner公司分析师表示,“基于其在分析和商务智能领域的 地位,TIBCO公司于20*年6月从Quest Software收购了 成熟的Statistic,平台,进入了数据科学和机器学习市场。 此外,2
13、0*年11月,TIBCO宣布收购Alpine Data,这是之前魔力象限的远见者。在执行能力方面,此魔力象限仅评估TIBCO公司在Statistica平台上的能力。TIBCO的其他收购仅对其完整性有所奉献。TIBCO作为挑战者进入这个魔力 象限。Statistica平台拥有庞大而成熟的客户群,并在三个 典型的用例中获得高分:业务探索、原型设计和生产改良J远见者Gartner公司表示,“远见者通常是规模较小的供给商或 代表正在塑造或有可能影响市场的趋势的新进入者。然而, 可能会担忧这些供给商能够有效地继续执行并随着他们的 成长而扩展。它们通常在市场上并不为人所知,因此相对于 挑战者和领导者而言,
14、它们的领导力往往较低。远见者有强 烈的愿景和支持路线图。他们在解决市场需求方面具有创新 精神。虽然他们提供的功能通常具有创新性和可靠性,但在 产品的完整性和广度上往往存在差距J远见者值得考虑,因为他们可能: 提供启动创新计划的时机。 提供一些引人注目的差异化功能,作为现有解决方案 的补充或替代,并提供竞争优势。 更容易受到产品路线图和方法的影响。(1)Databricks 公司Databricks公司总部位于加利福尼亚州旧金山。 Gartner公司分析师表示,Databricks公司在云中提供基 于 Apache Spark 的 Databricks 统一分析平台。除 Spark 外, 它还为
15、Amazon Web Services (AWS)提供平安性、可靠性、操 作性、性能和实时支持的专有功能。Databricks公司于20* 年 11 月宣布推出一款 Microsoft Azure Databricks 平台, 该平台未在此魔力象限中考虑,因为它在评估时通常不可用。 Databricks公司是这个魔力象限的新进入者。作为远见者, 它利用开源社区和自己的Spark专业知识,提供一个易于访 问且熟悉的平台。除数据科学和机器学习外,Databricks公 司还专注于数据工程。20*年D轮融资额为1.4亿美元,为 Databricks公司提供了大量资源,可以扩展其部署选项并实 现其愿景
16、J(2)DataikuDataiku公司总部位于纽约市,在法国巴黎设有总部。 Gartner分析师表示,“Dataiku公司提供的数据科学工作室 (DSS)专注于跨学科协作和易用性,通过使用户能够快速启 动机器学习工程,Dataiku仍然是一个远见者,并且是许多 数据科学需求的热门选择。它的完整性愿景是由于其合作和 开源支持,这也是其产品路线图的重点。由于用例方面的广 度相对较差以及自动化和数据流的缺陷,其整体视觉分数低 于之前的魔力象限。由于操作和扩展机器学习模型的一些困 难,Dataiku公司的执行能力也有所下降JDomino 公 司Domino公司(Domino Data Lab)总部位
17、于加利福尼亚州 旧金山。Gartner公司分析师表示,“Domino公司提供了 Domino数据科学平台。这是专家数据科学团队的端到端解决 方案。该平台专注于集成开源和专有工具生态系统的工具, 协作、可重复性以及模型开发和部署的集中化。Domino公司 成立于20*年,是该市场知名厂商,并继续在数据科学家中 获得知名度。Domino公司坚持其作为远见者的地位。它的执 行能力虽然得到了改良,但在机器学习生命周期(数据访问、 数据准备、数据探索和可视化)开始时功能较弱仍然受到阻 碍。然而,在过去一年中,多米诺已经证明了在竞争激烈的 市场中赢得新用户并获得领导力的能力JIBM公司IBM公司总部位于纽
18、约阿蒙克。Gartner分析师表示, “IBM提供了许多分析解决方案。对于这个魔力象限,我们 评估了 SPSS,其中包括 SPSS Modeler 和 SPSS Statistics。 数据科学体验(DSX)是第二个数据科学和机器学习产品,不 符合我们对执行能力轴的评估标准,但确实有助于IBM的完 整性。IBM现在是一个远见者,相对于其他供给商而言,在 远见者的完整性和执行能力方面已经失去了优势。然而,IBM 公司的DSX产品有可能激发更全面和创新的愿景。IBM公司 已宣布计划在20*年为其SPSS产品提供新接口,该接口将SPSS Modeler完全集成到DSX中。”(5)微软公司微软公司总部
19、位于华盛顿州雷德蒙市。Gartner公司分 析师表示,“微软为数据科学和机器学习提供了许多软件产 品。在云端,它提供Azure机器学习(包括Azure机器学习 工作室),Azure数据工厂、Azure流分析 Azure HDInsight、 Azure数据湖和Power BI。对于本地工作负载,微软公司提 供带有机器学习服务的SQL Server,该服务于20*年9月 发布。在此魔力象限的截止日期之后。只有Azure机器学习 工作室符合此魔力象限的纳入标准,尽管微软公司具有更广 泛的分析产品确实影响了我们对其完整性的评估。但微软公 司仍然是一个远见者。它获得这个地位主要是因为其市场响 应能力和
20、产品可行性得分较低,因为Azure机器学习工作室 的纯云特性限制了它在许多需要内部部署选项的分析用例 中的可用性。”利基企业Gartner公司分析师解释说:“利基公司在特定行业或方 法中表现出优势,或与特定技术堆栈完美结合。一些利基公 司表现出一定程度的远见,这说明他们有可能成为远见者。 然而,相对于市场上的其他公司,他们往往难以让自己的愿 景引人注目,也可能在努力创造创新和思想领导的历史记录, 从而使他们成为远见者。如果其他利基企业继续以增强其在 市场中的势头和吸引力的方式执行任务,他们可能会成为挑 战者。”(1)Anaconda 公 司Anaconda公司前身为Continuum Anal
21、ytics,该公司总 部位于德克萨斯州奥斯汀市。Gartner分析师解释说, “Anaconda 公司销售 Anaconda Enterprise 5. 0,这是一个 基于交互式笔记本概念的开源开发环境。它还提供了一个松 散耦合的分发环境,可以访问各种开源开发环境和开源库, 主要是基于Python。Anaconda公司的优势在于它能够联合 并为大量不断构建机器学习功能的Python开发人员提供中 央访问点。然而,Anaconda公司对这些开发人员在质量、可 靠性和可持续性方面的努力几乎没有控制权。Anaconda通 过Anaconda Cloud培育广泛的开发者社区。Anaconda作为 利基
22、公司的地位反映了它对于熟练掌握Python的经验丰富 的数据科学家的适用性JAngoss 公司总部位于加拿大多伦多的Angoss公司于20*年1月被 Datawatch公司收购。Gartner公司分析师表示,“由于收购 的延迟,相对于魔力象限流程,以及不确定的影响,它在文 档中的名称仍为Angoss公司。此评估涵盖以下产品:该公 司最基本的产品KnowledgeSEEKER,主要针对桌面环境中的 公民数据科学家;KnowledgeSTUDIO , 包含比 KnowledgeSEEKER更多的模型和功能;以及新推出的 KnowledgeENTERPRISE,这是一款包含全系列功能的旗舰产 品。Angoss公司与银行客户有着长期的合作经验。这有助 于向银行业和其他具有类似数据和分析需求的行业提供服 务,例如保险、运输和公用事业JSAP公司