MapR Data Science Refinery
The MapR Data Science Refinery
The MapR Data Science Refinery是一套工具,使您能够从数据中提取见解,并将其转化为可操作的下一代应用程序,从而为您的业务带来可行的变化。
借助MapR Data Science炼油厂,MapR为企业提供了一套数据科学工具,帮助他们从数据中提取洞察力,并将这些洞察转化为可操作的下一代应用程序。
MapR已经认识到灵活的集装箱解决方案的必要性,可以扩展以适应各类数据科学团队的需求。MapR平台通过预先配置的产品为热门的开源工具提供支持,可以跨多租户环境分发给许多数据科学团队。
The MapR Data Science Refinery是一个易于部署和可扩展的数据科学工具包,可以本地访问所有平台资产和卓越的即装即用安全性。
MapR Data Science Refinery提供:
访问所有平台资产 - MapR基于FUSE的POSIX客户端允许应用程序服务器,Web服务器和其他客户端节点和应用程序直接并安全地将数据读写到MapR群集,如Linux文件系统。此外,还提供连接器,用于通过Apache Spark连接器与MapR-DB和MapR-ES进行互动。
超级安全 - MapR平台默认是安全的,MapR上的Apache Zeppelin利用MapR持久应用程序容器(PACC)提供的内置功能,利用这个安全层进行集成。
可扩展性 - Apache Zeppelin与Helium框架配合,提供可插拔的可视化功能。
简化部署 -预先配置的Docker容器提供了将MapR作为持久数据存储的能力。 Dockerfile也是可用的,允许用户根据需要定制图像以支持特定的应用程序需求。
为什么选择 MapR Data Science Refinery?
可以访问所有数据因而有更准确的见解
MapR Data Science Refinery是唯一可以安全访问所有数据的数据科学产品。它用以下东西连接盒子:
MapR-XD: 用于文件和容器
全球分布式数据存储
高规模,且可靠
MapR-DB:高度可扩展的多模型NoSQL数据库管理系统
支持多种数据模型,包括宽列,文档,键值和时间序列。
MapR-ES: 全球发布 - 订阅事件流媒体系统
融合数据平台内置的第一个大数据规模流媒体系统
唯一可以在物联网规模上可靠地支持全球事件复制的大数据流系统
创建实时机器学习管道
MapR平台的核心组件是MapR-ES,它是一个针对大数据的全球发布 - 订阅事件流媒体系统。通过MapR-ES和机器学习库的本地集成,企业现在可以创建实时机器学习管线,使他们能够将ML模型应用于实时数据。
通过广泛的语言和图书馆支持提高数据科学的生产力
MapR数据科学精炼厂提供了Apache Zeppelin数据科学笔记本,可以在一个视觉空间中跨越多个引擎工作:
使用Apache Spark和Python进行分布式计算和ML编程
使用Apache Hive和Drill的批处理和交互式SQL
Apache Pig的脚本支持
Shell 访问 MapR-FS
使用Spark编程访问MapR-DB和MapR-ES
使用持久和有状态的容器轻松部署
容易部署
Docker Hub上有Docker镜像。
Image包含了所有必要的功能,不再需要使用MapR作为集装箱化应用程序的持久数据存储。
安全
身份验证发生在容器级别,以确保容器化的应用程序只能访问授权的数据。
加密通信以确保在访问MapR中的数据时的隐私.
可扩展
Dockerfile也将在GitHub上提供,允许您根据需要进一步自定义图像以支持您的特定应用程序需求。
持久
容器可以轻松地利用所有的MapR平台服务(MapR-FS,MapR-DB,MapR流)作为持久数据存储。
为数据科学家提供强大的可视化支持
MapR数据科学精炼厂配备了8个开箱即用的可视化库,包括MatPlotLib和GGPlot2。Apache Zeppelin提供了一个可插入的可视化框架使得:
NPM注册表中提供常见的可视化库
轻松创建和加载自定义可视化的功能
启用笔记本/模型协作,共享和镜像
MapR融合数据平台非常适合存储模型和笔记本存储库。组织可以利用MapR平台的全局名称空间和卓越的复制功能。MapR平台还提供了不变的快照,以保存和部署相同模型的各种版本,从而使数据科学家能够比较每个版本模型的性能和准确性。
你的业务是怎么从MapR Data Science Refinery 获得收益的
商业预测精度更高
机器学习模型只与训练他们的数据一样好。借助MapR Data Science炼油厂,数据科学家可以访问所有数据,从而提高模型的准确性。
即时洞察
使用MapR-ES,MapR数据科学精炼厂允许数据科学家创建实时机器学习管道。现在,组织可以将机器学习模型应用于实时数据,以获得即时业务洞察力。
更高的数据科学家生产力
MapR数据科学精炼厂提供广泛的流行数据科学工具和库的访问,使数据科学家可以轻松选择他们选择的工具。因此,数据科学家的工作效率更高。
总体拥有成本更低
The MapR Data Science Refinery易于部署和管理。它还提供了就地访问数据的功能,无需额外的硬件来复制数据。因此,与其他数据科学产品相比, MapR Data Science Refinery 总体拥有成本更低。
使你的业务可视化
MapR Data Science Refinery提供可插拔和广泛的可视化支持,帮助业务领导者和决策者在业务发生时将其视觉化。
智能流程
MapR Data Science Refinery帮助企业将机器学习和人工智能集成到日常业务工作流程中,实现无人工干预的智能流程。
赶快使用 MapR Data Science Refinery吧。
Refinery 伙伴
ML是研究和市场创新的活跃领域。 有改变游戏规则的ML公司,投资提高数据科学生产力,以及建立领域特定的机器学习解决方案。作为一家数据平台公司,我们希望能够公开开放,并为我们的客户提供灵活性,将这些解决方案用于他们依赖MapR存储和管理的业务数据的PB上。 MapR拥有一个强大的融合合作伙伴计划,我们将选定的炼油厂伙伴关系作为一个整体方法来扩展这个计划,以便为所有类型的数据科学团队启用MapR平台。
了解更多
The MapR Converge Community’s Data Science Refinery Page 是您的理想之选,有利于:
合作伙伴解决方案
演示
博客
书籍
网络研讨会