返回列表

技术:RapidMiner等大数据处理分析工具介绍

发表日期: 2015-03-21 文章来源:佳达科技

技术:RapidMiner等大数据处理分析工具介绍

如上文所约,合肥网站优化公司佳达小编已经为大家准备好了关于HPCC、Pentaho BI和RapidMiner这三大大数据处理分析工具的介绍(目前来看,这个工具还太过专业和深入,希望后期能有些相对简单和“傻瓜化”的工具来帮助我们体验大数据带来的美妙世界)。这三个与之前介绍的三个有什么不同和共同点呢?请大家对比发现,是不是有一点想大家来找茬,哈哈!

1)HPCC
HPCC,High Performance Computing and Communications(高性能计算与通信)的缩写。1993年,由美国科学、工程、技术联邦协调理事会向国会提交了“重大挑战项目:高性能计算与 通信”的报告,也就是被称为HPCC计划的报告,即美国总统科学战略项目,其目的是通过加强研究与开发解决一批重要的科学与技术挑战问题。HPCC是美国 实施信息高速公路而上实施的计划,该计划的实施将耗资百亿美元,其主要目标要达到:开发可扩展的计算系统及相关软件,以支持太位级网络传输性能,开发千兆 比特网络技术,扩展研究和教育机构及网络连接能力。
该项目主要由五部分组成:
1、先进软件技术与算法(ASTA),内容有巨大挑战问题的软件支撑、新算法设计、软件分支与工具、计算计算及高性能计算研究中心等;
2、国家科研与教育网格(NREN),内容有中接站及10亿位级传输的研究与开发;
3、高性能计算机系统(HPCS),内容包括今后几代计算机系统的研究、系统设计工具、先进的典型系统及原有系统的评价等;
4、基本研究与人类资源(BRHR),内容有基础研究、培训、教育及课程教材,被设计通过奖励调查者-开始的,长期 的调查在可升级的高性能计算中来增加创新意识流,通过提高教育和高性能的计算训练和通信来加大熟练的和训练有素的人员的联营,和来提供必需的基础架构来支 持这些调查和研究活动;
5、信息基础结构技术和应用(IITA ),目的在于保证美国在先进信息技术开发方面的领先地位。

2)Pentaho BI
Pentaho BI 平台不同于传统的BI 产品,它是一个以流程为中心的,面向解决方案(Solution)的框架。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来,方便商务智能应用的开发。它的出现,使得一系列的面向商务智能的独立产品如Jfree、Quartz等等,能够集成在一起,构成一项项复杂的、完整的商务智能解决方案。
Pentaho BI 平台,Pentaho Open BI 套件的核心架构和基础,是以流程为中心的,因为其中枢控制器是一个工作流引擎。工作流引擎使用流程定义来定义在BI 平台上执行的商业智能流程。流程可以很容易的被定制,也可以添加新的流程。BI 平台包含组件和报表,用以分析这些流程的性能。目前,Pentaho的主要组成元素包括报表生成、分析、数据挖掘和工作流管理等等。这些组件通过 J2EE、WebService、SOAP、HTTP、Java、JavaScript、Portals等技术集成到Pentaho平台中来。 Pentaho的发行,主要以Pentaho SDK的形式进行。

3)RapidMiner
RapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。它数据挖掘任务涉及范围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价。其功能和特点有:数据挖掘过程简单,强大和直观、免费提供数据挖掘技术和库、100%用Java代码(可运行在操作系统)、可以用简单脚本语言自动进行大规模进程、图形用户界面的互动原型、命令行(批处理模式)自动大规模应用、Java API(应用编程接口)、简单的插件和推广机制和强大的可视化引擎,许多尖端的高维数据的可视化建模等。ML保证了标
耶鲁大学已成功地应用在许多不同的应用领域,包括文本挖掘,多媒体挖掘,功能设计,数据流挖掘,集成开发的方法和分布式数据挖掘。

至此,六大大数据处理分析工具已经由合肥网站优化公司佳达小编为大家介绍完毕,小编又可以为下一个主题准备了。会是什么主题呢?下周见分晓吧。

转载请注明出处 合肥网络公司佳达科技专注于网站推广 www.jdwlkj.net

  3,129 次
 佳达科技
返回列表

暂无回复 trackback

评论关闭!