Domino:数据科学即服务
Domino是一个用于数据科学的PaaS(平台即服务)云计算平台,人们可以使用Python或R语言在这个云平台上做数据分析工作。
据NickElprin(Domino的创始人之一)所说,Domino让数据科学家只需专注于自己的分析工作,而不用关注软硬件基础设施:
“我们认为,随着数据量的增加和分析技术的越来越成熟,现代数据分析工具在易用性方面已经滞后,并且访问科学领域数据上还有一些不必要的限制。”
Domino平台上的三大支柱功能:
直接到云部署和执行:Domino允许在EC2上运行现有的代码(Python、R、Matlab、Julia、shellscripts等等),以承载长时间运行或资源密集型任务。该系统还关注云端底层管件功能,比如:AMI管理,启动和停止机器,将数据安全传输到另一机器上,再将结果安全返回。
数据科学的版本控制:Domino团队计算过,类似于Git之类的分布式版本控制系统并不足以应付分析工作流,因为它们没能力处理大数据集,并且不能在输入和结果(例如图表、数字)间建立联系。Domino会自动保持整个项目的快照,目前最高至40GB,这样就很容易追溯整个工作的历史,包括代码、数据和结果。
协作:类似Github,Domino也可以用于合作开发项目。合作者可以查看、编辑并运行这个项目。Domino会检测冲突,运行结束后将更新的结果发送通知,并且它还有个内部笔记,方便讨论团队工作进展。
用随收随付的方式,Domino的定价范围从免费入门到每月付费订阅。正如InfoQ从NickElprin那里了解到的,尽管这个平台还处于发展早期,但是它已经被各个科学领域的从业者所使用:从学者(如为研究分析了数千张图片的生态学家)到数据科学顾问(把它用于Kaggle比赛),以及市场营销公司(帮助客户更好定向投递)。
Python培训,就选光环大数据Python培训机构!python学习地址:http://hadoop.aura.cn/python/
大数据培训、人工智能培训、Python培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请专业的大数据领域知名讲师,确保教学的整体质量与教学水准。讲师团及时掌握时代潮流技术,将前沿技能融入教学中,确保学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式,指导学生更快的掌握技能知识,成就上万个高薪就业学子。 更多问题咨询,欢迎点击------>>>>在线客服!