Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

DataFoundry/casebycase

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

2 Commits

Repository files navigation

datafoundry部署案例说明

为了方便datafoundry用户理解平台的使用,我们收集了一些基于容器、后端服务来部署大数据分析服务的场景,具体如下:

datafoundry使用基础

docker-2048

由于PAAS的火热带动了一个游戏的普及,那就是2048,详见在datafoundry平台上运行docker-2048

wordpress绑定mysql后端服务

在2048出现前,在各个平台上部署的第一个应用通常是wordpress,好看又实用,这回我们通过后端服务给这个经典案例带来一些新玩法

通过tensorflow nodejs api完成神经网络模型训练

2016年alphaGo成了mechine界和人间界的明星,我们也来膜拜一下tensorflow playground

大数据分析、应用场景

Rstudio绑定mongodb后端服务

在这个案例中我们通过datafoundry平台后端服务功能生成一个有共享数据的mongodb数据库后端服务,然后绑定到一个RstudioServer中,这样就可以通过Rstudio来对mongodb中的共享数据进行分析,详见R数据分析场景

Jupyter绑定mongodb后端服务

在这个案例中我们通过datafoundry平台后端服务功能生成一个有共享数据的mongodb数据库后端服务,然后绑定到一个Jupyter notebook中,这样就可以通过Jupyter来对mongodb中的共享数据进行分析,详见Jupyter数据分析场景

Caravel绑定mysql服务,完成数据可视化

Caravel是airbnb开源的一个数据可视化分析工具可以很方便的和mysql、postgresQL、Druid进行整合完成数据可视化分析。

在这个案例中我们使用容器分别启动Caravel和mysql,并通过Caravel初始化mysql数据库中的数据,完成Caravel的demo应用,详见Caravel集成MySQL数据库

运行openRefine进行数据探索

openRefine is a power tool that allows you to load data, understand it, clean it up, reconcile it, and augment it with data coming from the web. All with the comfort and privacy of your own computer.

在这个案例中我们使用容器启动openRefine,并通过openrefine下载从aws 送s3上下载bank.csv中的数据然后进行数据探索相关任务

zeppelin绑定spark后端服务

zeppelin是功能非常强大的数据分析和可视化工具,可以非常方便的与多种数据源,特别是spark,进行整合。本案例演示了如果通过datafoundry平台部署zeppelin并集成spark后端服务

大数据调度工具

运行apache nifi ETL工具

Apache NiFi is an easy to use, powerful, and reliable system to process and distribute data.

通过容器运行一个apache NiFi服务,进行大数据服务调度和编排
NiFi资源列表:https://github.com/jfrazee/awesome-nifi

运行kettle ETL工具

Pentaho Data Integration ( ETL ) a.k.a Kettle. With an intuitive, graphical, drag and drop design environment and a proven, scalable, standards-based architecture, Data Integration is increasingly the choice for organizations over traditional, proprietary ETL or data integration tools.

通过容器运行一个kettle应用后端服务服务,并绑定mysql和postgreSQL后端服务进行ETL,详见通过kettle实现ETL服务

机器学习

Tensorflow是google研发的第二代人工智能学习系统。Tensor的英文有张量之意,意味着N维数组,flow就是流的意思,意味着基于数据流图的计算,tensorflow就是张量从图像的一端流动到到另一端的计算过程。Tensorflow是将复杂的数据结构传输至人工智能神经网中进行分析和处理的系统。它可以被用于语音识别或者图像处理等多项机器深度学习领域,它可以在小到一部智能手机,大到数千台数据中心服务器的各种设备上运行。同时,tensorflow是开源的,意味着任何人都可以使用.集群的搭建过程详见[https://github.com/DataFoundry/tensorflow-cluster.git]

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

AltStyle によって変換されたページ (->オリジナル) /