博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
apache spark kubernets 部署试用
阅读量:6278 次
发布时间:2019-06-22

本文共 2825 字,大约阅读时间需要 9 分钟。

spark 是一个不错的平台,支持rdd 分析stream 机器学习。。。

以下为使用kubernetes 部署的说明,以及注意的地方

具体的容器镜像使用别人已经构建好的

deploy yaml 文件

deploy-k8s.yaml

apiVersion: extensions/v1beta1kind: Deploymentmetadata:    name: spark-master  namespace: big-data  labels:    app: spark-masterspec:  replicas: 1  template:    metadata:      labels:        app: spark-master    spec:      containers:      - name: spark-master        image: bde2020/spark-master:2.3.1-hadoop2.7        imagePullPolicy: IfNotPresent        ports:        - containerPort: 7077        - containerPort: 8080        env:        - name: ENABLE_INIT_DAEMON          value: "false"        - name: SPARK_MASTER_PORT          value: "7077"---apiVersion: v1kind: Servicemetadata:  name: spark-master-service  namespace: big-dataspec:  type: NodePort  ports:    - port: 7077      targetPort: 7077      protocol: TCP      name: master  selector:    app: spark-master---apiVersion: v1kind: Servicemetadata:  name: spark-webui-service  namespace: big-dataspec:  ports:    - port: 8080      targetPort: 8080      protocol: TCP      name: ui  selector:    app: spark-master  type: NodePort---apiVersion: extensions/v1beta1kind: Ingressmetadata:  name: spark-webui-ingress  namespace: big-dataspec:  rules:  - host: spark-webui.data.com    http:      paths:      - backend:          serviceName: spark-webui-service          servicePort: 8080        path: /---apiVersion: extensions/v1beta1kind: Deploymentmetadata:    name: spark-worker  namespace: big-data  labels:    app: spark-workerspec:  replicas: 1  template:    metadata:      labels:        app: spark-worker    spec:      containers:      - name: spark-worker        image: bde2020/spark-worker:2.3.1-hadoop2.7        imagePullPolicy: IfNotPresent        env:        - name: SPARK_MASTER          value: spark://spark-master-service:7077        - name: ENABLE_INIT_DAEMON          value: "false"        - name: SPARK_WORKER_WEBUI_PORT          value: "8081"        ports:        - containerPort: 8081---apiVersion: v1kind: Servicemetadata:  name: spark-worker-service  namespace: big-dataspec:  type: NodePort  ports:    - port: 8081      targetPort: 8081      protocol: TCP      name: worker  selector:    app: spark-worker---apiVersion: extensions/v1beta1kind: Ingressmetadata:  name: spark-worker-ingress  namespace: big-dataspec:  rules:  - host: spark-worker.data.com    http:      paths:      - backend:          serviceName: spark-worker-service          servicePort: 8081        path: /

部署&&运行

  • 部署
kubectl apply -f deploy-k8s.yaml
  • 效果

    使用ingress 访问,访问域名 spark-webui.data.com

说明

  • 命名的问题
平时的习惯是deploy service 命名为一样的,但是就是这个就有问题的,因为k8s 默认会进行环境变量的注入,所以居然冲突的。解决方法,修改名称,重新发布具体问题:dockerfile 中的以下环境变量ENV SPARK_MASTER_PORT 7077
  • spark 任务运行
具体的运行可以参考官方demo,后期也会添加

参考资料

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">

 
 
 
 

转载地址:http://ykfva.baihongyu.com/

你可能感兴趣的文章
线程管理(六)等待线程的终结
查看>>
spring boot集成mongodb最简单版
查看>>
DELL EqualLogic PS存储数据恢复全过程整理
查看>>
《Node.js入门经典》一2.3 安装模块
查看>>
《Java 开发从入门到精通》—— 2.5 技术解惑
查看>>
Linux 性能诊断 perf使用指南
查看>>
实操分享:看看小白我如何第一次搭建阿里云windows服务器(Tomcat+Mysql)
查看>>
Sphinx 配置文件说明
查看>>
数据结构实践——顺序表应用
查看>>
python2.7 之centos7 安装 pip, Scrapy
查看>>
机智云开源框架初始化顺序
查看>>
Spark修炼之道(进阶篇)——Spark入门到精通:第五节 Spark编程模型(二)
查看>>
一线架构师实践指南:云时代下双活零切换的七大关键点
查看>>
ART世界探险(19) - 优化编译器的编译流程
查看>>
玩转Edas应用部署
查看>>
music-音符与常用记号
查看>>
sql操作命令
查看>>
zip 数据压缩
查看>>
Python爬虫学习系列教程
查看>>
【数据库优化专题】MySQL视图优化(二)
查看>>