IDEA新建一个spark项目-创新互联-成都创新互联网站建设

关于创新互联

多方位宣传企业产品与服务 突出企业形象

公司简介 公司的服务 荣誉资质 新闻动态 联系我们

IDEA新建一个spark项目-创新互联

第一步:新建一个maven工程
在这里插入图片描述

成都创新互联专注于成都网站建设、网站制作、网页设计、网站制作、网站开发。公司秉持“客户至上,用心服务”的宗旨,从客户的利益和观点出发,让客户在网络营销中找到自己的驻足之地。尊重和关怀每一位客户,用严谨的态度对待客户,用专业的服务创造价值,成为客户值得信赖的朋友,为客户解除后顾之忧。

第二部:命名工程名
在这里插入图片描述

第三步:新建一个文件夹,并设置为sources root
在这里插入图片描述
第四步:pom编写

4.0.0com.cn.sparkspark-day011.0-SNAPSHOT88org.apache.hadoophadoop-client2.7.1  org.apache.maven.plugins maven-compiler-plugin 3.6.1  1.8 1.8 UTF-8  

第五步:新建一个Scala类
在这里插入图片描述
注意:此步可能找不到Scala,需要引入
具体步骤为
1.项目构建
在这里插入图片描述
2.点击+
在这里插入图片描述
3.添加Scala,如果有Scala环境,会默认识别版本
在这里插入图片描述
最后会引入Scala,如下
在这里插入图片描述

第六步:引入spark相关jar包
在这里插入图片描述

选择自己的spark安装包,里边有jar包目录
在这里插入图片描述
第七步:新建一个Scala
在这里插入图片描述
第八步:编写代码验证

package com.cn.wordcount

import org.apache.spark.{SparkConf, SparkContext}

object Driver {def main(args: Array[String]): Unit = {val conf = new SparkConf().setMaster("local").setAppName("wordCount")
    val sc = new SparkContext(conf)
    val data = sc.textFile("hdfs://hadoop01:9000/data", 2)
    val result=data.flatMap{line=>line.split(" ")}.map{word=>(word,1)}.reduceByKey((x,y)=>x+y)
//    result.foreach(line=>println(line))
    result.saveAsTextFile("hdfs://hadoop01:9000/result03")

  }

}

第九步:运行结果(打印到控制台,并且将数据存储到Hadoop中hdfs中)
在这里插入图片描述

你是否还在寻找稳定的海外服务器提供商?创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源,准确流量调度确保服务器高可用性,企业级服务器适合批量采购,新人活动首月15元起,快前往官网查看详情吧


新闻名称:IDEA新建一个spark项目-创新互联
标题来源:http://kswsj.cn/article/ihesh.html

其他资讯