2.1.3 RDD的创建-从外部存储系统的数据集创建
2.1.3 RDD的创建-从外部存储系统的数据集创建1、从外部文件创建RDD,外部文件可以是:本地文件,支持Hadoop的文件系统(如Hbase,HDFS等)2、准备外部数据(HDFS上面的话,需要有准确的目录及文件路径)def main(args :Array[String]):Unit = {val conf :SparkConf = new SparkConf().setAppName(“自
·
2.1.3 RDD的创建-从外部存储系统的数据集创建
1、从外部文件创建RDD,外部文件可以是:本地文件,支持Hadoop的文件系统(如Hbase,HDFS等)
2、准备外部数据(HDFS上面的话,需要有准确的目录及文件路径)
def main(args :Array[String]) :Unit = {
val conf :SparkConf = new SparkConf().setAppName(“自定义App名字”).setMaster(“local[*]”)
val sc :SparkContext = new SparkContext(conf)
val linerdd1 :RDD[String] = sc.textFile(“准确的文件路径及文件名”)
linerdd1.saveAsTextFile(“输出的准确路径及目录名”)
sc.stop()
}

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)