val spark = SparkSession
.builder()
.master("local")
.appName("testtt")
.getOrCreate()
val path ="C:/1/a.txt"
val sc = spark.sparkContext
val c: Array[(String, Int)] = sc.textFile(path)
.flatMap(.split(" "))
.map(x=>(x,1))
.reduceByKey( + _)
.collect()
这个程序为什么stage的划分跟书上的不一样,reduceByKey前面的不应该跟reduceByKey划分在一起吗?原理上说最后一个rdd划分一个stage,然后如果遇到宽依赖划分新的stage吗,但是看起来不一样