假设有这样一个RDD: [String (String, int) ],我想先对第一个String做groupBy,再对第二个String做groupBy。但是实际上是不行的,因为第一次做完groupBy之后,RDD会变成[String iterator(String, int)],此时就无法第二个String做groupBy了。
有什么方法能实现先对字段一分组,再对字段二分组吗?
并且最好能扩展到对字段n-1分组,即先对字段一分组,再对字段二分组,再对字段三分组,一直到字段n-1分组,最后字段n求和