如果没有cluster,只在本地安装使用spark,想要处理大数据集(20G+)会对效率有帮助吗?
本地的处理的话 spark不是最合适的把 分布式处理数据的起点其实是TB级 少量的话体现不出来优势
`单行代码`
关注海汼部落