如果没有cluster,只在本地安装使用spark,想要处理大数据集(20G+)会对效率有帮助吗?
会啊 本地处理的话没必要用spark 20g的数据用别的方法也行 只要你有足够的计算资源的话,spark的强大之处在于处理tb或是pb的数据,也就是单机处理不了的数据
`单行代码`
关注海汼部落技术社区