在大型算法项目中Spark除了做数据预处理和调用SparKMlib的算法库,还担任了什么角色?因为听别人说他们用Spark做算法写了几万行,但是如果只做这两个事情代码量不会大吧。希望Spark大神不吝赐教。
主要做特征处理 算法基本不用 即使SparKMlib也搞不定
`单行代码`
关注海汼部落技术社区