在实际生产过程中,部署完hadoop环境如何进行下一步开发工作?假如开发一个大数据分析平台功能接下来需要准备做哪些工作?
在实际生产过程中,部署完hadoop环境如何进行下一步开发工作?假如开发一个大数据分析平台功能接下来需要准备做哪些工作?
数据上报,相关产品对接数据埋点,可以理弄个埋点管理系统。接下用mr,hive或spark做数据的ETL,弄好结构化数据,然后再建数据仓储,之后就能用hive或spark-sql做数据的分析。再弄个报表系统出报表用hue或者esayreport都可以。涉及到流式计算的话可以用kafka和spark-streaming。