存储在namenode节点的硬盘和内存中
- HDFS 全部文件的元数据是存储在 namenode 节点的硬盘还是内存?
- Spark updateStageByKey 产生的大量 checkpoint 小文件在 hdfs 上怎么处理?
-
信息被删除或无权限查看
-
信息被删除或无权限查看
-
信息被删除或无权限查看
- 怎样用 kmeans 对类似 00101001110011001...这样的一连串序列进行聚类?
- spark 中 mllib 是如何将某些机器算法做到分布式并行计算的?
- spark 伪分布式模式的性能怎么样? 能否替换传统数据处理里的某些场景?
- Linux 平台完全分布模式下 Hadoop 实例 wordcount 在 eclipse 编写运行权限问题?
- Fuzzy C-means 与 Gaussian Mixture Model 聚类的区别?修改
- Spark 中的 CNN 如何实现分布式计算的?
- spark streaming 任务如何切分,是按照 duration 切分么?
- Spark SQL 如何管理 select 权限,貌似任何用户都可以查询任何一张表?
-
信息被删除或无权限查看
- spark 读取 hive 的问题?