海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

449 关注者
2253 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2253)
  • Scala 特殊的简写看不懂,内容如下?
    sc.textFile(args(0))   读取这个变量地址指定的文件
    .flatMap(.split(" "))     把文件中每一行按空格分割并转成多行
    .map((, 1))            把上面转成多行中的每一项转换成一组一组的数据,每组数据为自身加1的组合
    .reduceByKey(+)       把每组数据的value值进行累加,也就是把每组数据的所有1进行累加,求出每组key的总数
    .sortBy(_.2, false)    按上一步每组的累加值进行排序

    在scala中如果函数中只有一个变量那可以不写,或者使用匿名变量
    代码里的(, 1) 这个就是逗号前面有个匿名变量
    _.2 这个 就是代表元组的第2个值 可以写成这样的形式f => {f._2} 那这个f和_就是一个意思了

  • spark 中 spark.sql.warehouse.dir 怎么设置成 HDFS 的上的数据,求个格式?

    没明白你要设置成hdfs上的路径吗?还是配置什么东西。
    HDFS上的数据路径就以hdfs开头啊

  • how to configure my spotfire with hive database?

    这里能设置JDBC连接吗?

  • how to configure my spotfire with hive database?

    file

  • java 第一个程序报错 编译成功 但执 java Hello 时找不到或无法加载主类?

    亲,后两个图片上传失败了

  • Zookeeper 异常 ConnectionLossException 怎么办?

    @好好学习 这个应该是好使了

  • 这个 hbase 的 region 达到多大才会分区呢?

    默认region split策略。根据公式min(r^2*flushSize,maxFileSize)确定split的maxFileSize,其中r为在线region个数,maxFileSize由hbase.hregion.max.filesize指定

  • 如何解释 hadoop 的边缘节点

    你是指这个意思吗?
    所谓的边缘节点即集群内部用来向集群外暴露服务能力的节点,集群外部的服务通过该节点来调用集群内部的服务,边缘节点是集群内外交流的一个Endpoint。

  • python?求大神指点?

    首先列表的每一项是字典,所以先循环列表的每一项取出字典,然后再取出字典中3的那个key

  • spark 通过 jdbc 方式连接 impala 为什么没有数据只有字段名?

    调出info信息看一下吧

  • CDH spark 问题?

    把相关jar包放在spark的jars目录里就行了

  • 海牛部落 hive 系列教程(十九):hive 介绍与安装

    @程序媛 5.7

    file

  • 信息被删除或无权限查看
  • Zookeeper 异常 ConnectionLossException 怎么办?

    @好好学习 截图给我看看,我看看是不是正常的telnet结果

  • hadoop 源码编译出错?求大神解决!!!

    @好好学习 嗯hadoop checknetive,看看本地库没问题就行

  • «
  • 1
  • 2
  • ...
  • 121
  • 122
  • 123
  • 124
  • 125
  • 126
  • 127
  • ...
  • 146
  • 147
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2