海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

449 关注者
2253 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2253)
  • Spark submit 参数调优是否有一定标准或者规律?

    参数调优其实是一个很值得研究的领域 我接触到的项目实践的时候用处不大,实际中只要给出压力测试或是性能测试的结果即可

  • 请问批量操作多台服务器的脚步在哪里下载呢?

    视频配套笔记、源码、使用软件:可加微信:18613807937 索要

  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • sparksqlselect.join.group 是会对应生成什么样的 rdd.再划分 stage 的?

    select 对应map
    join对应union intersection 或join
    group对应groupByKey

  • spark-phoenix 一直出现一个 bug?

    这个不是异常 源码中是logger.info出来的信息 不是bug

  • scan 查出来的 row 是 rowkey 吗?

    这个还真看不出来

  • spark 读取 MongoDB,进行计算,MongoDB 游标超时如何解决?

    除了你说的两种方法,还有两种方法
    1、 find() 时传入 timeout=False 来禁用 10 分钟超时
    2、find(match).batchSize(10000) 设置每次查出来一个batchSize 保证这个batchSize的数据spark 10分钟能处理完 这样spark就会在10分钟内继续连接db而不会超时了

  • 求 spark 大神帮忙看下,用 scala 操作 dataframe 转 rdd 的时候,row 对象的取值问题?

    row.getAsRow.getAsString

  • Hive 为什么不支持日期格式?

    解决方法很简单 把oracle的日期型转为字符 读到hive中 对应hive的string就好 select的时候把string转为时间

  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • 如何用 PYTHON 在不调用库的情况下实现 ping 命令?

    为啥不调用库?

  • «
  • 1
  • 2
  • ...
  • 96
  • 97
  • 98
  • 99
  • 100
  • 101
  • 102
  • ...
  • 146
  • 147
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2