青牛主题列表_海汼部落 | IT学习->实战为王

创始人

青牛

第 12 位会员

451 关注者

2256 评论

308 话题

WeChat
Website
公司
城市

在 impala 的 shell 命令窗口，执行删除表的命令，执行报错，表无法删除？

看这个异常，应该是没有找到hdfs吧。删表会执行个hdfs命令删表在hdfs上的目录。
信息被删除或无权限查看
请问哪位海牛有 hadoop 视频中的脚本文件，能共享下吗？

亲，视频下载，帖子里有，要源码和配套笔记的方法
hadoop 使用 root 权限？

不是的，实际都是从hadoop用户切换到root用户
海牛部落 Hadoop 系列教程（二）：批量操作多台服务器

@微步客 “#auth\t\trequired\tpam_wheel.so”在这个文件里/etc/pam.d/su
海牛部落 Hadoop 系列教程（二）：批量操作多台服务器

@微步客 hadoop_op1.zip,是一个多台批量脚本程序
hadoop 启动从机显示 0.0.0.0:50010 端口被占用？求大神解决！！！

@好好学习副本数没有要求，但是你得在site文件里配置上namenode地址。这样你的从机好知道从那里查找主节点
请问两张大表进行 join，要求优化，不用 hive 的分桶，用算法实现，怎么实现呢？

是自己实现partioner吗？那要先分析join的key的分布情况，再自定义算法
hadoop 启动从机显示 0.0.0.0:50010 端口被占用？求大神解决！！！

第一从机不用写slaves,第二你从机的hdfs-site.xml配置错了没有找对主机
Hadoop 部署集群时节点无法启动问题？

@好好学习是的
dataframe 写入 impala 语法错误，怎么解决？

没搞懂，你写入怎么用create语句了？
hbase scan 查询的问题？

@ruiqi 那就是你查询的时候遇到region split了，这样hbase性能就很差了，get还不如scan那，先分析rowkey的分布在决定怎么预分region，把gc日志打出来吧，看看时间
在 impala 的 shell 命令窗口中修改表的字段类型，查询数据报错？

@liwei131313 用avro格式，可以支持改表
hbase scan 查询的问题？

@ruiqi 这要看瓶颈在哪里，是在硬盘io那，还是regionserver的gc哪里，另外自动split关了没？
Spark 对于大量数据 sort 之后，collect 内存不够，怎么将所有排序完的数据有序输出？

自定义一个partitioner，然后再sort以后将rdd直接存储到hdfs上，别collect到driver上