我在idea 中配置了hive 的运行环境,正常的select 查询是可以的,且UDF函数也可以正常运行。
当我运行UDFA函数的时候报错,我就运行 select count(1) from student; 报错,具体错误如下:`java.io.IOException: Cannot initialize Cluster. Please check your configur...
每次重新打开idea 或者重启电脑后 都需要重新导入 否则创建不了scala class


在执行orcFile转Hfile时报错如下:

然后我就按照提示修改了执行了:修改了家目录的权限的命令。
然后就没有权限了,不能够进入家目录。如下:

journalctl -xb 查看系统日志

源码分析被老师吐槽后,认真做了一遍,结合网上资源慢慢整理理出来,用到线程的地方看得有点迷,其中第二层核心面板submitJobInternal()方法中生成密钥那部分不知道在干啥,还有提交后Yarn如何进入到MapTask中的方法这段中间的细节比较模糊,希望有大佬指点。
<div sty...
花了挺久才看懂环形缓冲区的原理,把自己觉得重要的地方都注解在了代码里,如果有理解错误的地方,希望能帮我指正。
<div style="text-align:center"><b>Map阶段的三大核心</b></div>
T1. LineRecord读取数据分片
T2. MapOutPutBuffer的创建于数据输入
T3. 数据的溢...
**.var生成的变量名会与之前的变量名重名**

**修改新生成的变量名,上面被重名的变量名也会对应发生改变**

之前用的好好的,今天打开本地虚拟机突然打不开集群了。按照提示进行到这一步,找不到指定文件?请问老师们这种情况应该怎么处理啊?

在cmd导入都没有问题?为何在pycharm无法导入MySQLdb
烦请老师给点指点
再导入mx.URL的时候出现这个问题,是pip版本不对的问题吗?
如题 安装setuptools时只有一台虚拟机报错如下
ImportError: /usr/local/lib/python2.7/lib-dynload/_ctypes.so: invalid ELF header
其他没事 请问这是为什么呢?

比如现在nn1节点是active状态,nn2节点是standby状态,如果此时nn1挂掉,nn2是怎么通过zkfc,然后变成active状态的?是nn2的zkfc获取到了nn1节点中状态变成了standby,然后nn2状态切换到active,万一nn1直接挂掉,断电了nn2会收到消息变成active状态吗,还是两个都会sta...
1. 如果要跑海牛日志一年的数据,自己统计时先将一年的数据拉到本地,通过find命令把log文件放到一个文件夹,然后再把hdfs上传到hdfs上,然后再跑MapReduce。虽然hdfs中没法使用find函数的样子,但这个过程能否全程在hdfs上实现,有什么优化的方法。
2. 如果我每天的定...

网上搜索说是zoo.cfg文件的名称是zoo_sample.cfg的问题但是修改名字以后并且重新开机启动zookeeper以后还是不行;zoo.cfg内的配置信息,为上传老师的配置文件;
问题图片显示处:
zoo.cfg...
20/09/08 15:33:51 ERROR org.apache.hadoop.util.Shell getWinUtilsPath(): Failed to locate the winutils binary in the hadoop binary path
java.io.IOException: **Could not locate executable null\bin\winutils.exe in the Hadoop binaries.**
Exception in...
最近有不少童鞋问到我一些生活的问题, 例如:
1. 做大数据的日子都干些什么?
2. 刚进入公司应该怎么度过?
3. xxxx重要嘛? 平常怎么学习?
很感谢大家愿意听我唠叨哈~
今天有空跟大家分享一下做大数据的日子吧~
首先, 先闲聊一些; 做大数据开心嘛? 还是比较开心的!...
int i = 0,int j = ++i + i++ +++i +++i + i++

**引言:**
笔者是海牛学院27期学员,关于编程之前只接触过一点C,可以算得上零基础。如今学完Java SE已经一周,闲暇之余,特来分享一下我的学习感受。
**正文:**
1.数据模块
编程语言离不开对数据的操作,Java SE把数据分为基本数据类型和引用数据类型。基本...

将文件写入kafka,一直没有返回值,请问是哪里的问题?debug已经跑过,也能正常获取到host和topic


eclipse每次 打开 项目都会消失, 已经第二次了 ,昨天 的第一次,工作空间内的项目只丢失了最近写的,copy导入了一下换了一个工作空间,今天第二次了,新换的工作空间内部项目全部消失了 ,一点也没留下,希望遇到过这类问题的小伙伴可以帮帮我,快崩溃了,写了一天的...
20/09/26 00:03:33 INFO org.apache.zookeeper.ZooKeeper <init>(): Initiating client connection, connectString=nn1.hadoop:2181,nn2.hadoop:2181,s1.hadoop:2181 sessionTimeout=12000000 watcher=org.apache.hadoop.hbase.zookeeper.PendingWatcher@5f058f00
20/0...

这个是运行时的配置参数
orc2hfile -Dtask.id=0924_hangyu -Dtask.input.dir=/Users/hangyumac/hainiu/hbase/input -Dtask.base.dir=/Users/hangyumac/hainiu/hbase/ -Dhbase.zookeep...