我解决啦,贴出来分享一下,推理出来的0^0 admin.disableTable(userTable) val hcd1 = new HColumnDescriptor(Bytes.toBytes(key)) //表增加family信息 admin.addColumn(userTable,hcd1) //实际上是删除了原有表的所有列簇,然后添加 admin.enableTable(userTable)
不报错,会删掉我的列簇,admin.modifyTable(userTable, htc)感觉这个没用好
1.检查主机之间是否能通信 2.检查防火墙和SELINUX是否关闭 3.agent服务是否启动service cloudera-scm-agent status
有20多个数据库,一个数据库有十几张表,跑任务的话太麻烦,而且跑mapreducer也会耗费大量资源,所以我用脚本传参的方式读取数据库每个表中的文件统计文件行数,这样会快一点吧?
我也是这么想的,所以我写了个脚本读文件内容,统计行数