比如查看一个数据库所有表的记录行数,有没类似元数据一样的存在直接查
比如查看一个数据库所有表的记录行数,有没类似元数据一样的存在直接查
mysql中如果数据不删可以用自增ID看出来,hive是基于HDFS上的文件来做底层存储的,查看表的元数据是查不到行数的,所以必须得把所有文件读一便才知道,这个和关系型数据库的原理是不同的。
我也是这么想的,所以我写了个脚本读文件内容,统计行数
有20多个数据库,一个数据库有十几张表,跑任务的话太麻烦,而且跑mapreducer也会耗费大量资源,所以我用脚本传参的方式读取数据库每个表中的文件统计文件行数,这样会快一点吧?