# 安全认证与权限管理的必要性
* 非安全集群


* 安全认证集群

由Cloudera公司开发,有开源版本与商业版本,Cloudera公司2018年和hortonworks公司合并,较为出名的贡献为impala是由Cloudera公司开源贡献给Apache基金会。大数据平台在国内各大企业中应用广泛,甚至开源...
# cdh添加sentry服务
Cloudera Manager -> Cluster 1 -> Add Service -> Sentry

选择Sentry Server所在服务器,Gatway可以不选。

docker tag image_name tag_name #将镜像打标签
docker push image_name repository_name/image_name #repository_name...
这几天 研究了一下 会了一些转换 ,但是感觉 还是不太会 怎么个流程去做阿 拿到原始表 把数据转换到ods层 然后到dwd呢 抽取ods几张表中需求的字段 转换过去吗!
# K8S将pod调度到指定nodes上运行
#### 两种方式
##### 方式1:强制固定
* 编写yaml,添加参数(node节点名)
```sh
vim text.yaml
nodeName: worker01 #添加节点名参数
```
* 具体yaml
```yaml
apiVersion: v1
kind: Pod
metadata:
name: text
namespace: t...
# 1 Linux概述
## 1.1 操作系统简介
### **1.1.1 为啥需要操作系统呢 ?**
计算机是一台机器,它按照用户的要求接收信息、存储数据、处理数据,然后再将处理结果输出(文字、图片、音频、视频等)。计算机由硬件和软件组成:
- 硬件是计算机赖以工作的实体,包括...
# 2 Linux安装
## 2.1 安装虚拟机VMware12
### 2.1.1 VMware简介
VMware总部位于美国加州帕洛阿尔托,是全球云基础架构和移动商务解决方案厂商,提供基于VMware的解决方案,企业通过数据中心改造和公有云整合业务,借助企业安全转型维系客户信任 ,实现任意云端...
# 3 配置静态网卡
## 3.1 为什么要修改静态IP
因为如果采用DHCP来自动获取IP的话 只要一断网 WM就会重新获取当前IP的下一个IP,所以必须改成静态的来防止这种卑鄙的现象
DHCP : Dynamic Host Configuration Protocol,动态主机配置协议,在指定的ip段内生成ip地址...
# 1 linux的用户与用户组
## 1.1 概述
Linux是一个真实的、完整的多用户多任务操作系统,多用户多任务就是可以在系统上建立多个用户,而多个用户可以在同一时间内登录同一个系统执行各自不同的任务,而互不影响。
root :系统维护
www:网页修改
ftp...
# 2 linux用户组实战
因为用户组与用户是一对多的关系,用户肯定是要从属于某个组的,所以我们先从用户组操作起来
## 2.1 查询用户组
### 2.1.1 用户组组信息的查询
执行 :
```
#cat 命令,查看某个文件的内容 /etc(配置文件目录)/group(配置文件)
[root@lo...
# 集群操作
* 查看集群健康情况
```json
GET /_cat/health?v
```

* 查看索引状态
```json
GET /_cat/indices?v
```

## 安装es集群
* 解压elasticsearch安装包,修改配置文件
```sh
vim /opt/elasticsearch-7.13.1/config/elasticsearch.yml
```

* 查看索引状态
```json
GET /_cat/indices?v
```
.vim
```shell
o:光标下一行输入
dd:删除本行内容
ndd:删除包括本行及以后的n行文本
ZZ:保存并退出
gg:移动到文件开头
G:移动到文件末尾
gg回到文件开头 dG删除所有的文本内容
```
### 2)echo
```shell
e...
有什么方法可以在浏览器的前端页面中,通过开发人员工具,找到某一块数据的来源
?
```
JavaPairDStream<Long, List<Long>> tatoalOrMmeReivers = transform.mapPartitionsToPair(m -> {
List<Tuple2<Long, List<Long>>> outList = new LinkedList<>();
Long minTime = 1609430400000L;
Long maxTime = 205...
# Haoop集群搭建
## 1.安装rzsz
```shell
yum install -y lrzsz
```
### 配置阿里云 yum 源
### 1).更新yum源 下载repo
```shell
yum -y install http://mirrors.aliyun.com/repo/Centos-7.repo
cp Centos-7.repo /etc/yum.repos.d/ && cd /etc/yum...
yarn队列分为三块,一块儿default 一块儿跑批任务,一块跑流任务,后面流任务队列资源不够,如何进行调优?
# gauss200简介
MPP即大规模并行处理(Massively Parallel Processing ),在数据库非共享集群中,每个节点都有独立的磁盘存储系统和内存系统,业务数据根据数据库模型和应用特点划分到各个节点上,每台数据节点通过专用网络或者商业通用网络互相连接,彼此协同计算,作为整...
# 连接gaussdb
* 切换用户
```sh
su - omm
```
* 加载环境变量
```sh
source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile
```
* 连接数据库
```sh
gsql -d postgres -p 25308
```
* 创建用户
```sql
create user xiniu with password "xiniu...
# 数值类型
* 整数类型
| 名称 | 描述 | 存储空间 | 范围 |
| -------------- | ------------------------------------------- | -------- | -------------...
# 字符操作函数
* length(string bytea, encoding name )
描述:指定encoding编码格式的string的字符数。在这个编码格式中,string必须是有效的。
返回值类型:int
```sql
SELECT length('jose', 'UTF8');
/*
length
--------
4
(1 row)...
# 设计规范选择
在实际生产过程中,尤其是在模型设计的过程中经常会涉及到范式化问题,我们分为范式化和逆范式化两种。
| 模型 | 数据冗余 | 性能...