Hive常见面试题1.0

2020-07-01 00:00:00 数据 删除 文件 分区 底层

hive 的使用,内外部表的区别,分区作用, UDF 和 Hive 优化

(1)hive的使用:仓库,工具

(2)内部表:加载数据到hive所在的hdfs目录,删除时,元数据文件都删除

外部表:不加载数据到Hive所在的hdfs目录,删除时,只删除表结构

(3)分区作用:防止数据倾斜

(4)UDF函数:用户自定义的函数(主要解决格式,计算问题),需要继承UDF类

class TestUDFHive extends UDF{
public String evalut(String str){
try{
return "hello" + str
}catch(Exception e){
return str + "error"
}
}
}

相关文章