Hive常见面试题1.0
hive 的使用,内外部表的区别,分区作用, UDF 和 Hive 优化
(1)hive的使用:仓库,工具
(2)内部表:加载数据到hive所在的hdfs目录,删除时,元数据文件都删除
外部表:不加载数据到Hive所在的hdfs目录,删除时,只删除表结构
(3)分区作用:防止数据倾斜
(4)UDF函数:用户自定义的函数(主要解决格式,计算问题),需要继承UDF类
class TestUDFHive extends UDF{
public String evalut(String str){
try{
return "hello" + str
}catch(Exception e){
return str + "error"
}
}
}
相关文章