一、hive中count的数据类型?
可以在count里使用case,when,distinct等处理,满足日常数据统计需求。
二、hive在hadoop生态圈中的地位?
hive在dadoop生态圈中属于基础数据建设,就像你建房子需要打地基一样。
三、如何用hive查询hbase中的数据?
方法有两种:
1.一种是通过Java,直接读取数据,然后在插入hive中
2.第二种是整合hbase,hive。
整合后,再创建一个表,然后将数据导入新建的hive表中
四、如何将hive数据入库到数据库中?
可以使用Sqoop、DataX、或者Hive存储过程来完成。搜索"lxw的大数据田地",里面有很多关于Hive的文章,肯定能找到你想要的。
五、hive数据中最小的粒度是?
对于Hive分区表,因为最小粒度是表级别。因此,元数据统计信息也是表级别的。
六、hive库中的数据能直接导出吗?
在命令行,使用以下语句,会将数据到处至csv文件
hive -e 'SELECT * FROM table' > table.csv
七、如何将excel中的数据导入hive仓库中?
将存放在excel表中的数据如何导入到hive中,首先前提是excel表中数据类型以及长度要和hive仓库中表的字段属性一致,否则会报异常。其次因为建表的时候,已经定义了表的分割符号(row format delimited fields terminated by ‘,’),所以不能直接将excel表格中数据导入的hive仓库中。处理方式如下:
先将excel表中数据另存转化为data.csv格式,转化为.csv格式的文件默认就是用“,”进行分割的,可以用notepad++打开data.csv格式查看。然后再讲数据导入到hive仓库中即可。但是执行如下导入语句时,发现报错,显示Wrong file format。
检查以后发现,因为在创建表格时,使用的是RCFILE存储格式
八、hive加载数据文件到数据表中的关键?
关键就是他的数据一定要准确数据不正确,是没办法对话的。
九、在hive数据库中怎么查看表结构?
你好。
先建一个hive表,临时表即可,然后把select的数据写入临时表,然后用sqoop或者自己写程序导入db2
十、hive如何通过insert语句将数据插入表中?
从文件加载数据进表(OVERWRITE覆盖,追加不需要OVERWRITE关键字)
LOAD DATA LOCAL INPATH 'dim_csl_rule_config.txt' OVERWRITE into table dim.dim_csl_rule_config;
--从查询语句给table插入数据
INSERT OVERWRITE TABLE test_h02_click_log PARTITION(dt) select *
from stage.s_h02_click_log where dt='2014-01-22' limit 100;