4.12. 在使用hive的外部表进行读取数据的时候显示 ERROR: text_in: failed to get next tuple. File……
➢ 解答
出现了 missing data for last 17 column(s),这张表有 18 列,这是分隔符不匹配导致的,把一行当作了一整列。在 hive 中,默认的分隔符为一个不可见字符, 在 hawq 的外表设置为(delimiter E'\x01')即可,或者直接查看 hive 在 hdfs 上的文件,直接查看改行数据的分隔符是什么
先找到 hive 表对应的 hdfs 地址,然后参考下面的链接 http://www.oushu.io/docs/ch/import-export.html#hdfs
对于分区的 hive 表,可以用脚本写个循环
➢ 问题原因
pxf 是可以装的。 但是它的功能和 OushuDB 的可插拔存储外部表功能高度重合,且性能较差,目前 OushuDB 不准备兼容。