FAQ-hive中的数据比源端的数据多
更新时间: 2025-07-07 18:30:40
阅读 1125
问题描述
问题描述/异常栈
hive中的数据比源端的数据多
解决方案
修改表的存储格式,推荐使用parquet。
问题原因
如果hive表的存储格式是textfile,且行分隔符为\n时,检查源端的数据是否包含换行符。
作者:常惠渊
文档反馈
问题描述/异常栈
hive中的数据比源端的数据多
解决方案
修改表的存储格式,推荐使用parquet。
问题原因
如果hive表的存储格式是textfile,且行分隔符为\n时,检查源端的数据是否包含换行符。
作者:常惠渊
以上内容对您是否有帮助?