由于集群使用了kerberos,用户3台客户端,1台可以使用,两台不能使用
不能使用的机器分别是因为连接metastore和namenode失败
异常信息如下:
上面的异常信息表面看是kerberos问题,通过重新给这两台客户端生成keytab文件,发现还是不行
登录到客户机器,然后查看/tmp/用户/hive.log日志,发现当前机器的时间比正常机器快了5分钟
把客户端机器进行时间同步之后hive就能正常使用了
查看metastore的日志发现有时间不同步的异常信息,查找关键字clock就能找到异常
集群的时钟必须同步,一旦不同步超过一个限制范围,就会导致kerberos认证异常