收到项目反馈,客户在使用我们提供的工具部署产品时遇到了困难,在主机添加步骤上遇到了问题,导致实施团队无法继续推进工作,因此向我们寻求帮助。
环境信息:kylin10
架构:arm
初见端倪
在系统部署过程中,针对主机的批量操作,我们开发时采用了ansible剧本。最近遇到了执行过程卡顿的问题,初步怀疑是ansible执行时出现了阻塞。为了验证这一点,我已经发送了一条命令给现场进行测试。
localhost$ date2024年02月19日星期 17:30:41 CST localhost$ ansible all -i "192.168.2.84, -m shell -a 'date' --l become --become-method=sudo --become-user=root -u test192.168.2.84 CHANGED rc=0 >> 2024年02月19日星期 17:33:34 CST登录后复制
果然,一条简单的ansible命令,环境上执行了2min多才返回结果,问题原因就出在这里了,有了大致方向。
ansible实际执行时仍然依赖SSH远程连接,之前遇到SSH连接速度缓慢的情况,初步推测可能是由于SSH连接速度慢导致执行返回速度慢。
检查ssh参数,查/etc/ssh/sshd_config配置
GSSAPIAuthentication no #关闭SERVER上的GSS认证登录后复制
在linux中,默认就是开启了SSH的反向DNS解析,这个会消耗大量时间,因此需要关闭。在配置文件中,虽然UseDNS yes是被注释的,但默认开关就是yes
UseDNS=no #关闭SERVER上DNS反向解析登录后复制
结果发现,项目上这2个ssh参数配置都是和上面一致的,并且手工测试ssh登录对端主机,速度很快
问题分析
没有头绪,只能用linux的strace命令跟踪下系统调用了
查看strace日志发现有大量的select等待,应该是在执行某项操作时长时间阻塞。
使用ansible调试
ansible all -i "192.168.2.84, -m shell -a 'date' --l become --become-method=sudo --become-user=root -u test -vvv登录后复制
命令后加上-vvv就可以看到详细的执行过程了
解决问题
从debug信息中,看到报错”mux_client_read_packet: read header failed: Broken pipe”,执行脚本的地方可以看到在执行python相关的命令,ansible依赖于python,是否和python版本有关系呢?
在网上查看资料说ansible和python存在兼容性问题。
于是检查下python版本,可以看到python默认版本为python2,但是系统上也有python3,尝试将软链接修改python3.7验证
再次执anible命令
执行时间1.3s,看来是ansible和python版本的兼容性导致了这次问题。
以上就是ansible执行速度慢怎么解决的详细内容,更多请关注本站其它相关文章!