• Nutanix Node is removed from metadata store 节点离线故障处置

    在数字化时代,企业的IT基础设施扮演着至关重要的角色,而Nutanix超融合系统更是被众多企业认可为提升效能的利器。然而,即便是最先进的技术也难免会遭遇各种技术故障,而这则故事正是发生在这个充满挑战的背景下。 今天我们400服务电话接到了一通陌生的报障电话,这位用户他们的Nutanix超融合1个节点离线,给业务的正常运行造成了一定的影响。秉承着业务至上的原则,我们的技术服务团队在未进行任何商务沟通的情况下迅速远程接入生产环境进行检查。 通过对集群的基本检查发现,其中一个节点为“Node is r…

    基础设施 2023年12月4日
  • DELL R730xd 面板指示灯全亮黄色告警无法开机故障处置

    苏州天剑服务工程师帮客户在IDC上架服务器发现其中一台DELL R730xd服务器面板指示灯全亮黄色,点开机键无反应。 苏州天剑服务工程师尝试对服务器进行放电后故障依旧。 1、检查一下连线是否都正常,电源是否OK,重新插拔一下。 2、内存重新插拔一下 3、主板放电操作一下:移除电源适配器和电池,按住电源按钮10秒钟后释放电源开关,再次连接电源适配器。 多次尝试无果后,使用最小化环境(一颗CPU,一条内存)启动服务器仍无法启动。在苏州天剑服务工程师二线团队的建议下,尝试重新拔插了指示灯面板的控制排…

    基础设施 2023年10月12日
  • Nutanix CVM inode 写满造成集群崩溃的故障处置

    苏州天剑服务工程师在国庆值班中收到用户紧急报障,生产环境中使用的3节点Nutanix集群,分布式存储服务崩溃,在ESXI中所有虚拟机显示为失效状态,存储里面查看Nutanix存储空间也显示为0B,所有虚拟机业务中断,苏州天剑服务工程在收到该用户反馈后,第一时间远程接入用户环境进行处置。 1、环境检查 该套Nutanix超融合AOS版本为6.5 LTS与VMware融合部署,在ESXI检查各个节点上的CVM虚拟机运行正常,但是PRISM后台9440端口无法访问,通过web console进入cvm…

    基础设施 2023年10月2日
  • VMware Horizon View 7链接克隆池迁移新存储

    大多数使用VMware Horizon View链接克隆部署的客户,在将现有桌面迁移到新存储上时都会遇到难题。由于部署链接克隆VM的方式(链接克隆虚拟机是与父虚拟机共享虚拟磁盘的虚拟机的副本),无法通过vMotion存储的操作进行存储迁移。 VMware Horizon View Composer有一个名为“重新平衡”的选项,该选项可用于将桌面迁移到新的存储或在多个数据存储之间进行平衡。 以下简单步骤说明了桌面迁移。在我们的示例中,我们从一个FlashArray存储移动到另一个FlashArra…

    基础设施 2022年12月1日
  • VCSA 7.0u3c日志analytics-runtime.log.stderr体积过大处置方法

    在对某客户VCSA进行巡检时发现日志存储分区磁盘空间已经占满,在进一步的检查中发现analytics-runtime.log.stderr日志体积已经超过6GB,为留足充分观察与判断故障的时间,临时为日志分区进行了5GB的磁盘空间扩容,经过3天的观察,日志体积超过7GB,平均一天超过300MB的增长速度。 经过我们工程师的专业处置,先已成功降低该日志文件体积,实现日志轮转,方法如下: 新建文件vmware-analytics.lr: 保存以下内容至文件: 按esc退出编辑模式,然后输入:wq保存…

    基础设施 2022年5月13日
  • vCenter 7.0u3c 使用关闭 vSAN 群集向导功能导致集群故障一则

    故障描述 在客户现场我们使用7.0u3c的新功能,vSAN 集群关闭向导,对vSAN群集进行停机维护。该集群由四个 Dell R940xa 节点组成,vCenter 位于非 vSAN 节点上。关机是通过各项预检查,在拔掉电源之前vSAN主机已正确关闭。在重新启动vSAN集群后,所有 vSAN 虚拟机都被列为不可访问,并且如果在数据存储中浏览(通过 GUI 或命令行)是不可见的,但是vSAN的容量是正常的。 重启集群的按钮不存在,所以我们工程师按照kb通过命令行手动重启集群。然而,恢复脚本超时: …

    基础设施 2022年4月6日
  • 无法初始化 vGPU“nvidia_a16-1b”的插件“libnvidia-vgx.so”

    我们一位用户在对自家VDI桌面的GPU卡进行升级后,发现无法启动带有vGPU的虚拟机,报错如下: 于是用户与我们的工程师联系排查问题,我们的虚拟化工程师第一反应会不会是GPU卡驱动没有安装好,经过排查确认驱动正常,可以使用nvidia-smi命令: 接着我们的虚拟化工程师怀疑是不是GPU卡的ECC没关闭导致的异常,经查用户使用的是nVidia A16 GPU卡,在对A16的参数进行查询确认后,发现是支持vGPU模式下开启ECC功能。 具体关于ECC的描述可以参考官方文档: https://doc…

    基础设施 2022年3月3日
  • ESXi7.0利用iDRACTools不重启服务器重置iDRAC密码

    对于很多托管在机房或者依赖远程运维的工程师来说,iDRAC是必不可少的管理工具,我们的工程师今天帮助客户运维的时候遇到一个很尴尬的问题,用户密码本中记录的一台服务器iDRAC密码登录不上,现场也没有值班的工程师可以现场协助重置密码,问题又很急着解决,经过我们工程师的努力成果在远程的环境下重置掉了iDRAC密码成功进入iDRAC进行运维工作。 用户服务器是一台DELL PowerEdge R740服务器,操作系统为VMware vSphere ESXi 7.0U3C,在以往的运维经验中,我们曾经在…

    基础设施 2022年3月1日
  • ESXI移除已卸载或不可访问的数据存储

    正常卸载一块ESXi数据存储后,当删除的时候报错Not a known device:naa…,重新扫描存储后仍无法删除。 此时需要开启ESXI主机的SSH功能,使用命令列出永久分离的设备: 此时只需要在WEB上重新扫描存储,或SSH执行命令重新扫描存储即可: 参考链接1:https://kb.vmware.com/s/article/56994 参考2链接2:https://tomaskalabis.com/wordpress/how-remove-unmountedinacces…

    基础设施 2022年2月22日
  • 物理机安装VMware Horizon View Agent

    客户有一天提出需求,需要将一些物理机添加到Horizon的桌面池中,用于用户通过Horizon Client连接桌面,通过命令行即可进行Horizon Agent的安装。 安装完成后,创建手动桌面池,选择非vsphere计算机即可! 参考KB:https://kb.vmware.com/s/article/2003129 参考KB:https://kb.vmware.com/s/article/2001870

    基础设施 2021年9月13日
联系我们

联系我们

400-0512-768

邮件:support@sworditsys.com

工作时间:周一至周五 8:00 - 21:00

分享本页
返回顶部