一年前,我们收到客户的报告,我们生产的工业机器人出现了莫名其妙的故障。
我们取回了故障机器人,硬件和软件团队进行了各种分析,总是无法复现用户遇到的故障。
我们猜测,原因大概是耦合器松了,导致电机无法带动车轮。
于是,我们重新设计了耦合器。但是,产品都在用户手里,很难一个个回收进行更换。我们就想出了另外一种方法,让用户自己操作,打开机器人,重新拧紧耦合器。
根据用户反馈,这个方法有效,机器人没有再出现故障。
后面整整一年,都平安无事。
正当我们忘了这件事,上个月客户又报告,故障重新出现了。
我们想这一定不是原来的故障,肯定是别的原因导致的。我们取回了机器人,在公司开关了几百次,跟一年前一样,我们无法复现用户遇到的故障。
后来,有人突发奇想,将机器人放入冰箱。第二天早上我们把它拿出来,很神奇,故障就出现了。过了十分钟,故障在室温下又消失了。于是我们明白了,它跟温度有关系。
为了彻底搞清楚问题,公司放午餐的冰箱,箱塞满了机器人。
最终,我们确定有一个组件在特定温度下,会产生噪声信号,导致了故障。只要移除两个电阻就可以修复它。这次真的是彻底修复了。
事后证明,去年的故障也是这个原因。当时,我们让客户拆开机器,重新拧紧耦合器,使得机器内部的温度上升了,所以故障就消失。实际上这个故障跟耦合器完全无关。
再加上后来冬天过去了,天气转暖,故障就再也没有出现。等到冬天再次到来,故障就重新出现了。
我们的机器人属于很简单的那种,只有数百个零件,但是每个零件都可能发现不可预测、难以发现的故障,这就是为什么硬件很难做的原因。
https://threadreaderapp.com/thread/1604018884662951938.html
--
FROM 183.253.146.*