工业人工智能应用–超越概念验证
在行业背景下应用人工智能的常见误区
人工智能在我们生活的各个领域的进步使其成为当今最值得赞赏的技术之一。已经取得了令人印象深刻的成功,而且人们的期望值也在不断提高。在这一领域也观察到一种将技术从消费者领域转移到工业应用的趋势。然而,根据一些分析报告,工业人工智能项目在大约75%的情况下从未超过PoC。为什么会出现这种情况?
热衷于建立在人工智能在消费者领域的成功上,往往使工业应用的一些重要特性被忽视。在这篇文章中,我们列出了一些必须解决的工业挑战,以使人工智能项目取得成功。
Index
数据的重要性
今天被称为人工智能的技术主要是神经网络(另见:机器学习)。不谈细节,它们可以被看作是数学函数–通过训练好的网络从一组输入变量中近似地得到一个输出变量。
为了训练该网络,需要一个大型的标记数据集。这些是数据对,其中与输入有关的输出是已知的。然后对输入和输出之间的网络进行调整,以便产生这个已知的输出。由于神经网络可能有大量的内部变量,因此需要大量的训练数据集以达到满意的结果。一旦网络经过训练,就可以应用新的输入数据,网络就会产生来自训练数据的输出。
与其他形式的软件不同,神经网络的功能很难被描述算法的编程代码所定义。神经网络算法是通用的。神经网络所解决的问题的种类是由它所训练的数据来定义的。
因此,人工智能解决方案的质量完全依赖于训练数据的可用性和质量。也就是说,网络只能够近似于训练数据集中所涉及的数据。如果给它猫和狗的照片,它将能够告诉你’这可能是一只猫’,但它永远不会检测到一头大象。此外,不能保证网络确实解决了一个给定的数据集,即使它是来自于它所训练的空间内。
在消费者应用中,这些数据集大多是可用的,通常在大型科技公司的数据库中。而在大多数人工智能的消费者应用中,一些错误标记的输出是可以的。如果500张猫的图像被正确识别,只有少数几张没有被识别,这就足够好了。对于工业应用来说,这是不一样的。为什么呢?
在工业应用中,人工智能支持的决策可能对工业生产有重大影响。另一方面,收集足够的信息是相当困难的,而且可能也很昂贵。如果人工智能系统的结果是错误的,它们可能会导致损失,甚至损害或更糟。偶尔对人工智能系统的误解多半是不能接受的。下面是一些关于在工业人工智能项目中需要观察的提示。
启动–在开始一个人工智能项目之前
在开始一个人工智能项目之前,必须首先澄清一些问题。第一个也是最重要的问题是–令人惊讶的是–经常被忽视的问题。你想解决什么问题,以及为什么。这个问题必须有足够的相关性,以证明所做的努力是正确的,也就是说,必须有一些基本的商业案例考虑。下一个问题是,用什么技术来解决这个问题。人工智能可能是,也可能不是最好的解决方案。它可能不是的一个重要原因是缺乏数据,这导致了一个相关的问题:我们有关于要解决的问题的数据吗?
最后,解决方案必须付诸于行动。很多时候,这包括扩大规模。因此,如果你尽早考虑你是否不仅有来自一台机器的PoC数据,而且根据你的商业案例的要求,从其他机器上获得数据是否可行,这将是很有帮助的。
找到正确的问题是一个商业决定,因此让我们更深入地研究其他问题。
信息–人工智能应用的数据
工业工厂产生大量的数据。为了控制一个机器人,或一个钢铁厂,或任何其他工业过程,传感器被用来控制设备,使其按照设计行事。这些数据中的大部分被立即丢弃。但它是产生的,并且可以被记录下来。所以应该有足够的数据来训练人工智能?
使用数据的挑战是它是否包含所需的信息。如果你想预测故障,你必须要有关于故障的数据。由于工业设备很少发生故障,只收集一台机器的数据可能是不够的。为此,你需要从许多设备故障的装置中获得数据。如果你在经营自己的工厂,你可能没有所需数量的机器,如果你是一个供应商,你可能知道机器在哪里和为什么发生故障,但你的客户可能不会给你数据。为了获得数据,你必须向你的客户提供一个价值主张,为什么他应该这样做。
此外,使用人工智能来重现你已经拥有的信息,是没有效率的。由于过程数据是由过程的物理学关联的,用原始数据训练人工智能系统可能会揭示那些物理学规律。但那些是已知的,那些是在工厂工程中应用的。你想应用人工智能来检测那些不容易被你的工程数据所解释的影响。因此,你必须从数据中删除已知的东西,在你不知道的东西上训练网络。
总结:要成功地使用人工智能,你需要数据,这些数据包含你想要实现的正确信息。这些数据可能在不同的地方,以不同的格式存在。如果它不是现成的,请注意,收集它将很容易消耗你的人工智能项目的大部分预算。
影响 – 人工智能的结果
人工智能可以取得令人印象深刻的结果,但它也可能导致令人惊讶的失败。而且与传统软件不同,它很难测试。即使是输入数据的微小变化也可能导致完全不同的结果,而神经网络的性质并没有揭示出结果改变的原因。它也没有揭示出它得出正确结论的原因。
在工业系统中应用人工智能时,你必须意识到它的缺点和风险,并且必须用其他技术手段来减轻这些风险。请注意,假阳性和假阴性都不能被排除,这是你的系统和流程设计必须考虑的问题。一个传统的监督系统或安全系统,确保人工智能部分保持在合理的操作范围内是必要的。
总而言之:在人工智能有优势的地方应用它,在它有弱点的地方不要试图扩大它的范围。要意识到这些问题,并以替代的过程和技术来覆盖它们。
实施–应用人工智能
一旦有了最初的训练数据,你就可以开始了。你的PoC很有可能会成功。要把它变成一个生产中的系统,仍然有其挑战。
一个关键问题是整体架构:正如我们提到的,训练系统需要大量的数据,以及大量的计算能力。对于这两个要求,云解决方案在很多情况下都很适合。然而,要应用训练好的网络就不那么复杂了,可以在本地完成,甚至可能在专用的AI芯片上完成。速度、数据的可用性、安全、隐私,也许还有其他参数,都要推动你的架构决策。
如果你想从操作中学习,你的神经网络必须偶尔被重新训练,模型必须被更新,等等。这可能需要额外的IT资源,而在PoC中是不需要的。
人工智能系统的一个令人讨厌的特性是,它不能保证PoC的训练数据能创建一个在类似但稍有不同的环境中工作的网络。因此,将一个解决方案转移到另一个装置有其挑战,目前正在研究解决。
如果考虑到来自各种装置的输入数据进行训练,系统可以对这种变化更加强大。回到之前的说法:在项目的早期就考虑这个问题,因为你可能会冒着再次为下一个客户花费高额的数据收集和清理工作的风险,而你可以重新使用在训练人工智能上花费的少量努力。
结论
我们怎么强调都不为过,良好的、有代表性的、包含你的解决方案所需信息的训练数据集是成功的人工智能解决方案的关键。确保你有这样的数据,最初,以及在你的解决方案的生命周期内。但最重要的是,要知道你希望你的解决方案执行哪些任务。在适合的地方应用人工智能,并将其与能够更有效地完成该任务的其他组件相结合。
Comments are closed.