
Oxylabs 首席运营官:通过机器学习发现规则
他们在内部通过无可争辩的事实逻辑确凿地证明了,计算和推理就像编织和耕田一样是工作,不是人类的头脑在工作,而是钢铁与木材巧妙组合的机器在工作。如果您花时间去做机器可能做得更快的工作,这应当只是为了锻炼自己。
自 Claude Schannon 应用 Boole 的工作成果创造了第一个电路板开始,拉开计算机时代的序幕以来,世界早已发生翻天覆地的变化。正如 Boole 所预测的那样,大部分计算和推理链条现在由“钢铁与木材巧妙组合的机器”来完成。我们发现硅元素可能更擅长做这件事。
Boole 本人一生中所做的事情,他会认为机器是做不到的。他一直在探索控制思想本身的规则。换句话说,他走向了更高层次的推理,高于日常生活的普通计算。
虽然如今的人工智能仍然远远做不到以类似于 Boole 等人的方式来运用哲学,但更巧妙形式的计算思维正在开始成型。机器学习可用于发现生活中一些领域的非直观规则。
机器学习的功能
有关机器学习即将取代解决问题的所有其他模式的言论比比皆是。最普遍的提法之一是,机器学习应当放弃基于规则的方法。
在我看来,这种看法过于理想化了。可以用基于规则的方法来解决的问题,用机器学习去解决是对资源的浪费。模型,尤其是比较复杂的模型,可能成本高得令人望而生畏,并且需要大量维护才能保持准确性。
在计算资源和财务资源都无限的理想世界里,这些差异无足轻重。但是,在商业界,人们总是在严格定义的边界内行事,因为对资源的任何使用也意味着机遇成本。
所以,企业更偏好使用基于规则的方法来解决所有问题。但是,这会牵扯到其他复杂事宜,例如并非所有拥有定义好的边界的问题都可以通过规则解决。
机器学习非常擅长解决两种类型的挑战。对于任何需要基于概率的答案的问题,采用模型来解决的效果比任何基于规则的方法都要好得多。机器学习极其有价值的另一个领域是规则不清晰的情况。
企业可能有时并不确定该如何回答某些特定问题。例如,什么规则应该控制自助结账流程?这种功能的结构安排有几乎无限的可能性,但专家们总是在寻求最好的结果。换句话说,他们更希望自助结账会带来最大的转化率。
机器学习模型产生的推断
常见反对意见可能是,一些机器学习模型,例如深度神经网络,基本上就相当于黑盒子。您永远不能确切知道底层工作原理是什么样的,所以从中提取规则就在很大程度上靠推测,模型起不了什么作用。
幸运的是,在商业应用中,并不需要像试图揭示头脑、语言或宇宙的基础构建块的逻辑学家或科学家那样精确。只要获得能指明正确方向的洞察,就足以坚持按某种方式做事。
换句话说,如果要打造模型来预测自助服务客户系统的最佳结果,不需要定义人类行为的一些铁律。只需要考察肯定会不断变化的一些情况,并设法找出最佳的应对方法。
所以,回到随机森林算法这个例子,只要提供事件会话和用户活动中的足够数据,就可以大致得出最有预测力的输出。这些会表示哪些用户在自助服务流程中会受到最大影响。
这些输出可能不是突破性的,甚至范围也不广泛,因为它们仅适用于相当受限的情况。但它们完全够用了,工程师、设计师和内容作者可以用来执行优化,带来更好的转化率。
这些洞察可以转变为基于规则的算法。因此,利用机器学习模型,我们可以发现间接规则,以便在业务实践中加以实施。
结论
有人认为机器学习将取代基于规则的系统,这是毫无根据的。比起复杂的机器学习模型,创建和维护后者常常效率高得多、成本低得多。因为企业总是重视效率,基于规则的系统得到普遍接受。
与一般认为的不同,机器学习其实可以用于补充基于规则的系统。虽然可能有多种方法可将其整合为单个系统,但前者还可以用于获取洞察,进而在后者中实施。
说到底,机器学习不应该被视为技术问题的万灵丹。它只是众多可能性的一种,应当审慎加以使用。其中很重要的一点就是确保我们在其他系统中制定更好的决策。
作者:Juras Jursenas,Oxylabs 首席运营官