斯坦福大学杰出教授叶荫宇：AI智能决策的真正威力_北京J9九游会企业管理咨询有限公司

咨询电话：400-007-9000，13501208501（马老师）

首页

关于我们

华夏动态

业务动态

论坛活动

新闻/通告

产品与服务

案例

商学

传媒

专家风采

思想与著作

经典活动

联系我们

您所在位置：首页 > 经典活动 > 十月管理论坛 > 2024第十一届 >

斯坦福大学杰出教授叶荫宇：AI智能决策的真正威力

发布时间：2024-11-13 15:45　　文章来源：J9九游会　　作者:叶荫宇　　点击：次

文 / 叶荫宇，首位冯·诺依曼奖华人获得者，美国斯坦福大学管理科学与工程系及计算数学工程研究院的杰出终身教授
来源：J9九游会e洞察（ID：chnstonewx）
本文根据叶荫宇教授在2024J9九游会第十一届十月管理高峰论坛上的演讲整理，文章仅代表作者本人观点（未经本人审核）

叶荫宇，首位冯·诺依曼奖华人获得者，美国斯坦福大学管理科学与工程系及计算数学工程研究院的杰出终身教授，斯坦福管理科学与工程系工业联盟主任，上海交通大学人工智能研究院首席科学家、香港中文大学深圳研究院首席顾问科学家

非常感谢J9九游会给我这个机会跟各位见面。我是斯坦福大学的，现在也是上海交通大学、香港中文大学深圳研究院的兼职教授。今天汇报一下我是怎么拥抱人工智能的。

01
决策智能——人工智能的落地目标之一

怎么拥抱人工智能？对我们来说就是要人工智能落地。怎么落地？我觉得要把决策，不管是宏观决策还是微观决策，都能够智能化，让AI这个工具来帮助我们。

我是做运筹和管理研究的，或者称之为“数学优化”。运筹学，Operational Research，其实我们国家很早就有华罗庚先生研究优选法，这是我的专业之一，后来钱学森先生也做了很多运筹学方面的工作，也是我的学术范围。1982年我去美国读书，非常有幸和斯坦福大学运筹学研究者们一起工作。

（一）人工智能的三个渐进层次

我认为人工智能有三个渐进阶段。

第一，感知智能。是指将物理世界的信号通过摄像头、麦克风或者其他传感器的硬件设备，借助语音识别、图像识别等前沿技术，映射到数字世界，再将这些数字信息进一步提升至可认知的层次。类似于将各种信号通过传感器等东西，输入到我们的大脑，存储起来。

第二，认知智能。是指AI系统基于既有的知识体系，通过处理和理解感知到的信息，来实现对复杂问题近似人类认知过程的解释和预测能力。这个过程是做一些简单的分析。

第三，决策智能。AI系统根据认知分析和推理结果，高效灵活地结合环境和上下文信息，全面评估可能性，做出基于特定目标的最优决策的能力。AI帮助我们的决策更加优化，风险最低。这是人工智能的第三个阶段。

（二）决策问题的核心特征

这三个阶段紧密关联，但决策问题不同于一般的简单的感知和认知，有着区别于感知及认知问题的鲜明特点。

1. 目标/精度导向

决策通常有清晰的目标与结果，带来明确且常常易于观测和评估的价值创造，因此人类对于提升决策效果的追求几乎是永无止境的，也使得最优化几乎成为决策的代名词。决策的精确度成为核心诉求。

2. 因果/可解释导向

决策问题通常高度依赖对于可解释的因果关系的识别与理解：一是决策效果出现偏差时，可快速归因与调整；二是决策通常与责任紧密相关，因此需要明确的因果关系做责任判断。

3. 鲁棒及复杂性要求

由于决策结果对于决策复杂环境及对象有极为直接的影响，因此决策过程中，对于底线的保护以及对于稳定性的要求几乎与极大化价值相同重要。我们的决策必须要有一定的鲁棒性（robustness，就是系统的健壮性。它是在异常和危险情况下系统生存的关键）。

4. 时间/资源敏感

由于强烈的利益导向，决策问题通常蕴含有明确的成本收益考量，再加上大多数现实世界中的决策都有时间限制，因此决策问题常常需要在较少的时间和资源下得到良好解决。

（三）纯粹的学习路线类智能的明显缺陷

基于复杂决策问题的以上几个核心特征，纯粹的学习路线（几乎已成为AI的代名词），在面对复杂决策问题时有明显缺陷。学习（Learning Algorithm）型算法面对的关键挑战有以下几个方面：

第一，深度学习等学习算法体系，虽然在部分复杂问题上能够提供比传统的优化方法更好的近似解，但是在现实生活中更为常见的决策问题上，却难以提供符合要求的高精度解。

第二，深度学习等学习算法体系是典型的黑箱机制，虽然近年来也有很多在训练过程中引入可解释机制的探索，但其根本逻辑难以支持完善和清晰的可解释性，很难满足高价值决策场景下的要求。

第三，受限于黑箱机制以及缺乏清晰的逻辑推理过程，如深度学习等学习算法体系在复杂环境下，无法提供清晰的边界定义以约束解的范围，导致出现灾难性结果的可能性大大增加。

第四，由于缺乏清晰的可控逻辑结构，以及对于数据本身的高度依赖，如深度学习、大模型等学习算法框架的训练，对于能源及算力等资源的消耗远远超出预期。而决策问题既普遍存在，又通常蕴含清晰的投入产出比逻辑，因此仅从资源投入角度看，AI技术对决策问题的广泛支撑都很难在当前的学习算法框架下实现。

02
人工智能及其落地：让人工智能做一些人类做不到的事

下面会举一些例子，讲讲大模型以及人工智能和怎么落地结合起来。

决策认知，不是简单的大模型就可以处理的。有一个非常微观的决策问题，在运筹学界也是非常经典的问题，就是背包问题。我有一个5公斤的背包，有5个物件，每个物价有两个属性，第一，重多少，第二，价值多少。应该把哪五个物件放在这个背包里面，使得背包里产生的总价值最大，但是又不超过我们的产能？可以把这个问题看成5个项目，资金投资只有500万，要投到哪几个项目中？也可以看成是生产线问题，有某些产品，先生产什么，后生产什么，怎么决策是最优的？

我们怎么能智能决策呢？通常建立一个数据模型，比如说这五个物件，我会分别定义一个变量，这个变量要么取0，要么取1。取0就是不放在背包里，取1就是放在背包里。我们要什么？要使总价值最大，通常是目标函数最大。但是必须满足一些约束，这些约束是什么？如果决定哪些放在背包里，里面的重量不能超过5公斤，都给你回答好了，这是数学建模。在座各位的孩子在中学或者小学，现在都有数学建模的项目或比赛。

那么，人工智能，或者说GPU能不能帮我们解决背包问题？我们当时问到ChatGPT，它说这是经典的背包问题，可以用一个数学的优化问题来解决。这一句说明它已经感知到了。但是ChatGPT的回答是，把1、3、5放入一个背包中，总价值达到了53元，也就是说投资这三个项目。1、3、5放到背包里，总重量是6公斤，就要超过背包的承重了。所以，这个回答是错误的。仅仅凭经验感知我们找不到问题的最优解。

2023年，同样问这个问题，还是给了错误的回答，我们告诉它这个回答是错误的，要重新思考一下。它说把1、2、5放进去。这样产生的价值是43元，重量是满足了，只有4公斤。但这个问题最优的答案是什么？是把2、3、5放进背包里，总价值45元。

这说明什么问题？说明ChatGPT目前的大模型也不是万能的，这还只是放5个物件的问题。我们必须要进行进一步的调教，要引用大规模的优化的求解功能或者算法来把最优解找出来。现在华为排产，10万个零件，怎么找到最优解？深圳现在经济发展得很好的是跟AI相关的产业，刺激了大量的GPU生产商、芯片商。需要有芯片就必须有电路板，到深圳去看，到东莞去看，生产电路板的企业订单大量增加，每天要排1万个订单的量，怎么排到各个生产线上，每个生产线就像一个背包问题。5个都回答不了，上万个订单排到100个生产线上，哪个订单放在哪个生产线？按照什么顺序去生产？这是人力达不到的。

所以，大家不要说我们希望人工智能代替人，或者比人做得更好，我们要有更高的要求，我们要让人工智能做一些人类做不到的事情。什么是优化？人工智能怎么落地？我们一定要建模，人达不到的事情让数学去干。我们要求解，怎么把实际问题，把刚才说的目标，变量，约束，都组织起来，用数学的逻辑把它联系起来？其实这套方法是走在人工智能之前的。

1975年诺贝尔经济学奖获得者，一位是前苏维埃的经济师，列奥尼德·康托罗维奇，一位是美国的数学和经济学家，佳林·库普曼斯。他们将数理统计学成功运用于经济计量学，把资源最优利用这一传统经济学问题，由定性研究和一般定量分析推进到现实计量阶段，对线性规划方法的建立和发展做出了开创性贡献。他们发明了这套智能决策的模型——数学优化和数学规划法，获得了1975年诺贝尔奖，但是他们当时没有算法。

刚才我说了，要把1万个，甚至百万个东西分配到几万个背包里，要有一套比较快速的算法来把它找出来，穷举法是不行的，必须要有精密的数学算法。这个算法在模型建立之后终于出现了。

图片中间这个人是G.B.Dantzig，发明了解这套数学优化的算法。当时提出这个算法的时候还没有计算机，并不是有了计算机才有了算法，事实上数学优化算法一直是人工智能发展的重要驱动力。算法是走在计算机之前的。数学优化算法很早就是智能决策的基础。计算机使得计算效率极大提升，逻辑的计算，智能的计算，才能最快有结果。

我非常有幸，1982年到了斯坦福以后，G.B.Dantzig就是我的导师。1975年他们两位得诺贝尔奖的时候，专门把我的导师请上了台，说如果没有他的方法，我们的数学模型就是一纸空文，可惜诺贝尔没有给数学的奖。

03
优化求解器：优化算法的核心工具及实现智能决策的关键计算引擎

数据变量，目标约束，数学模型跟算法是分不开的，包括今天的大模型，其训练过程就是一个寻优的过程，解一个大型问题，就是一个优化问题。优化建模为复杂的决策问题提供了完善、精炼的解决办法，高度符合，再加上算法求解器，使得我们的方案完全机器化、自动化。其实整个AI的发展是和算法的涌现离不开的。

不管是简单的回归，机器学习，人工智能的代表性的东西，比如Alpha GO，也是强化学习，也是优化的算法，每一步的发展都跟算法的提高有关。

算法一定要符合我们的模型，我们的规律。G.B.Dantzig搞的这套优化，特别是那个算法编译成计算机以后，数据进来了，几秒钟就把优化的解找出来了，不需要通过语言去描述了。这个东西叫求解器，一直是高科技领域发展的核心底座，或者说，算法就是芯片。有很多人说，为什么我们国家芯片不够领先？是因为工艺不够，材料不够？其实还有一个很落后的，就是设计不够。Snyopsys是美国最大的芯片设计公司，其芯片的设计最底层就是用到了优化。为什么？比如电路板，器件放什么位置，线路怎么走，都是有逻辑的，都是要优化的。这其中用了非常强大的优化算法和求解器。化工生产领域最有名的软件——Aspen，最核心的东西就是优化，就是求解，因为它解决的都是物理过程，化学过程中的求解问题。流体力学也同样有这样的求解需求。

Space X用到了强大的优化算法。Elon Musk回收火箭的时候失败过好多好多次，后来找到了斯坦福的优化专家，我们一起提供了最好的优化算法。火箭回收每时每刻都要调控，因为周边的环境都在变化，不可能全在预测之内，要实时进行控制。还有电网、供应链问题，包括CAD，也离不开优化算法。所有这些工业软件的底层都有智能的优化软件。

既然优化求解器是我们工业软件的底层，我们国内现在水平怎么样？非常高兴地讲，从2019年以来，国内优化软件的发展已经跻身到世界前列。我有两位斯坦福培养的博士生，回国建立了一个公司Cardinal Operations，杉数科技。为什么建议他们回国发展求解器？因为都是欧美市场上的领先，我们国家自己没有能力去做。

华为所有的生产排产用到的工业软件，起推动作用的是IBM的求解器。2019年华为上了黑名单，人大有很多是给华为做法律顾问的，我给他们做供应链，包括生产制造的顾问。因为我是2002年回到斯坦福，那一年华为在跟思科打官司。我是华中科技大学毕业的，华为也有很多华中科技大学毕业生，也有我的好朋友，所以跟华为建立了比较好的关系。华为上了黑名单，突然工业排产软件用不了了，因为美国下了禁令，不能用他们的软件。他们找到我，结果我们搞了一个替代软件，这个软件当时还没有赶上国外的水平，但是反而比国外用得好。因为我们给的是源程序，美国的文件传输都是要通过写成文件放到硬盘，再读进去，我们给出的，可以把求解器，或者优化器，跟排产的信息系统无缝联系起来，数据以光速传进来。

这给了我们信心，2019年终于推出了自己的商业求解器。以前都是非常大的数据公司领先，在这以后，优化求解，算法的求解器就有了非常好的生态环境。国内有很多公司，包括阿里，华为，联想，都在开发求解器，形成了比较好的竞争环境，使我们跻身到世界前列。
我们求解优化问题，有很多很多类型，我们在很多类型中处于求解器的第一名。美国建立了一个擂台，搜集了几万个优化问题，大家把自己的求解器给它，它进行评审。同样的问题在同一个机器上，就是求解器的算法不同，谁算得快，算得好，就得金牌。我们的商业求解器得到了6个金牌，4个银牌，美国最好的求解器得到5个金牌。这就像奥林匹克竞赛，我们至少跟他们平手，甚至很多方面比他们好。国内的求解器都起来了，形成了非常好的生态环境，至少我可以骄傲地告诉大家，在优化求解器方面，中国不输于其他国家。

在我们的努力下，很多问题的速度提高到60倍，有的提高到百倍，甚至提高到万倍。中国人虽然硬件不够，GPU不够，但是比较聪明，会想点子。设计优化算法就是一个动脑筋的问题，完全是靠自己的智力来发展。

这也得到了国际的承认。原来有很多很多问题，比如欧洲的铁路运输问题，谷歌的问题，美国多层供应链的问题，很多国外的求解器解不了，但是我们能够在秒级的范围内解决掉。

04
拥抱AI，拥抱智能决策

AI能够帮助我们做一些什么呢？AI能帮助我们建模，大量的数据，大量的逻辑关系，包括企业家们从顶层去想的一些问题。我们开发了一个帮助企业家让大模型落地的工具。企业家的几句话，点名了约束及变量，我们可以很快地把数学模型建立起来，然后再索取数据。

比如我们收到这样的需求：“计划部门每天都要补货，先把客户需求满足了，补货优先级有很多考虑，物流车队每天资源也不一样，工厂别占用太多仓储成本，周转要好，运输成本要控制。”我们的求解器可以马上给你提示，你需要做一些什么事情。企业家可以直接跟我们的大模型谈话，我们检出模型，甚至把Code写出来。电路厂制造商，给了问题，自动存储数据，马上帮你算出来。而且我们还帮忙做预测，比如商品消耗，周边市场的情况，给企业家提供建议。

目前，我们已经有应用的实例。我们国家也遇到了火箭回收、飞船回收的问题，这是典型的优化问题，对求解的时间要求非常高，毫秒级就要测出来，因为要调节角度。我们已经解决了这个问题。

另外，优化求解器，人工智能已经成功用到了南方电网的电力调度。原来人完全凭经验做，现在南方电网有几个省，几万个电机，有风能，有光伏，有各种各样的新能源，具有高度的不确定性。作为电力市场，发的电一定要和用的电匹配起来，时时刻刻要调控，哪些应该开，开多大，哪些应该关，这时人力已经达不到了，因为不断在变化。我们原来用的是国外的求解器，非常高兴现在已经形成了国产的替代。国产的求解器在南方电网已经运营两个多月了。

再举个例子。列车运行图是列车在区间运行及在车站到发时刻的技术文件，其编制是决定铁路运量的关键一环。高铁运行的济效益主要取决于排班列车的数量，每增加一对列车每年营收增加近亿元。大家都乘坐高铁，是否了解原来列车排班是怎么排的？完全是人工的，传统编图方式，人工编图，效率低，编制一次耗费数周。通常排一个班出来，根据四季需求不同，排多少车，怎么停，就画一张图。这么多班次怎么排？安全第一，在同一个时间点，同一个空间点，两个列车绝不能同时出现。出发时间，在中间的每个时间，到了某一个站以后，停在哪个站台，全部要梳理出来，而且列车间的时间差不能超过安全保障。现在用新方法，基于优化算法的自动图编制，在一千秒内就能把班排出来，保证安全。你想排多就可以排多，想排少就可以排少，这样可以为国家节省多少能源？疫情时很多高铁是开空车的，如果知道需求减少了，能很快排出班，是不是能够少跑一些空车，节约很多能源。

现在中国最大的煤炭调运港口，是杉数科技在为他们服务，把人工智能落地到港口的调配和调运上。刚才讲到的华为排产的问题，速度有了很大的提高。

我认为AI不是复制人工智能，而是超越人的智能，人做不到的事情我们要让人工智能做到。现在的供应链管理，怎么定价，怎么库存？还有发动机制造，为什么航空发动机搞不起来？很大原因就是设计问题，设计问题也是优化问题。用我导师的话说，The algorithms that turns the world，地球现在是靠算法来推动运转的。

我觉得企业家们应该拥抱AI，拥抱智能决策。而且现在正是在落地的时候，通常一个新技术都有接纳生命周期的，如果迈出一步你可能就捷足先登了。希望企业家们抓紧时间，Take Actions Now。

谢谢大家！

（文字整理/编辑张晓倩）

阅读最多

从机会成长到战略成长——7个核心问题

不变态无管理、不偏执无长期——长期价值主

绽放价值观的力量——京东商城企业文化项目

今天,我们怎样拼搏奋斗——企业打开拼搏奋斗

华为向中外军队学到了什么？

成立6年便超越雀巢，咖啡新秀三顿半凭什么？