魏晨阳：“负责任的AI”意味着安全、公平、可持续、普惠，警惕人工智能日新月异中偏见和歧视的出现

时间：2023-05-30 14:29:52

5月29日，北京市海淀区人民政府、北京市西城区人民政府、清华大学五道口金融学院主办2023中关村论坛“金融科技论坛”。清华大学金融科技研究院副院长魏晨阳主持了圆桌对话“增量博弈到存量博弈，金融业如何提质增效”。对话嘉宾中国银行软件中心副总经理康钧伟、北京银行首席信息官龚伟华、中电金信常务副总经理冯明刚、度小满首席技术官许冬亮、华控清交董事长张旭东围绕圆桌主题，对金融科技分享了不同的观点。

会后，魏晨阳接受了财联社的采访。他表示打造垂直领域的人工智能大模型，关键是数据投喂。训练过程、时长、效率大同小异，数据质量决定了模型的训练结果。同时，他提示人工智能可能存在“偏见”，如何设计“负责任的AI”是当前全球多方共同面临的棘手问题。

高水平人工智能垂直模型的关键是数据投喂

财联社：去年以来，由ChatGPT引发的关于人工智能的关注热度持续不减，我们说了很多年的数字技术也好，以ChatGPT为代表的人工智能技术也好，在金融领域如何应用？

魏晨阳：ChatGPT本身是大语言模型的一个突破，提供了非常强有力的工具。与以前相比，这个工具具备了推理能力、生成能力。不仅可以深度梳理和分析数据，还可以通过强大的推理和生成能力，与人的交互使层层递进的学习、分析、设计、创作成为现实。它的应用场景很广，包括语音对话，文字图像生成等。对于金融领域，应用场景也非常广泛。比如研究环节，股票分析师从分析信息到形成报告的全过程中，这类工具可以高效进行信息梳理、图标生成及简单展示等重复性工作，极大地解放劳动力，实现巨大的效率提升。最近阿里达摩院和新加坡南洋理工大学针对ChatGPT在金融行业数据风险工作进行评估，得出初步结论：从工作效果看，GPT-4的表现在大多数指标上差不多相当于6年工作经验的分析师水平；从工作效率看，是肉眼可见的巨大提升。在营销环节，利用人工智能的强大交互能力，通过文字、语音、图像等形式精准触达客户，避免了客户经理大量的人力劳动，是一个巨大的效益效率的提升。在风控环节，ChatGPT的强大梳理、推理能力，提供了连续扫描和搜索风险信号的有效工具，而且可以7*24小时不间断。这种工作的高效性、触达的准确性、模型的全面性，确实是一个人力难以企及的。在交易环节应用更是广泛。在ChatGPT出现前，人工智能已经非常广泛地应用于量化交易。ChatGPT体现的新一代人工智能的能力将前所未有地提升交易的速度、效率、精准，包括量化交易的适应性、发现信号的效率以及生成交易策略的及时性等。

财联社：刚才您举例说了新加坡的研究报告，我们国内金融领域是否产生了您认为比较有代表性的高水平大模型？

魏晨阳：我觉得目前在各家大力探索，好的例子包括清华唐杰老师的团队成果、百度等大厂的进展。现在大家很关注的一点，是在泛的大语言模型的基座上，开发细分领域的类似“行业GPT”的工具。包括ChatGPT也是一个非常泛的通识的大语言模型。我前段时间在美国硅谷，有的基金告诉我，三个月看了三四百个新项目，都是基于ChatGPT大语言模型的基座，去开发某个细分赛道的行业模型。这需要好的数据去喂、也就是去训练模型，才能得到高质量的模型。虽然行业细分赛道的模型还在涌现的初始阶段，但是行业普遍有这个共识，这是好的也是必然的发展方向。训练的关键因素是数据质量。数据的质量、代表性、维度越好，训练出来的模型质量越高。专业领域的推理能力需要很多专业数据的训练。在医疗领域，美国已经有非常不错的垂直模型出现。例如，通过喂大量的高质量的医疗领域数据，让人工智能具备良好的诊断能力或者制药配方能力。

“负责任的AI”意味着安全、公平、可持续、普惠

财联社：新技术的出现往往伴随着新风险，金融科技创新和安全的边界应如何把握？

魏晨阳：圆桌上也讨论到安全问题。安全涉及消费者保护、信息泄露、黑客攻击等，甚至人工智能可能失控，毕竟是个黑匣子。黑匣子意味着人工智能的某些选择可能是有一定偏见的，比如按照企业的某种偏好去挑选客户。从消费者保护的角度来看，这种偏见是很大的问题。

现在行业内已经意识到这个问题，现在欧美的监管和一些行业大厂在联合讨论“负责任的AI”。目前题目非常明确，但是“负责任”如何界定需要深度探讨。我认为从国内角度出发，“负责任”意味着安全、公平、可持续、普惠，要求非常高。美国监管部门提出一个初步思路，认为“负责任的AI”至少要包括“可解释”这个标准。对于ChatGPT这类1750亿的参数的模型，很难界定什么是可解释，什么是不可解释。但是从治理的角度，如果它不可解释的，就永远存在失控的风险。所以这对全球的治理来讲都是一个很大的新问题。虽然现在对于界定“负责任的AI”尚未形成共识，但是大家都意识到这可能是比ChatGPT更新迭代到GPT-5、GPT-6更严峻更迫切的问题。

财联社：您在圆桌对话环节说，数字化转型要安全、可持续和有温度。如何理解“有温度”？能否把“有温度”理解为“负责任”的一种表现？

魏晨阳：“有温度”首先意味着公平，不能让一个人觉得被歧视。另外，现在大家地越来越重视产品或者服务的使用体验，“有温度”意味着能够更好、更精确甚至超前触达用户需求。既然人工智能有智慧，通过与人的交互，积累越来越多的数据，很可能可以对人类需求做有效的预判和提前触达。可以把人工智能类比成一个贴心的客户经理，能够想人所想、急人所急，甚至想人所未想、急人所未急。

财联社：现在有一个概念是数字普惠金融，和您讲的“负责任”、“公平”、“有温度”高度契合。您能否科普一下数字普惠金融？

魏晨阳：数字普惠金融可以从两方面理解。一是广泛的触达所有人。以前信息沟通不发达，很多偏远山区的人没有机会了解很多产品和服务，机构也触达不到这些客户。现在人手一部手机，移动端提供广泛的触达机会，从而可以针对更广泛的对象设计更多产品。二是公平地触达。设计产品时避免人工智能模型的偏见。在做模型的时候，如果设定的目标函数或者约束条件忽略了某些因素，最终的模型可能会产生偏见。比如一个小额贷款项目，虽然偏远山区的人群收入足够负担小额贷款，但如果模型更倾向于挣钱多、家庭财产多可以承受更高贷款额度的申请人，而忽视了可能在遥远贫穷的地方的那些人有能力承担、且更需要一笔额度小很多（意味着银行可能要少赚点），这也许背离了小额贷款项目的本意，也在某种意义上造成了对“消费者的歧视”。这当然只是个例子。再比如，如果基于肤色、种族、性别等因素，在提供产品或服务时差别化处理，这都是消费者保护的重要考量。

财联社：监管层应该采取什么措施避免这种偏见或者歧视？

魏晨阳：我觉得这对监管来说的确是件永远“在路上”的事情。行业实践总是跑得比监管快一些。监管要不停地去发现新风险、新的不良操作等苗头，并及时调整治理框架。监管首先要提升自身的数字化能力。只有对数字化的理解有提升，才谈得上使用数字化工具提升监管效率。意识不到，或者因为技术手段落后来不及发现，对于各个国家的监管来说都是需要时刻警惕的问题。

中国的金融科技发展具有先天优势：数据积累深厚，市场需求广阔

财联社：中国金融科技发展它是不是有一些区域化的特征？北京地区的金融科技发展又有什么样的特征呢？

魏晨阳：中国的金融科技发展有非常巨大的先天优势，一是数字经济的背景下数据的优势非常大，二是市场需求非常大。保持这些先天优势并持续扩大积极影响，需要从体制上治理上保证方向不跑偏、动作不走形。怎么收集、保护、分享、使用数据，要有一套系统性的规矩，也就是我们常说的数据治理。说到城市层面，每个城市有独特的基因和功能。北京是政治中心，也是监管中心，在整个金融行业的管理方面应当发挥核心作用。在这个环节中，监管人力有限，大数据、人工智能等存在广阔的赋能空间。此外，北京市也有一些其他定位，比如打造成为财富管理中心，人工智能在这些细分赛道也大有可为。

财联社：说到细分赛道，养老也是热点话题。金融机构数字化转型如何赋能中国的养老金融体系建设？

魏晨阳：养老产业的数字化需求和空间非常大，可以从四个维度介绍。第一，医疗科技，或者说健康科技。药物开发、康复康养、空巢老人陪伴等，都存在巨大的需求，也可以被数字赋能。比如陪护机器人，药物开发人工智能、可穿戴设备、监控设施等。第二，保险科技。疾病由谁买单？如何避免因病致贫？数字化技术可以有针对性的对养老健康险进行设计。第三，养老财富管理。资产配置、财富规划、收益测算等天然就存在数字化的空间。第四，养老地产。无论高端养老设施还是普通社区，社区的数字化管理，智能化设备如医疗机器人等、都是提升养老地产的品质和能力的重要考量。

魏晨阳：“负责任的AI”意味着安全、公平、可持续、普惠，警惕人工智能日新月异中偏见和歧视的出现

高水平人工智能垂直模型的关键是数据投喂

“负责任的AI”意味着安全、公平、可持续、普惠

中国的金融科技发展具有先天优势：数据积累深厚，市场需求广阔

鞠建东：大国竞争的关键，不称王、稳市场、谋共享

张健华：金融与数字技术融合下的助贷业务发展