English
首页 研究成果 专家观点 正文

魏晨阳:“负责任的AI”意味着安全、公平、可持续、普惠,警惕人工智能日新月异中偏见和歧视的出现


5月29日,北京市海淀区人民政府、北京市西城区人民政府、清华大学五道口金融学院主办2023中关村论坛“金融科技论坛”。清华大学金融科技研究院副院长魏晨阳主持了圆桌对话“增量博弈到存量博弈,金融业如何提质增效”。对话嘉宾中国银行软件中心副总经理康钧伟、北京银行首席信息官龚伟华、中电金信常务副总经理冯明刚、度小满首席技术官许冬亮、华控清交董事长张旭东围绕圆桌主题,对金融科技分享了不同的观点。

会后,魏晨阳接受了财联社的采访。他表示打造垂直领域的人工智能大模型,关键是数据投喂。训练过程、时长、效率大同小异,数据质量决定了模型的训练结果。同时,他提示人工智能可能存在“偏见”,如何设计“负责任的AI”是当前全球多方共同面临的棘手问题。

高水平人工智能垂直模型的关键是数据投喂

财联社:去年以来,由ChatGPT引发的关于人工智能的关注热度持续不减,我们说了很多年的数字技术也好,以ChatGPT为代表的人工智能技术也好,在金融领域如何应用?

魏晨阳:ChatGPT本身是大语言模型的一个突破,提供了非常强有力的工具。与以前相比,这个工具具备了推理能力、生成能力。不仅可以深度梳理和分析数据,还可以通过强大的推理和生成能力,与人的交互使层层递进的学习、分析、设计、创作成为现实。它的应用场景很广,包括语音对话,文字图像生成等。对于金融领域,应用场景也非常广泛。比如研究环节,股票分析师从分析信息到形成报告的全过程中,这类工具可以高效进行信息梳理、图标生成及简单展示等重复性工作,极大地解放劳动力,实现巨大的效率提升。最近阿里达摩院和新加坡南洋理工大学针对ChatGPT在金融行业数据风险工作进行评估,得出初步结论:从工作效果看,GPT-4的表现在大多数指标上差不多相当于6年工作经验的分析师水平;从工作效率看,是肉眼可见的巨大提升。在营销环节,利用人工智能的强大交互能力,通过文字、语音、图像等形式精准触达客户,避免了客户经理大量的人力劳动,是一个巨大的效益效率的提升。在风控环节,ChatGPT的强大梳理、推理能力,提供了连续扫描和搜索风险信号的有效工具,而且可以7*24小时不间断。这种工作的高效性、触达的准确性、模型的全面性,确实是一个人力难以企及的。在交易环节应用更是广泛。在ChatGPT出现前,人工智能已经非常广泛地应用于量化交易。ChatGPT体现的新一代人工智能的能力将前所未有地提升交易的速度、效率、精准,包括量化交易的适应性、发现信号的效率以及生成交易策略的及时性等。

财联社:刚才您举例说了新加坡的研究报告,我们国内金融领域是否产生了您认为比较有代表性的高水平大模型?

魏晨阳:我觉得目前在各家大力探索,好的例子包括清华唐杰老师的团队成果、百度等大厂的进展。现在大家很关注的一点,是在泛的大语言模型的基座上,开发细分领域的类似“行业GPT”的工具。包括ChatGPT也是一个非常泛的通识的大语言模型。我前段时间在美国硅谷,有的基金告诉我,三个月看了三四百个新项目,都是基于ChatGPT大语言模型的基座,去开发某个细分赛道的行业模型。这需要好的数据去喂、也就是去训练模型,才能得到高质量的模型。虽然行业细分赛道的模型还在涌现的初始阶段,但是行业普遍有这个共识,这是好的也是必然的发展方向。训练的关键因素是数据质量。数据的质量、代表性、维度越好,训练出来的模型质量越高。专业领域的推理能力需要很多专业数据的训练。在医疗领域,美国已经有非常不错的垂直模型出现。例如,通过喂大量的高质量的医疗领域数据,让人工智能具备良好的诊断能力或者制药配方能力。

“负责任的AI”意味着安全、公平、可持续、普惠

财联社:新技术的出现往往伴随着新风险,金融科技创新和安全的边界应如何把握?

魏晨阳:圆桌上也讨论到安全问题。安全涉及消费者保护、信息泄露、黑客攻击等,甚至人工智能可能失控,毕竟是个黑匣子。黑匣子意味着人工智能的某些选择可能是有一定偏见的,比如按照企业的某种偏好去挑选客户。从消费者保护的角度来看,这种偏见是很大的问题。

现在行业内已经意识到这个问题,现在欧美的监管和一些行业大厂在联合讨论“负责任的AI”。目前题目非常明确,但是“负责任”如何界定需要深度探讨。我认为从国内角度出发,“负责任”意味着安全、公平、可持续、普惠,要求非常高。美国监管部门提出一个初步思路,认为“负责任的AI”至少要包括“可解释”这个标准。对于ChatGPT这类1750亿的参数的模型,很难界定什么是可解释,什么是不可解释。但是从治理的角度,如果它不可解释的,就永远存在失控的风险。所以这对全球的治理来讲都是一个很大的新问题。虽然现在对于界定“负责任的AI”尚未形成共识,但是大家都意识到这可能是比ChatGPT更新迭代到GPT-5、GPT-6更严峻更迫切的问题。

财联社:您在圆桌对话环节说,数字化转型要安全、可持续和有温度。如何理解“有温度”?能否把“有温度”理解为“负责任”的一种表现?

魏晨阳:“有温度”首先意味着公平,不能让一个人觉得被歧视。另外,现在大家地越来越重视产品或者服务的使用体验,“有温度”意味着能够更好、更精确甚至超前触达用户需求。既然人工智能有智慧,通过与人的交互,积累越来越多的数据,很可能可以对人类需求做有效的预判和提前触达。可以把人工智能类比成一个贴心的客户经理,能够想人所想、急人所急,甚至想人所未想、急人所未急。

财联社:现在有一个概念是数字普惠金融,和您讲的“负责任”、“公平”、“有温度”高度契合。您能否科普一下数字普惠金融?

魏晨阳:数字普惠金融可以从两方面理解。一是广泛的触达所有人。以前信息沟通不发达,很多偏远山区的人没有机会了解很多产品和服务,机构也触达不到这些客户。现在人手一部手机,移动端提供广泛的触达机会,从而可以针对更广泛的对象设计更多产品。二是公平地触达。设计产品时避免人工智能模型的偏见。在做模型的时候,如果设定的目标函数或者约束条件忽略了某些因素,最终的模型可能会产生偏见。比如一个小额贷款项目,虽然偏远山区的人群收入足够负担小额贷款,但如果模型更倾向于挣钱多、家庭财产多可以承受更高贷款额度的申请人,而忽视了可能在遥远贫穷的地方的那些人有能力承担、且更需要一笔额度小很多(意味着银行可能要少赚点),这也许背离了小额贷款项目的本意,也在某种意义上造成了对“消费者的歧视”。这当然只是个例子。再比如,如果基于肤色、种族、性别等因素,在提供产品或服务时差别化处理,这都是消费者保护的重要考量。

财联社:监管层应该采取什么措施避免这种偏见或者歧视?

魏晨阳:我觉得这对监管来说的确是件永远“在路上”的事情。行业实践总是跑得比监管快一些。监管要不停地去发现新风险、新的不良操作等苗头,并及时调整治理框架。监管首先要提升自身的数字化能力。只有对数字化的理解有提升,才谈得上使用数字化工具提升监管效率。意识不到,或者因为技术手段落后来不及发现,对于各个国家的监管来说都是需要时刻警惕的问题。

中国的金融科技发展具有先天优势:数据积累深厚,市场需求广阔

财联社:中国金融科技发展它是不是有一些区域化的特征?北京地区的金融科技发展又有什么样的特征呢?

魏晨阳:中国的金融科技发展有非常巨大的先天优势,一是数字经济的背景下数据的优势非常大,二是市场需求非常大。保持这些先天优势并持续扩大积极影响,需要从体制上治理上保证方向不跑偏、动作不走形。怎么收集、保护、分享、使用数据,要有一套系统性的规矩,也就是我们常说的数据治理。说到城市层面,每个城市有独特的基因和功能。北京是政治中心,也是监管中心,在整个金融行业的管理方面应当发挥核心作用。在这个环节中,监管人力有限,大数据、人工智能等存在广阔的赋能空间。此外,北京市也有一些其他定位,比如打造成为财富管理中心,人工智能在这些细分赛道也大有可为。

财联社:说到细分赛道,养老也是热点话题。金融机构数字化转型如何赋能中国的养老金融体系建设?

魏晨阳:养老产业的数字化需求和空间非常大,可以从四个维度介绍。第一,医疗科技,或者说健康科技。药物开发、康复康养、空巢老人陪伴等,都存在巨大的需求,也可以被数字赋能。比如陪护机器人,药物开发人工智能、可穿戴设备、监控设施等。第二,保险科技。疾病由谁买单?如何避免因病致贫?数字化技术可以有针对性的对养老健康险进行设计。第三,养老财富管理。资产配置、财富规划、收益测算等天然就存在数字化的空间。第四,养老地产。无论高端养老设施还是普通社区,社区的数字化管理,智能化设备如医疗机器人等、都是提升养老地产的品质和能力的重要考量。