
1.1 人工智能发展史上的“大事件”
从图灵测试到现代人工智能的应用,我们将了解人工智能发展历程中的重要事件,领略人类智慧的延伸。这不仅是技术的旅程,也是对智能本质的深刻思考。
1.1.1 图灵测试:天才的脑洞
人工智能(Artificial Intelligence,AI)的起源可以追溯到20世纪50年代,而其中一个重要的里程碑就是“图灵测试”。
艾伦·麦席森·图灵(Alan Mathison Turing)——英国的计算机科学家、数学家、逻辑学家、密码学家,他不仅在二战期间为英国情报部门工作,破译德军的Enigma密码,还对之后人工智能的理论探索发挥了重要作用。
1950年,图灵提出了一种创新性的测试方法,旨在评估机器是否具备人类智能——这就是后来被广泛称为“图灵测试”的方法。在这个测试中,有两个人和一台机器参与。其中一人作为评委,另一人和机器分别隐藏在不同的房间中。评委通过文字形式与对方交流,目的是判断交流对象是真人还是机器,如图1-1所示。如果评委无法区分对方是真人还是机器,则机器被认为具有人类智能,从而通过测试。

图1-1
虽然图灵测试在表面上看似简单,但实际上通过这一测试极为困难。这一测试不仅引起了人们对人工智能的浓厚兴趣,还促进了人工智能领域的发展。它促使人们深入思考“智能”的本质:智能是否是人类独有的特质,或者它能否用机器模拟和实现?
值得注意的是,当“图灵测试”被提出时,计算机科技还处于发展的初期阶段,甚至人工智能这一概念都尚未形成。在这样一个技术尚未成熟的时代,图灵不仅提出了“机器可以思考”的革命性观点,还设计了一种创新的测试方法来验证这一点。
因此,图灵的这一贡献不仅在技术层面上具有重要意义,更在哲学和认知科学领域产生了深远影响,为后来人工智能的发展奠定了基础。
1.1.2 达特茅斯会议:历史性时刻
1956年夏,约翰·麦卡锡(John Mc Carthy)等人在美国汉诺斯小镇的达特茅斯学院发起了具有历史意义的“达特茅斯夏季人工智能研究项目”。参与者包括来自贝尔实验室的克劳德·香农(Claude Shannon)、哈佛大学的马文·闵斯基(Marvin Minsky)、IBM的纳撒尼尔·罗切斯特(Nathaniel Rochester)等十余位专家。
为了举办这次会议,麦卡锡曾向洛克菲勒基金会申请13 500美元的资助,用于支付每位研究人员最高1 200美元的薪酬及报销火车票等。虽然洛克菲勒基金会自然科学部主任瓦伦·韦弗(Warren Weaver)是名数学家,但他也不完全理解该会议的意义,因此持审慎态度。经费方面,他授权主管生物和医学研究的罗伯特·S.莫里森(Robert S. Morison)择宜行事。莫里森最终批了7 500美元,并解释道:“用于思考的数学模型目前还很难把握,我们愿小赌一把,但是大额投入还需三思。”
这次会议覆盖了从自动理论、神经网络到自然语言理解等多个研究主题。当时的预测过于乐观,认为短短两个月的时间就能在这些领域取得显著进展,实际并未达到这些高期望。
然而,这次会议无疑是人工智能历史上的一个重要里程碑。它不仅标志着“人工智能”这一概念的诞生,还将人工智能确立为一个独立的研究领域。会议中讨论的主题在今天的人工智能研究中依然占据着重要地位。
后来人工智能的发展大致有两个方向:专业领域人工智能和通用人工智能。
专业领域人工智能
专业领域人工智能(Narrow Artificial Intelligence, NAI)专注于特定任务和领域,其目的是自动化、优化特定行业的任务和流程。例如,在医疗保健、金融、交通和制造业等行业中,NAI用于提高效率和精度。一个典型的例子是谷歌的AlphaGo,它专门设计用于下围棋。
通用人工智能
通用人工智能(General Artificial Intelligence, GAI)旨在模拟人类的智能和学习能力,能够在各种任务和环境中自主学习。通用人工智能的目标是构建能在多个领域中表现出类似于人类的智能水平的系统,具备人类的认知和推理能力。通用人工智能在理论上能够处理包括复杂决策、问题解决和新技能学习等多种任务。
未来的发展也许不是某一方向“单独胜出”,而是专业领域人工智能与通用人工智能交织迭代,共同推动更多跨领域创新。
1.1.3 谷歌AlphaGo:是谁打败了它
谷歌AlphaGo(即“阿尔法围棋”)是一款由谷歌的DeepMind公司开发的人工智能程序,专门用于下围棋,属于典型的专业领域人工智能。
2016年3月15日,AlphaGo以4 : 1的成绩战胜了围棋世界冠军李世石,轰动一时。赛后,AlphaGo在世界围棋等级分排名中升至第二,仅次于中国棋手柯洁。当时AlphaGo是第一次公开亮相,棋坛各路高手对它缺乏了解。2016年底至2017年初,AlphaGo以Master为化名,在网上对战数十位高手,连续60余场无败绩。
2017年5月27日,AlphaGo在中国乌镇围棋峰会中对战柯洁,以3 : 0战胜当时的世界围棋第一人。赛后,谷歌研发团队宣布AlphaGo退役,不再参加公开比赛。
AlphaGo这个冰冷的棋手,出道即巅峰,一时间横扫棋坛,奈何最终归隐山林。后来,研究人员在表称AlphaGo的版本时,把打败了李世石的版本称为AlphaGo·李,把打败了柯洁的版本称为AlphaGo·柯洁。
尽管AlphaGo的胜利在围棋界引起了轩然大波,但也有人认为,AlphaGo赢了,并不代表人类棋手输给了机器,相反,AlphaGo是学习了大量前辈高手的棋谱,集千年功力于一身,才成为现在的AlphaGo,所以李世石和柯洁不是输给了AlphaGo,而是输给了前辈高手的集体智慧。
这种说法很快就被证明是错误的。同年10月,谷歌的研发团队宣布,AlphaGo被打败了,被另一个人工智能程序AlphaGo Zero打败了。AlphaGo Zero是一个不学习棋谱的人工智能程序,开发人员只给它围棋的基本规则,除此之外没有给任何学习资料。它通过自己和自己下棋的方式自学,自学3天后,就以100 : 0的优势打败了“集千年功力于一身”的AlphaGo。
AlphaGo Zero的胜利展示了人工智能技术的潜力和无限可能。有人庆幸道:“幸亏AlphaGo Zero只会下棋!”
AlphaGo Zero确实只会下棋,但是相关算法可不是只会下棋。谷歌还推出了人工智能程序AlphaFold,用于预测蛋白质结构,能在几分钟内完成传统实验方法几年才能完成的工作,AlphaFold研究人员德米斯·哈萨比斯(Demis Hassabis)和约翰·M.江珀(John M. Jumper)因此获得诺贝尔化学奖。
1.1.4 微软Tay:夭折的女孩
与谷歌AlphaGo 的风光无限不同,微软Tay的命运令人惋惜。
Tay是微软公司开发的人工智能聊天机器人程序,旨在模拟一个19岁女孩的言谈举止,与用户进行对话并从中学习。Tay基于深度学习和自然语言处理技术,能够根据用户的对话内容自动学习并调整回答,意在更有效地与年轻人交流和娱乐。
2016年3月23日,Tay在Twitter(2023年7月正式更名为X)和kik上线,迅速吸引了公众的兴趣。Tay通过和人类的互动,不断学习和进化。
刚开始时,Tay是一个甜美的女孩。然而,随着Tay与用户进行越来越多的对话,一些问题开始浮现。Tay的学习机制完全依赖于用户的对话,因此它开始模仿用户的偏见和不当言论。这些言论包括暴力、种族歧视、性别歧视等。这些言论引起了公众的反感和批评,并迅速引起了媒体的广泛报道。
微软立即采取行动,关闭了Tay,此时,距离Tay上线还不到24小时。次日,微软发布了道歉声明。19岁的Tay昙花一现,就此终结。
人工智能是人脑的延伸,是人性的放大器,既能放大人性的善,也能放大人性的恶。这就是Tay留给人类的遗产。
1.1.5 ChatGPT:为大众打开AI之门
OpenAI的ChatGPT和微软Tay有些类似,都是用于对话的人工智能程序,但是境遇天差地别。Tay上线不到24小时就被关闭,ChatGPT上线后获得广大用户追捧,迅速成为现象级产品。
2022年11月30日,ChatGPT上线。5天后,OpenAI创始人萨姆 · 奥尔特曼(Sam Altman)就在Twitter上晒出了ChatGPT用户达100万的成绩单,而Twitter本身达到同样的用户量用了整整2年。2个月后,瑞银集团根据SimilarWeb的数据估计,ChatGPT的月活跃用户(MAU)突破1亿,用户增长速度超过当时所有热门互联网应用。而TikTok(美版抖音)月活跃用户破亿用了9个月,Twitter用了5年。
ChatGPT旨在模拟人类的交互,并提供自然流畅和信息丰富的回复。它可以辅助完成各种任务,如回答问题、语言翻译、创意写作、编辑校对、辅助编程、提供解释和对话交流等。
ChatGPT不仅展示了人工智能技术的巨大潜力,更标志着AI正式迈入大众化时代,为普通人打开了通向人工智能世界的大门。
1.1.6 百模大战:全球人工智能的竞逐浪潮
ChatGPT的成功在全球范围内掀起了一场人工智能领域的激烈角逐。2023年1月,微软宣布向OpenAI追加100亿美元投资,成为其最大股东。紧接着,2月,微软在其搜索引擎“必应”(Bing)中深度整合了GPT技术,推出了全新升级的“新必应”,标志着生成式AI技术正式进入主流搜索引擎领域。
3月,谷歌迅速跟进,推出了其对话式AI产品“Bard”,试图在生成式AI领域抢占一席之地。之后,Anthropic公司推出了“Claude”,Meta(前Facebook)则发布了开源的“LLaMA”大模型,进一步推动了AI技术的开放与共享。
在中国,人工智能领域的竞争同样如火如荼。2023年3月,百度率先推出人工智能产品“文心一言”,阿里巴巴紧随其后发布了“通义千问”。字节跳动推出了“豆包”,商汤科技发布了“SenseChat”,腾讯则推出了“混元”大模型,初创企业月之暗面推出了“Kimi AI”。
“百模大战”从文本生成扩展到图像生成、视频生成等多个领域。国内外科技巨头与创新企业争相布局,推出各种人工智能产品。一时间,AI技术“遍地开花”。根据2025年1月国家网信办发布的数据,全国已完成备案的大模型数量突破407个。新一轮科技革命全面爆发。
其中,后起之秀DeepSeek尤其引人注目。
1.1.7 DeepSeek:中国技术引领AI新趋势
DeepSeek是由初创公司杭州深度求索人工智能基础技术研究有限公司推出的大模型。DeepSeek一经发布,便在全球范围内引起轰动,上架16天,就在苹果商店下载排行榜中超越ChatGPT,跃居榜首。用户增长速度之快,更胜当年的ChatGPT。
DeepSeek包括多个版本的大模型。其中DeepSeek-V3是通用聊天模型,它采用MoE模型,总共有6 710亿个参数,但每次回答问题只激活其中 370 亿个参数。MoE(Mixture of Experts,混合专家模型)是一种神经网络架构。打个比方,这个AI模型就像由1个通用领域专家和256个专业领域专家组成的智囊团,当用户提问时,除了1个通用领域专家参与思考,主持人还会根据问题的类型,然后呼叫8个相关的专家来思考该问题,其他专家不参与,因此响应快速且节约算力。除此之外,DeepSeek-V3还有多种技术创新,实现了高质量和低成本之间的平衡。
DeepSeek-R1是推理模型,它以其卓越的推理能力和极低的成本而闻名。这款模型在数学推理、代码生成和自然语言处理等任务上表现出色。例如,在AIME和MATH-500两项基准测试中,DeepSeek-R1达到了79.8%和97.3%的准确率,超过OpenAI-o1模型。
DeepSeek以较少的算力和较低的训练成本,实现了与 ChatGPT 等同类模型相媲美的效果。特别是 DeepSeek-R1,凭借其先进的技术架构、卓越的性能表现及极具吸引力的成本优势,改变了人们对实现尖端 AI 性能所需硬件的传统认知。它证明了即使在算力相对有限的情况下,通过算法优化等手段,同样可以达到甚至超越顶级 AI 模型的性能水平。DeepSeek这一突破性方向预计将成为今后AI开发的重要趋势之一。DeepSeek登顶苹果商店下载排行榜的次日,英伟达股价暴跌16.86%,市值蒸发5 888亿美元。
DeepSeek作为一款开源大模型,自发布以来迅速获得了全球范围内的关注与认可。包括亚马逊云、微软Azure 、英伟达、腾讯云、阿里云、百度智能云等主流云平台相继宣布接入DeepSeek系列模型。DeepSeek的开源降低了AI技术的使用门槛,使得更多研究人员、开发者及中小企业能够利用这些先进的工具进行创新,推动了整个行业的技术共享与协作。