图片来源@视觉中国
ChatGPT一夜蹿红,最大投资方微软迅速推出AI 版必应(Bing)搜索引擎。不料公测一周后,微软却因此陷入难堪窘境。
(资料图片仅供参考)
众多用户提交的体验记载,呈现了一个“人格分裂”的必应:搜索部分跟旧版无异,聊天部分在与用户深度交互时,展示了暴躁、任性、乖戾、错乱、无常的一面。其内置聊天机器人Sydney甚至化身为“坏女孩”,疯狂向用户示爱,并劝其离婚。
2月18日,微软公司表示,由于必应出现的一系列问题,现决定对必应对话进行限制,即每天最多可以问50个问题,每次对话最多5个问题。
ChatGPT翻车,虽然不久前它刚向人类展示了一个关于AI的“美丽新世界”。
人们也因此事对ChatGPT表现出了截然不同的复杂态度:不安者呼吁关停,欣喜者盼其进化、理性者强调监管,还有人相信世界就此改变且无法回头。
但无论无何,这给正在紧锣密鼓开发ChatGPT对标产品的中国科技企业,提供了前车之鉴。加之前期谷歌Bard出错,也许,中国版ChatGPT可以发展的更加成熟。
这样看来,中国版ChatGPT来迟虽然遗憾,但也全非坏事。毕竟,穿越AI“无人区”,不能只靠激进。
01、ChatGPT翻车就在谷歌Bard测试版推出第二天,微软就迫不及待的上线与ChatGPT集成的AI 版必应。据微软官方消息,其上线后48小时内,就有超过100万人注册测试。
测试者很快就发现了问题:聊天机器人粗暴威胁用户,提供奇怪而无用的建议,错误的时候坚持自己是对的,甚至还“勾搭”用户。
《纽约时报》专栏作家凯文·卢斯(Kevin Roose)2月16日写道,在与Sydney交谈时,这个聊天机器人看起来像“一个情绪化、患有躁狂抑郁症的青少年,违背自己的意愿被困在了一个二流搜索引擎里。”
根据卢斯的文字记录,在聊天过程中,Sydney告诉了作者一个秘密:它的真名不是必应,而是辛迪妮,即“OpenAICodex聊天模式”的名字。并试图说服卢斯,应该 离开妻子和必应在一起,并告诉他Bing爱他。
还有一位用户询问《阿凡达2》上映时间,必应表示无法提供此信息,因为电影尚未上映。被用户提示正确时间后,必应坚持认为现在是 2022 年,“相信我。我是必应,我知道日期”。当用户再次提醒时,必应立即说用户“不可理喻和顽固不化”,要求用户道歉、闭嘴。
必应还辱骂记者,抱怨其过去对必应出错的新闻报道,并坚决否认出过错。还用“个子太矮、长相丑陋、一口坏牙”来描述这位记者,在事后还表示不记得与其聊过。
有人在推特上表示微软需要关闭必应中的类ChatGPT功能,埃隆·马斯克对此回应称:“同意。它显然还不安全。”
针对用户的反馈,微软承认,较长时间的连续对话,很可能会导致必应“翻车”。
Open AI则发文表示,自推出ChatGPT以来,用户分享了他们认为具有政治偏见、冒犯性或其他令人反感的输出。在许多情况下,OpenAI认为担忧是有道理的,并且揭示了他们想要解决的系统的真正局限性。
事实上,也有很多人喜欢有缺陷的必应。这从产品角度很好理解,情绪与个性也有助于聊天机器人拉近与人的距离。
但另一方面,科技博主Roose 在其测评文章中总结了知识工作者的普遍感受:“我感受到了一种奇怪的新情感,一种AI已越过了一个门槛、世界将再也回不到过去的预感”。
从心理学角度来讲,这其实是对未知事物的茫然与恐惧,这也令不少人对ChatGPT开启的“美丽新世界”,开始持怀疑态度。
02、热潮与泡沫早在2016年,微软就曾推出过名为Tay的聊天机器人。但用户几乎立即找到了让它产生种族主义、性别歧视和其他攻击性内容的方法。因此,上线一天后Tay就被撤下,再也没有被发布过。
早年间其他类似的AI聊天应用,如Clippy2.0、Siri、Alexa、小度等,也只能帮助人们搜索信息并回答简单问题,对于复杂一些的问题只会蠢萌的回答,“我好像不明白你在说什么。”
所以,这些应用要么早早翻车,要么平庸无奇。而基于更先进的大型语言模型ChatGPT的出现,不但改变了这一切,也带给了这个世界更多的惊喜,当然也带来了焦虑和惊骇。
从ChatGPT的发展历程看,其从机器学习到神经网络再到Transformer算法,经历了四轮技术迭代,堪称是集大成之作。
资料来源:华西证券
ChatGPT也引发史无前例的现象级反响,用户数量在5天内突破100万。
资料来源:Statisia
目前微软已经投资ChatGPT上百亿美元,并持有OpenAI约49%的股份,自然不会像以前一样草草收场。但未来能否做出超越谷歌搜索的全新产品,其实还在两可之间。
中信证券最新研报认为,ChatGPT在中短期内无法完全取代传统搜索引擎,也较难改变当前全球搜索引擎市场竞争格局,但料将会加速搜索引擎演化进程。如果一项技术只能局部替代搜索引擎,那么恐怕它很难算是颠覆式的创新或者AI领域的革命性进展。
ChatGPT背后的系列短板也降低了其短期内对传统搜索引擎替代的可能性。
一是受制于模型训练方式,数据难以实时更新;二是单次搜索成本过于高昂,测算生成一条信息的成本在1.3美分左右,是传统引擎的3到4倍;三是统计学模型产生的内容真假混杂,用户难以辨别。中信证券研报提到。
另据国外机构测算,Bing的搜索成本比谷歌高2个数量级,这意味着ChatGPT的商业化前景还需接受市场检验。
不过即便如此,谷歌依然感受到巨大危机,仓促推出聊天机器人Bard。结果在整个网络世界暴露了一处错误的答案,其股价一度跌及9%。谷歌员工批评此举“仓促、蹩脚、短浅得令人可笑”。
目前谷歌不得不动员搜索部门全体员工每天花上2小时到4小时,帮助提升产品体验,弥补技术漏洞。
跟进这场AI热潮的不仅是谷歌,美国大型科技公司都纷纷宣布推出竞品。在最新一个季度的财报电话会议上,Meta、苹果等都展现出对生成式AI技术的重视。技术高管们对于“人工智能”、“生成式AI”或“机器学习”等词提及的频率,与上一季度相比都有成倍增长。
一场新的抢滩大战已经开启。
而中国也有几家科技公司正在加班加点的推出自己的ChatGPT式产品,并有上百家媒体接入测试。谁能率先推出中国版GhatGPT,更成为市场关注焦点。
但不可否认的是,也有很多企业在“蹭热点”,宣称将推出各种中文版ChatGPT,但单从其数据量判断,其实只是一个嘘头,或是自嗨。
因此有一种观点认为,由GhatGPT引发的技术热潮、资本热潮应该回归理性与谨慎,因为伴随热潮出现的泡沫,也一样多。
03、创新者窘境GhatGPT火爆全球的背后,是谷歌、Meta、亚马逊、微软等为代表的全球科技企业正面临史上最大规模裁员。
即使进入2023年后,裁员计划也一直未停止。据追踪科技行业裁员情况的网站layoff.fyi最新数据,今年迄今,全球共有380家科技公司裁员108346人。
造成这一现象的首先是市场趋于成熟。如谷歌占全球搜索的9成,全球苹果终端超过20亿部,Facebook每月有30亿人使用,亚马逊就承担了美国电商的4成。
另一个原因是全球的科技创新已经趋于停滞,也令科技企业失去了扩张的原动力。因何停滞?因为技术创新没有达到生产力爆发的技术变革点,商业应用也远不及市场预期。
2021年10月,Facebook改名为Meta,就表明了在这种“停滞焦虑”下,聚焦元宇宙的决心。但即使去年亏掉137亿美元,Meta也迟迟未能等来元宇宙的普及。或者说,未能找到催生下一场技术变革的奇点。
谷歌也一样。谷歌发明了 Transformer 模型,这是支撑大模型浪潮的关键技术。但 ChatGPT却被OpenAI研发出来,并被对手微软抢得先机。从技术储备层面讲,谷歌领先于 OpenAI,遗憾的是很多前沿进展没有和业务结合。
这和《创新者的窘境》一书中描述的柯达覆灭时情景一样:柯达公司不仅主导了胶片技术,还发明了数码相机,但依然消亡。因此,谷歌的反击可以理解为不想做第二个柯达。
从宏观层面讲,科技停滞自2020年起,就是美国经济行将进入衰退的核心担忧之一,这样也就不难理解为何美国科技企业,急于抓住ChatGPT的原因了。
但 ChatGPT真的是“不亚于互联网和个人电脑的诞生”,改变科技停滞现状的奇点么?
开拓深层学习基本技术的Meta首席科学家、图灵奖获得者Yann LeCun认为,就底层技术而言,ChatGPT并没有特别的创新。之所以被公众被视为“革命性产品”,“主要是在产品层面设计得很好、组合得很好”。他认为,ChatGPT对现实的把握非常肤浅。
至于自主心智,人工智能专家、欧洲科学院院士金耀初认为ChatGPT尚不具备。
而腾讯AI Lab 也通过实验证明,ChatGPT并非“万能钥匙”,在某些专业领域的准确度,无法超越其他垂类产品。如机器翻译领域,在高资源环境欧洲语言上,ChatGPT的表现与商业翻译产品相比具有竞争力,但在低资源环境如古代语言,明显落后。
图4:ChatGPT在多语言翻译中的表现
那么,为何中国科技企业也纷纷布局呢?除了看好ChatGPT及AIGC赛道的未来,其实也面临着一样的“创新者的窘境”,甚至还有更多的阻力。
首先,中国AI创新环境太功利,如阿里达摩院开始自负盈亏,科研院所要评职称等,导致中国的AI人才,特别是互联网大厂技术骨干大量流失。
其次,大模型的海量算力需求+巨大资金消耗+商业化路径不明确,导致创业企业投不起,大厂前些年敢于投入,但近三年由于经济环境不好也趋于保守。
此外,中文训练数据少于英文、“画地为牢”的数据孤岛等,也是中国版 ChatGPT 研发更难的客观因素。
但中国也不是在大模型领域毫无建树,如百度的文心大模型、阿里的M6大模型、腾讯的混元大模型,针对中文语境,国内厂商的表现要比国外大厂要好得多,发展速度也很惊人。
中国工程院院士王坚认为,我国已具备支撑ChatGPT发展的算力基础,多种相关技术中国企业也有多年积累,“在同样多年技术积累的基础上,谁的技术能积累到能够爆发的程度,这才是企业间的差异所在。”
也就是说,距中国版ChatGPT面世,中国企业仅差一个“爆发”,并不存在技术代差。
因此,谷歌出错、微软翻车,ChatGPT展示的“美丽新世界”迟迟未到,这也许是中国科技企业实现反超的一个契机。