全网都没有说明白ChatGPT为什么无法在国内注册顺带科普RLHF

前段时间,一直有人在问,为什么国内无法注册ChatGPT,网上的回答也五花八门,主要的归为两类:“不可抗拒力”、“因为基于谷歌的机器学习服务,所以被限制”

第一个回答等于啥都没说。对于第二个,笔者内心总是盘旋着一个词“瞎扯”

今天正好新的文章还在做信息梳理,就抽1小时和大家聊聊。

先证伪 – 我们从2个角度先来交叉验证这句话是“瞎扯”哈:

1、OpenAI的商业脉络

2015 年 12 月,Elon Musk 和 Greg Brockman、Sam Altman 以及 Ilya Sutskever等人在旧金山创立 Openai。(为了防止google一家独大,为非作歹)2018年2月,因为太烧钱,马斯克为了保特斯拉退出。换成了另外6位捐助者: Gabe Newell、Jaan Tallinn,Ashton Eaton 和 Brianne Theisen-Eaton(google这会儿还在为DeepMind烧钱烧的头疼)2019 年 7 月 OpenAI 接受了微软 10 亿美元的战略投资,成为微软对抗google的重要一环。(商业竞争对手)

结论:从整个脉络来看,google完全没有介入OpenAI,而且从始至终都是竞争关系(灭霸和复仇者联盟……..)

2、AI整个生态底层服务组成

AI由算法、模型 数据集、上层应用组成

算法作为底层,一直都是开源形式存在;模型 数据集,除了几个头部企业的大模型外,绝大部分模型、数据集也都是开源状态(国内也有好多模型开源社区);上层应用,ChatGPT充其量算一个聊天工具,没有复杂的服务体系。

结论:这些ChatGPT的关键要素扒开来看,就没有任何google身影,更何况基础模型都是开源的。

综上,我们推翻了“因为google服务所以无法在国内使用”的猜测。那到底是因为什么?

做假设和论证 – 网上那么多大神都没说明白为什么,笔者当然也不敢造次,所以今天选择从“模型准确性”角度来说一说国内不开放的理由。

大家都知道,ai的核心是对数据进行特征鉴别(也叫学习)并通过反馈来强化学习。然后运用计算机超强的算力帮助人类对所有处理后数据进行归类、统计、分析甚至于创造性的工作。那么对于数据特征的鉴别准确性就是一个关键指标(举个栗子,你家要买指纹锁,有1%的认假率,你敢买吗?肯定不敢。但现在认假率已经远远小于0.001%,所以才形成了目前的市场规模)。只有识别准确,之后的分析、统计工作才有价值。

我们再来看ChatGPT是如何训练来做提升模型准确性的(RLHF技术):

这张图网上已经放过好多轮了,用通俗一点的文字来说:

第一步:用高质量数据集进行训练【人类公认理性回答】

第二步:多个结果让AI挑最符合人性【有情商的回答给个糖吃】

第三步:通过回传来迭代优化第二步,直到模型收敛。【通过大量实践,越来越有情商】

第一和第二都是需要OpenAI内部来完成,但第三步是通过ChatGPT上线后大量API调用的反馈来实现(待进一步验证)。

是不是有点品出那味儿了?

第一步“40岁的阿姨,妈妈教我们要叫阿姨”;

第二步“40岁的阿姨,叫姐姐”,然后你老妈给你奖颗糖;

第三步“40岁的阿姨,叫漂亮姐姐”,然后阿姨给你吃了一颗糖。

关键是,这颗糖是阿姨给你吃的!

现在我们来看ChatGPT为什么国内不能访问?也许根本就不是OpenAI不给我们用,而是我们不想给OpenAI提供数据和反馈。糖留着给自己的孩子呀!(比如3月将发布的百度AI聊天工具)

写到这里,感觉差不多闭环了,说服我自己可以发了。

介绍一下自己:30年游戏玩家,14年游戏相关行业从业者。聚焦科技创新 商业化落地解决方案。

未来我们会每周调研一个AIGC相关细分赛道,如果您也有想要了解和探索的方向,欢迎一起交流合作。也欢迎各位交流行业、市场、产品、技术、管理等方面内容。