春节期间,ChatGPT概念及人工智能方面关注度显著提升。1月30日,有消息称国内互联网巨头将于3月在中国推出类似ChatGPT的人工智能聊天机器人,再次掀起公众对AI聊天机器人的关注热潮。当日,也是兔年春节后第一个交易日,相关概念上市公司股价纷纷涨停。
GPT是一种通过无监督预训练和监督微调实现文本的自动补全工具,采用生成对抗网络,通过对不同的书面材料集与长篇连载文本的预训练,获取知识并处理长程依赖关系。ChatGPT则是在GPT迭代到GPT-3之后的迭代技术,基于GPT3.5,依赖于人类反馈强化学习 (RLHF) 训练模型。
简单说,ChatGPT则是通过和AI训练员对话来提升自己的自然语言处理能力,尤其是提高回答的逻辑性,ChatGPT最大的特点就是会承认自己的局限性,通过人类对话细节给出人类可能想要的答案。未来ChatGPT的数据积累也会越来越大,能够应对的事情也越来越多。
(相关资料图)
ChatGPT是算法和数据积累后的成果,以量变逐渐累积到质变,这符合人工智能技术发展的客观规律,它的主要功能可能是两个方面:一个是辅助工作,比如帮助人类写论文、写代码,这是一种工具模式;另一个是AICG,就是替代人类创作内容。实际上同步OpenAI的AI企业很多,但其他企业没有达到OpenAI的效果。
现实生活中,我们接触到的市场上一些智能音箱产品,都是与ChatGPT相类似的人工智能产品,都能根据上下文进行互动,但ChatGPT有两个方面的优势,一个是算法上的优势,这方面很难说清,但当前都是机器学习模式下的算法,优劣差距逐渐拉开。另一个是关注度带来数据积累量的提升,数据来自用户使用,通过用户对答案的评分,来积累AI能力,越是有热度的应用,越是会被广泛使用的应用,积累数据的来源越多,成长越快。
ChatGPT的独特性在于,他会告诉用户自己不理解什么,要求用户补充信息,回答人类提问的语言逻辑能力大幅度提高,回答结果中包括很多可能性回答。ChatGPT的人类训练员能够对ChatGPT回答结果进行微调,AI训练员对各类回复的适当性进行排名反馈,通过强化学习来优化 ChatGPT的回复策略。相对而言,大多数其他算法可能依然需要大量标注数据。
ChatGPT已经成为一个热点,而当其成为热点,其获取用户交互数据的能力就进一步增强,所以在英语区,ChatGPT已经成长为一款有用的工具。当然,ChatGPT普及最关键的一点在于,ChatGPT面向一个熟悉AI使用的群体,也就是程序员群体,在一定程度上减轻了部分程序员的工作量,比如修复BUG,比如给出代码书写方案。
虽然,现阶段看,ChatGPT的算法的确超越了谷歌的BERT,亚马逊的Galactica就更不用说了,人工智能在自然语言处理领域已经从智能音箱的娱乐对话,转向更高智能水平的解决实际问题,比如上文提到的,辅助编程、修改程序,除此之外还可以写情书、做题等等,有调查显示,截至2023年1月,美国89%的大学生都是用ChatGPT做作业。
当前ChatGPT主要在程序员中流行,未来可以成为生活助手,通过语义理解,能够在各个领域给予用户答案。实际上ChatGPT更加接近老的Web3.0定义,也就是语义网的定义。所以替代搜索引擎为时尚早,谷歌依然有其数据规模优势,人类搜索需求是非常多元化的,且是动态变化的,所以人工智能要取代搜索需要很长时间。不过有知情人称,微软公司正在计划推出使用聊天机器人ChatGPT背后AI技术的新版搜索引擎。
人工智能不断进化演变,ChatGPT的出现是历史的必然,但基于大数据和模型、算法下的人工智能,确实存在着“黑箱”弊端,因此,从法律、道德、伦理等角度的审视,对人工智能进行约束,有助于把控科技发展方向,保持人工智能与人类社会发展的平衡,但是,总体而言,ChatGPT当前的工具能力收益大于风险。
(文章来源:证券时报网)