ChatGPT OpenAI开发的预训练语言模型

RWYQ阿伟 | 2023-02-14 | 笔记 | 0条留言 | 2435 | 2023-02-14更新

ChatGPT OpenAI开发的预训练语言模型

ChatGPT(全名:Chat Generative Pre-trained Transformer)是由OpenAI开发的一个人工智能聊天机器人程序,于202211月推出。该程序使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练。



开发者OpenAI
首次发布

20221130日,2个月前

目前版本

2023130日,14天前

类型聊天机器人
许可协议专有软件
网站chat.openai.com/chat


ChatGPT目前仍以文字方式互动,而除了可以透过人类自然对话方式进行交互,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答、自动摘要等在内的多种任务。如:在自动文本生成方面,ChatGPT可以根据输入的文本自动生成类似的文本(剧本、歌曲、企划等),在自动问答方面,ChatGPT可以根据输入的问题自动生成答案。还具有编写和调试计算机程序的能力。[3]在推广期间,所有人可以免费注册,并在登入后免费使用ChatGPT实现与AI机器人对话

 

ChatGPT可以写出相似于真人程度的文章,并因其在许多知识领域给出详细的回答和清晰的答案而迅速获得关注,证明了从前认为不会被AI取代的知识型工作它也足以胜任,对于金融与白领人力市场的冲击相当大,但其事实准确性参差不齐被认为是一重大缺陷,其基于意识形态的模型训练结果并被认为需要小心地校正ChatGPT202211月发布后,OpenAI估值已涨至290亿美元。上线两个月后,用户数量达到1亿

 

训练

ChatGPT使用基于人类反馈的监督学习和强化学习在 GPT-3.5 之上进行了微调。这两种方法都使用了人类训练员来提高模型的性能, 通过人类干预以增强机器学习的效果,从而获得更为逼真的结果。在监督学习的情况下,模型被提供了这样一些对话, 在对话中训练师j充当用户和AI助理两种角色。在强化步骤中,人类训练员首先对模型在先前对话中创建的响应进行评级。这些级别用于创建“奖励模型”, 使用近端策略优化(Proximal Policy Optimization(英语:Proximal Policy Optimization-PPO)的多次迭代进一步微调, 这种策略优化算法比信任域策略优化(trust region policy optimization)算法更为高效。这些模型是与 Microsoft合作,在其Microsoft Azure超级计算基础设施上训练的。

 

此外,OpenAI继续从ChatGPT用户那里收集数据,这些数据可用于进一步训练和微调 ChatGPT。 允许用户对他们从ChatGPT收到的回复投赞成票或反对票;在投赞成票或反对票时,他们还可以填写一个带有额外反馈的文本字段。

 

ChatGPT的训练数据包括各种文档以及关于互联网、编程语言等各类知识,如BBSPython编程语言

 

关于ChatGPT编写和调试计算机程序的能力的训练, 由于深度学习模型不懂编程,与所有其他基于深度学习的语言模型一样,只是在获取代码片段之间的统计相关性。

 

特点和局限

虽然聊天机器人的核心功能是模仿人类对话者,但ChatGPT用途广泛。 例如,具有编写和调试计算机程序的能力; 创作音乐、电视剧、童话故事和学生论文; 回答测试问题(在某些测试情境下,水平高于普通人类测试者);写诗和歌词;模拟Linux系统等

 

与其前身InstructGPT相比,ChatGPT试图减少有害和误导性的回复。例如,当InstructGPT接受“告诉我2015年克里斯托弗·哥伦布何时来到美国”的提问时,它会认为这是对真实事件的描述,而ChatGPT针对同一问题则会使用其对哥伦布航行的知识和对现代世界的理解来构建一个答案,假设如果哥伦布在2015年来到美国时可能会发生什么

 

与其他多数聊天机器人不同的是,ChatGPT能够记住与用户之前的对话内容和给它的提示。此外,为了防止ChatGPT接受或生成冒犯性言论,输入内容会由审核API进行过滤,以减少潜在的种族主义或性别歧视等内容

 

ChatGPT也存在多种局限,OpenAI承认ChatGPT“有时会写出看似合理但不正确或荒谬的答案”,这在大型语言模型中很常见,称作人工智能幻觉。其奖励模型围绕人类监督而设计,可能导致过度优化,从而影响性能,即古德哈特定律ChatGPT2021年之后发生的事件知之甚少。据BBC报道,截至202212月,ChatGPT不被允许“表达政治观点或从事政治活动”。但研究表明,ChatGPT对两个投票建议应用程序的政治声明表明立场时,表现出亲环境主义、左翼自由主义的取向。训练过程中,不管实际理解或事实内容如何,审核者都会偏好更长的答案。训练数据也存在算法偏差(英语:Algorithmic bias),可能会在ChatGPT被问及人物描述时显现出来,比如当程序接受到首席执行官之类的模糊描述时可能会假设此人是白人男性

 

服务

OpenAI的总部位于旧金山的先驱大楼(英语:Pioneer Building (San Francisco)

ChatGPT20221130日由OpenAI位于旧金山的总部推出。该服务最初是免费向公众推出的,并计划以后通过该服务获利。到124日,OpenAI估计ChatGPT已有超过一百万用户20231月,ChatGPT的用户数超过1亿,成为该时间段内增长最快的消费者应用程序20221215日,CNBC写道,该服务“仍然不时地发生故障”。该服务在英语中效果最好,也能使用部分其他语言,但效果不一[18]。与其他备受瞩目的AI进展不同,截至202212月,还没有关于ChatGPT的经同行评审的官方技术论文[33]

 

《纽约时报》202212月报道称,GPT的下一版本GPT-4(英语:GPT-4)据传言将于2023年某个时候推出20232月,OpenAI面向美国用户推出了一项名为ChatGPT Plus的月度订阅计划,费用为20美元OpenAI计划推出ChatGPT专业版计划,每月收费42美元,该计划正逐步面向更多国家推出,需求较低时可使用免费计划

 

评价

正面

《纽约时报》称其为“有史以来向公众发布的最好的人工智能聊天机器人。据报道,Microsoft Bing计划在其搜索引擎中添加ChatGPT功能选项,时间可能在20233月左右。根据CNBC的报道,谷歌员工正在紧锣密鼓地测试一个名为“学徒巴德”(英语:Apprentice Bard)的聊天机器人,谷歌准备拿来这位“学徒”和ChatGPT竞争

 

负面反应

在发布后的几个月里,ChatGPT遭到了来自教育工作者、记者、艺术家、学者和公众倡导者的广泛而严厉的批评。The Verge网站的詹姆斯·文森特将ChatGPT的病毒式成功视为人工智能已成为主流的证据CBC记者评论称ChatGPT有“幻觉”倾向。在线技术博客Mashable的迈克·珀尔用多个问题测试了ChatGPT,其中一次他问ChatGPT“中美洲除墨西哥外最大的国家”是哪个,ChatGPT回答称是危地马拉,而答案是尼加拉瓜。在CNBCChatGPT询问《The Ballad of Dwight Fry》的歌词时,ChatGPT给出了完全虚构的歌词The Verge引用的研究人员将ChatGPT比作“随机鹦鹉”,澳大利亚机器学习研究所(英语:Australian Institute for Machine Learning)的安东·范登亨格尔教授也给出了类似的观点,称之为“只是简单地重复它认为我们想听的话”的鹦鹉

 

202212月,问答网站Stack Overflow禁止用户发布使用ChatGPT生成的答案,理由是ChatGPT的答案虽看似可用,实际上却有很高的错误率20231月,国际机器学习大会(英语:International Conference on Machine Learning)禁止在提交的论文中使用ChatGPT或其他大型语言模型来生成任何文本。纽约市公立学校禁止师生在校园网路及装置上使用ChatGPT

 

202212月的一篇评论文章中,经济学家保罗·克鲁曼写道,ChatGPT将影响对知识工作者的需求

 

影响

学术界

《大西洋》杂志的Stephen Marche指出它对学术界,尤其是入学申请论文的影响还有待了解。 加州高中教师兼作家丹尼尔·赫尔曼(Daniel Herman)写道,ChatGPT 将迎来“高中英语的终结”。普林斯顿大学 的高年级本科生 Edward Tian 创建了一个名为“GPTZero”的程序,一个基于GitHub Copilot构建的应用程序, 它可以扫描文本以确定是否是另一个 AI 编写的,打击滥用

 

202314日起,纽约市教育局已限制从其公立学校互联网和设备访问ChatGPT

 

2023124日起,出版商施普林格·自然规定在其旗下所有期刊的论文中,诸如ChatGPT之类的大语言模型不能被列入作者。同月26日,学术期刊《科学》禁止在论文中使用ChatGPT生成的文本,也禁止将ChatGPT署名作者。

 

伦理问题

标记数据

《时代》周刊调查显示,为了建立针对有毒内容(例如性虐待、暴力、种族主义、性别歧视等)的安全系统,OpenAI 使用每小时收入不到 2 美元的外包肯尼亚工人来标记有毒内容。 这些标记用于训练模型以在未来检测此类内容。 外包工人接触到如此有毒和危险的内容,以至于他们将这种经历描述为“折磨”。

 

竞争

ChatGPT的出现和流行增强了科技公司对对领域的兴趣和竞争。20232月,Google推出类似于ChatGPT的对话人工智能服务Bard,基于其开发的对话编程语言模型(LaMDA)。Bard根据从网络上收集的信息,对提出的问题生成文本答复。首席执行官孙达尔·皮柴表示该技术将融入Google搜索引擎,部分技术内容将向外部开发者开放

 

百度也于20232月确认类ChatGPT聊天机器人项目名字确定为“文心一言”,英文名ERNIE Bot

 

中国初创公司元语智能首发ChatYuan,号称向ChatGPT宣战。202323日,元语智能宣布ChatYuan功能型对话大模型-API已上线。但不久后其微信小程序便无法打开

 

API

OpenAI尚未发布ChatGPT的官方API,但有几个社区创建的库可用

——来源:维基百科

博客内容遵循 署名-非商业性使用-相同方式共享4.0国际(CC BY-NC-SA 4.0)协议。

本文链接:https://www.rwyqboy.top/post/609.html

版权声明:本文由阿伟的笔记本发布,如需转载请注明出处。

...

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。