圆桌派|ChatGPT会改写新闻吗?
原创 熬夜冠军小组 新潮
图文|程艺丹
指导老师|白净
编辑|梅思婕
被称为“史上最强AI”的ChatGPT是一种基于GPT-3.5模型的大型语言模型,作为一种人工智能技术,ChatGPT可以分析和处理大量的文本数据,并生成高质量的自然语言文本。ChatGPT以及新发布的GPT-4掀起了广泛讨论,人们既关注它在多个行业的应用前景,也对自己的工作未来可能被人工智能取代表示担忧。
2023年3月19日下午,“新潮”与NEWS COFFEE共同发起本年度第一期“新潮圆桌派”,就“ChatGPT会改写新闻吗?”展开讨论。南京大学计算机学院王崇骏教授从技术层面为大家讲解了有关ChatGPT的知识。来自新闻、历史、计算机等专业的研究者,和对ChatGPT感兴趣的同学们一起,共同探讨了ChatGPT给新闻业带来的机遇与挑战。
讨论现场
以下是本次“圆桌派”讨论的部分精彩片段——
ChatGPT在技术层面是如何发展到今天的?
王崇骏老师:
如果我们把这件事情往前推,最早可以追溯到1891年解剖学家瓦尔德尔发现了神经元这件事情。在这之后,1943 年有个叫Pitts的人写了一篇关于神经元计算的文章,提出了神经网络这个概念。上世纪 90 年代,又出现了循环神经网络的概念。
2017年,为了解决循环神经网络中的一个问题,谷歌发布了transformer,由此诞生了今天的GPT,即生成式人工智能,而另一条路,是谷歌选择的判别式人工智能。
业内公认,人工智能最终能落地的,一定是谷歌。但有一帮年轻人不信邪,2015年成立了OpenAI,一个非盈利组织。他们带着打破谷歌 AI 垄断的技术梦想,开始了创新性挑战。2019年3月,OpenAI宣布公司重组,向盈利目标进军。他们给挣的钱设定了一个限额,就是成本的100倍,就是说,如果超过成本100倍的钱,他们会用于公益,或者继续研发。
王崇骏老师讲授ChatGPT的工作原理
高长江同学:
研发ChatGPT的第一阶段是预训练,即预测出语料的下一个字,相当于建立了一个人类语言的数学模型、概率模型;第二个阶段叫做instruction tune(指令微调),就是让它做一些事情,比如“请帮我把这句话翻译成英文”,或者“请讲一个故事”,或者“请给我写篇摘要”。做完了之后,它就有了在任务上的泛化能力。第三阶段就是人类反馈强化学习。在这个阶段会从和它的对话是否符合事实、是否安全、是否有意思等各个维度给它打分,通过训练让它的分数更高一点。
ChatGPT:
ChatGPT是基于 GPT(Generative Pre-trained Transformer)模型架构开发而来的。GPT 是一个基于自注意力机制的深度学习模型,用于自然语言处理任务,由 OpenAI 开发。GPT 模型通过多层堆叠的自注意力机制实现了对上下文的理解和记忆,能够有效地对输入的自然语言进行处理和生成。该模型经过了多次迭代和优化,从 GPT-1,到 GPT-2,再到 GPT-3,逐渐提升了模型的参数量和性能,并在多个自然语言处理任务上实现了领先的效果。
ChatGPT基于 GPT 模型架构进行了改进和优化,主要在以下几个方面进行了创新:
1.数据量的增加:ChatGPT 使用了比 GPT 更大规模的训练数据集,并引入了多语言数据,使得模型更具通用性和泛化能力。
2.对话式任务的适配:ChatGPT 在 GPT 模型的基础上,针对对话式任务进行了改进和调整,增加了对上下文的处理和记忆能力,能够更好地处理对话场景。
3.多轮对话能力的增强:ChatGPT 在 GPT 模型的基础上,增加了多轮对话的处理能力,使得模型能够更好地理解和生成连续的对话文本。
4.通过以上的创新,ChatGPT 在自然语言处理领域取得了很大的成功,并被广泛应用于各种对话式场景中,如智能客服、语音助手等。
ChatGPT的技术发展脉络
ChatGPT对新闻业会产生哪些影响?
它生成的有关新闻的内容具有足够的真实性和客观性吗?
王崇骏老师:
ChatGPT在新闻媒体领域有很多尝试,它能把大量简单的重复性的工作代替掉。这对媒体或许是一件好事,因为媒体从业者可以专心致志地去关注问题、发现真相等。
但是ChatGPT有几个很大的问题:第一,假如人们真的相信它生成的内容,那么人的认知就受制于它。而ChatGPT有一个最重要的特点,叫做“一本正经地胡说八道”。这样一来,可能你得到的信息都是假的。第二,现在的ChatGPT不能够理解人的心态,也无法生成创新性的风格,而且会存在事实性的错误。第三,ChatGPT目前的技术原理是基于已有的数据进行训练,数据有滞后性。新闻媒体、金融信息等强调实时性的工作,它都不能胜任。
周海燕老师:
我觉得ChatGPT在对待事实的问题上确实不够慎重,我有一次用它查亚历山大的最新论文,我把非常准确的英文名字给它,告诉它是在collective memory(集体记忆)领域里面引用率最高、最新的论文。结果它一本正经地列出另外一个亚历山大的论文。所以我疑惑机器到底是怎么抓取信息的?我觉得它对信息的核实能力是不足的。
讨论中的老师们
白净老师:
我试过给ChatGPT出了一个题目“纽约市一列火车出轨,死了24个人”。ChatGPT就开始流畅地写作,说纽约一列火车发生事故,并给出了具体的时间和地点,事故造成24人死亡, 1500余人受伤,细节很丰富。你或许会认为,这是在编假新闻,但对于ChatGPT来说,这是它回答人类给它的写作任务,就这么简单。它没法识别真实和虚假,它就是按照命题作文写一篇虚构故事。
ChatGPT:
ChatGPT对新闻业会产生很大的影响,特别是在新闻生成和自动化报道方面。由于 ChatGPT 具备强大的自然语言处理能力,可以生成类似于人类写作风格的文章,因此它可以用于自动生成新闻稿件、文章摘要、报道、评论等,为新闻行业提供更高效的生产方式。
然而,需要注意的是,ChatGPT 生成的有关新闻的内容不一定具有足够的真实性和客观性。虽然 ChatGPT 能够基于大量的数据进行训练,但是它的生成结果仍然受到训练数据的限制,也就是说,如果训练数据中存在误差、偏见或者谣言等,生成结果中也可能会存在类似的问题。
因此,在新闻业中使用 ChatGPT 生成内容时,需要对生成的内容进行严格的审核和编辑,以确保其真实性和客观性。此外,应该尽量减少 ChatGPT 生成新闻的使用范围,以避免出现误导读者或者误导公众的情况。
登录后可查看完整内容,参与讨论!
立即登录