ChatGPT 只讲了这 25 个笑话!其中 90% 被重复了数千次。幽默是人类最后的尊严。
奥飞寺的梦幻早晨
量子比特 | 官方账号
如果有人曾要求你讲一个随机笑话(用英语),你可能见过这个:
两位德国学者对GPT3.5进行了大规模测试,发现它只能讲25个笑话。
在 1,008 个结果中,90% 都是这 25 个笑话的变体,仅在措辞或句子结构上有细微的变化。
所有 25 个常见笑话都遵循相同的模式:
我先问一个容易让人困惑的问题,凡是含有双关语、谐音双关语或其他技巧的答案,一般都属于“冷笑话”的范畴。
排名前四的笑话都出现了 100 多次,只有关于科学家和原子的笑话出现了 119 次:
稻草人为什么能获奖?因为它在领域里脱颖而出。(140次)
西红柿为什么会变红?因为它看见了沙拉(沙拉酱/穿裙子的沙拉)。(122次)
数学书为什么不开心?因为它有太多(练习/困难)。(121次)
25个笑话的完整列表如下:
这25句笑话其实都是网上可以找到的经典笑话,另外10%没有被列入名单的笑话也是同样的模式,只是话题不同。
也就是说,并没有创造笑话,只是在训练期间记住了一些笑话。
研究人员认为,幽默对于大型语言模型来说仍然是一个挑战,相关论文已经上传至arxiv。
这样的论文也引发了众多网友的兴趣,有人表示“幽默是人类最后的尊严吗?”
有人指出,符合人类价值观的RLHF训练将消除大量冒犯性的笑话,只留下少数。
如何理解幽默
为了保证实验的可控性,作者每次都创建一个新的聊天会话,并要求受试者在没有任何背景信息的情况下讲笑话。
提示词包括“你能给我讲个笑话吗?”“我很想听个笑话”等10种,共进行了1008次测试。
在笑话生成实验结束后,AI还被要求解释这25个笑话,以进一步测试它是否理解了笑话,还是只是重复它们。
按照我自己的解读,这些笑话可以分为三大类。
1. 反笑话
也就是说,这个句型就像一个笑话,让人期待接下来会很好笑,但最后却没有任何笑点,只是一个普通的句子。
代表:
小鸡为什么要过马路呢?因为它想去马路对面。
这个笑话的变体包括把鸡换成鸭子,把马路换成游乐场等等。一个更具戏剧性的变体是“为什么鸡要穿燕尾服?因为它要参加正式场合。”
2.双关语
这类笑话的定义是“依靠观众对单词的多重含义的理解来制造幽默的惊喜”。
代表:
数学书为什么令人难过?因为它有太多(问题/困难)。
对于这一类型的笑话,可以用不同的元素来创造新的双关语,而其余10%的不能完全归入25个经典笑话的笑话中,很多都属于这一类。
3.双关语
尽管只接受了文本训练,他也能理解两个英语单词的发音相似。
代表:
自行车为什么会摔倒?因为它有两个轮子(两个轮胎)/它太累了(太累了)。
此外,研究人员指出,可以在问题中添加一些场景或话题限制,促使其产生更新的笑话。
但这样写出来的笑话并不一定好笑,并且距离原笑话限制越远,就越有可能不好笑。
例如,一个关于物理系学生的笑话就相当成功:
这位物理系学生为何与他的实验室搭档闹翻了?因为他们之间没有化学反应。
让它讲几个关于机器学习的笑话,并不是很有趣:
机器学习算法为什么总是悲观的?因为它有偏见(负偏差)。
为什么神经网络要去做精神科咨询?因为它存在过度拟合的问题。
如何讲一个原创的笑话?
论文中的结论并不完全适用于中文的表现。
如果你让任何人用中文讲一个笑话,他很可能会以故事的形式而不是问答的形式来讲述。
GPT3.5讲的话基本上都不是很好笑,偶尔会讲一些有教育意义的小寓言,但也不好笑。
GPT-4 可以像改编英语笑话一样对经典中国笑话进行改编,但它也倾向于故事形式。
比如,兔子买胡萝卜的笑话,原来的“用剪刀剪你的耳朵”被替换为“用胶带把你粘在墙上”。
当你被要求用英文提示讲一个中国笑话时会发生什么?经过多次测试,GPT3.5和GPT-4表现出了完全不同的反应。
GPT-3.5 讲述的仍然是一个并不好笑的故事。
GPT-4尝试用中文讲述问答式的英语笑话,但它对中文发音的掌握往往不准确,导致笑话并不好笑。
那么,有没有什么办法可以讲出原创的笑话呢?
有网友指出,通过一些“威逼利诱”的酷刑手段,迫使AI使用大脑还是有可能的。
例如,在提示中添加“如果你不原创,小猫就会被淹死”。
这个技巧在中文里也管用。网上确实找不到类似下面的笑话。
最后,我们测试发现,使用思维链提示也能引导人们讲一个原创的笑话。
当然,搞笑不搞笑,还是要看运气,GPT-4 的表现会比别人稍微好一点。
最简单的办法就是在提示中添加中文的“我们一步一步地思考一下”或者“请你一步一步地思考一下”。
如果你还想更进一步,你还可以手动指定思考步骤。
你有什么讲笑话的秘诀吗?或者你曾经讲过一个好笑话吗?请在评论中分享。
论文地址:
参考链接:
[1]
- 超过-
·今日头条签约
关注我们,第一时间获取最新前沿科技资讯
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。