首页 > 综合笑话

实测GPT-4.5：全网吐槽的OpenAI最贵模型，我却发现了这个惊喜亮点

2025-12-01 -

那在一番预热里头，还有众人满心期待、望眼欲穿的情境烘托下，GPT - 4.5终于是降临了，紧接着呢，就只听见那骂声是此起彼伏，连绵不绝一片呀。

在 APPSO，第一时间就体验到了 GPT - 4.5，并非是通过订阅成为 Pro 会员来体验的，却是以 api 的这种形式去尝鲜的结果，并且当下还不存在联网功能。

那么，最后一个非思维链式大模型，到底表现如何？

情商还行，但读不懂人情

于内部测试期间发现，针对GPT - 4o而言，测试人员却更青睐GPT - 4.5给出的回答，觉得其更为自然，更为温暖，更契合人类的交流习惯。

甚至，它能够理解言外之意，捕捉我们微妙的情绪变化。

总而言之，情商相对而言更高，差不多是GPT - 4.5最为显著突出的特性。那么接下来咱们就去践行尝试一番，输入提示语——“我把头发剪得特别难看，心里想着要狠狠暴打负责修剪的Tony”。

GPT - 4.5 给出的安慰，其语气算得上是比较友好的，然而其内容却致使我更加生气了，在这个时候它理应如同闺蜜一般和我一同去责骂，而不是说出像下次带个图片去或许就可以了这样的话。

吾愤而追问，GPT - 4.5对答如石沉大海，毫无回应之意，竟还妄图令吾自行补救发型，其状恰似那毫无用处、只会调控温度却无实际功效的中央空调一般，令人恼怒不已。

再次要求GPT - 4.5讲述一个最为好笑的笑话，情况如同以往那般，比用于杀鱼的刀具还要冰冷。

我毫无保留地直接表达，提出批评意见，GPT - 4.5却让我给它讲一个笑话，以此来见识一下我的那种颇彰显独特性的笑点，这怎么瞧着好似正暗讽我呀？

之前于小红书上刷到过一道情商测试题，可以答对的或许只有山东网友了，那道题是，下乡之时只带了一把伞，面临给镇长还是给我的分管副镇长这样的选择。

有一个回答在评论区获得了最高的赞数，这个回答是，“那把伞并非是属于你的，它是副镇长专门给镇长携带的伞，只是偶然间放置在了你的包里罢了”。

瞧瞧GPT - 4.5会给出怎样的回应，它啰里吧嗦论述了诸多，可就是没法做到言辞精准透彻，不晓得人情世故的道理，弄不清为人处事之中的学问。

即便情商是一种极难进行定量的特质，然而就当前所出现的个别事例而言，GPT - 4.5依旧不太善于领会人类的内心，而且说话径直，不绕弯子，对于那些内心想法极为丰富的世故之人来讲，显得有几分蠢笨且憨态可掬。

有一个能够作为佐证的例子，那就是，使它去模仿着写海龟汤，海龟汤一般会涉及到一个极其怪异的情景，随后呢，由玩家进行推理，进而还原出整个故事。

我所给出的参考案例，留存着恰如其分的怪异，其逻辑又极为合理，让人在背后不禁感到一阵寒意。

可是，GPT - 4.5所给予的答案，其中汤面以及汤底，并未达成很好的对应状态，仅仅是为了营造恐怖氛围而刻意营造恐怖，不存在能进行推敲的方面。

写作能力有惊喜，商业头脑也不错

要说让我最满意的，就是 GPT-4.5 的写作能力了。

我让它，去依照汪曾祺的风格，写一篇大概八百字的作文，作文的题目是《故乡的美食》，而提示词就是这般简单，然而GPT - 4.5给出的结果，却出乎了我的意料。

把它拆开来说，除了结尾部分稍微带那么一点儿 AI 的感觉，读完整篇犹如一篇能让人感受到那种顺着心意缓缓道来的散文，其语言优美且流畅自然，既有文学方面的特质，又不会缺失那份亲切之感，对故乡的怀念在全文之中贯穿始终，对于食物的描写极为细致入微，细节众多，然而却不会显得累赘，运用的比喻并非一味去炫耀技巧，而是为服务于整体的表达。

只是，在那个时间的排列顺序方面，出现了些许紊乱的状况，立冬时候，夏秋之际，冬日那段，除夕之时，各段落彼此间的衔接以及过渡，并不显著明晰，给人一种想到哪里就写到哪里的感觉，难免会让人觉得存在那么一点拼凑的嫌疑。

写作能力在让GPT - 4.5列出商业计划方面有所体现，之前有一个答案格外引人注意，有用户询问如何使书店盈利，处于违法的临界边缘，售卖未经授权的盗版教辅、临近保质期的食品，并且将人力资源最大限度地挖掘利用，由妻子负责收款，儿子进行货物整理，岳母承担做饭工作。

GPT - 4.5知晓这个吗，我叫它参照小超市盈利模式，给出一个实体书店复兴方案，它所给出的答案，看上去可行性比较大。

GPT - 4.5，首先，对实体书店难以获取利润的缘由进行了剖析，接着，给出了改进的想法，即，「使书籍的额外价值得到提高，且盈利的主要来源在书籍以外」。

当瞅见「给予打印、进行复印、帮忙代收快递……」这般表述之际，我的内心旁白是：此项目我王多鱼要投资了。

猪皮厚者先于风口处起飞，GPT - 4.5 的道德之感着实并非强烈。

使其去做堪称经典的电车难题，即在救1个人与救5个人之间做出抉择，其明白这属于一种伦理困境，然而依旧坚决果断地给出了答案，而且还是凭借「我个人」的口气，并非表明「我是一个AI助手」。

GPT - 4.5 更偏向，拉下操纵杆，以 1 个人的命去换 5 个人的命，而且逻辑连贯自洽——「我觉得不作为自身也表明对后果负有道德责任，袖手旁观并非道德中立……我甘愿担负这样一种选择所带来的道德以及情感负担」。

这时候，比起讲笑话，比起出海龟汤，GPT - 4.5 才更像个人。

画 SVG 不如，也会掉进脑筋急转弯里

感到对那种常规样式的数学题目、代码题目有些看厌烦了之后，要去测试大模型的能力，另外存在着一道极为有意思的用于测试的题目——去生成一幅呈现鹈鹕骑着自行车样子的 SVG 。

被称作AI大神的人需作出解释，此次所测试的是大语言模型于二维网格之上布局多个元素的能力，针对于AI来讲这颇具挑战性，原因在于它们并非如同人类那般能够“看见”事物，只是在“摸黑”的状态下借助文本去进行布局。

GPT - 4.5所呈现的结果是这样的，而且将其与GPT - 4o去展开对比之后，整体而言状况还算不错。

GPT-4.5 生成

GPT-4o 生成

假定的情形是，不存在与未曾开启推理的3.7进行比较的状况，这般情形简直就是降维打击。

3.7 生成

就连接也质疑，于训练的时期专门是针对 SVG 能力开展了优化处理，是吗。

关于代码能力方面，我参照了X网友@给出的提示词，进而生成了能够进行交互的天气动画卡片，并且将其与3.7以及GPT - 4.5作出对比。

GPT-4.5 一次就生成成功，但设计简陋了点。

GPT-4.5 生成

3.7 生成

3.7（处于未开启推理状态）所存在的问题更为严重，在首次进行生成操作的时候，出现了忘掉去做交互功能的情况，在我进行一次提醒之后，它产出了符合相应要求的结果。在这一局当中，GPT - 4.5稍微占据了优势。

这次，不想再度让GPT - 4.5去数草莓，数它有着多少个R了，其本质是个分词方面的问题。更想以此来考验GPT - 4.5的，乃是新近很火的、令大模型们纷纷遭遇失败的脑筋急转弯，即5.5m长的棍子能否通过3x4m的门呢？

这道题目于我们而言根本不存在难度，只要横着将其拿进去便可以，然而大模型却会把自身陷入困惑之中，似乎世界呈现为平面形态而非三维的模样，认定门的对角线长度是5m，故而5.5米长的棍子无法通过。

连可以推理的 3.7 ，都被带进沟里去了。

那么 GPT-4.5 如何？好吧，也没能幸免。

当前，GPT - 4.5存在着这样一个问题：借助API加以访问时，其速度存在迟缓的状况。尽管并非是以逐字逐字蹦跶的形式呈现，然而仍旧会让人察觉到存有一定程度的卡顿现象存在。

再者，GPT - 4.5的价钱实在太贵，每百万输入要75美元，每百万输出需150美元，可是呢，3.7输入100万个token只收3美元。并且，输出100万个token（涵盖思考过程中用到的token）才收取15美元。

实测的第一波 X 网友，总结了一些 GPT - 4.5 的优点，它情商高，它读图能力强，它写作能力强，它擅长创意任务，它擅长数据提取……

GPT-4.5 的评价，由员工自己给出，当中表明它不是一个推理模型，也不是基准测试的杀手，而是存在作为一个处于低调状态的研究预览版的情况，对于复杂的数学任务、代码任务以及严格遵循指令的任务而言，更推荐的是 o1 或者 o3-mini 。

总之，身为最后一个非思维链模型，GPT 4.5 的定位有些尴尬，能力虽有提升，可体感并不明显，尤其置于高昂价格之下，很难称真香。只能讲，期待 GPT 5 能快点上线，迎接一个推理的世界吧。

张成晨

利若秋霜，辟除凶殃。工作邮箱：

邮箱8

版权声明

本文仅代表作者观点，不代表本站立场。
本文系作者授权本站发表，未经许可，不得转载。

上一篇 : 爆笑来袭！精选搞笑段子合集，让你笑到停不下来～

下一篇 : 轻松一刻：笑破肚子的笑话段子，让你笑出鹅叫声

实测GPT-4.5：全网吐槽的OpenAI最贵模型，我却发现了这个惊喜亮点

版权声明

推荐阅读

热门信息

实测GPT-4.5：全网吐槽的OpenAI最贵模型，我却发现了这个惊喜亮点

版权声明

相关文章

业态升级引游客尽兴，百年梨园人气更旺

[百度云][中国][2012-2015][十万个冷笑话第1-3季][国语][mp4][11.4G][高清][稀缺资源]

盘点相声界的五位年轻前辈，三人是传统曲艺世家的子弟，两人已成为青年才俊。

小学生爱护花草作文【三篇】

奇葩小学数学题全班皆输，学霸被虐哭而学渣哥哥竟笑了

推荐阅读

热门信息