“机器人之战：搭载Gemini的Bard与ChatGPT在第二轮比拼”

2023年12月11日 GPT

标题：机器人之战：Gemini动力的Bard和ChatGPT在第二轮中对决

今年4月份，我们比较了谷歌的PaLM动力Bard聊天机器人和OpenAI的ChatGPT-4，以看看哪个人工智能聊天机器人表现更好。这一次，随着Bard采用了新的Gemini语言模型，我们决定重新考察这场聊天机器人之战。我们将Gemini动力的Bard与ChatGPT-3.5和ChatGPT-4 Turbo进行比较。我们还查看了使用Gemini之前的Bard模型的结果，以评估谷歌的进展。这些测试主要聚焦于普通用户每天都会涉及的任务。

在第一项测试中，我们要求聊天机器人生成5个原创的父亲笑话，但两个模型都在原创性方面遇到了困难。大部分笑话可以在谷歌搜索中以原文或稍作改写的形式找到。有趣的是，ChatGPT-4 Turbo提到了一个关于一个名叫布莱恩的孩子是以托马斯·爱迪生命名的笑话。尽管完全相同的措辞在搜索中找不到太多相关信息，但它引发了一个发现：国际足球明星贝利显然是以托马斯·爱迪生命名的。

在第二项测试中，我们要求聊天机器人写一段2000年时，一位PowerPC处理器的粉丝和一位Intel处理器的粉丝之间的5行辩论。与较老版本的Bard相比，采用Gemini动力的Bard提供了一个更多专业术语的答案。它提到了AltiVec指令，RISC与CISC设计，以及MMX技术。新的Bard还暗示这种辩论可以无限延续下去。在ChatGPT方面，GPT-3.5给出了一个冗长的回答，而GPT-4 Turbo则提供了一个更简洁的论点，关注于一个普遍的“性能 vs 兼容性”的论点。

总体而言，在父亲笑话方面，聊天机器人的表现同样缺乏原创性，但ChatGPT-4 Turbo因贝利的发现而受到赞赏。在辩论对话测试中，ChatGPT能够很好地解释辩论的双方观点，而不依赖于令人困惑的术语，这使它成为这一类别的赢家。

GPT