“机器人之战:搭载Gemini的Bard与ChatGPT在第二轮比拼”

标题:机器人之战:Gemini动力的Bard和ChatGPT在第二轮中对决

今年4月份,我们比较了谷歌的PaLM动力Bard聊天机器人和OpenAI的ChatGPT-4,以看看哪个人工智能聊天机器人表现更好。这一次,随着Bard采用了新的Gemini语言模型,我们决定重新考察这场聊天机器人之战。我们将Gemini动力的Bard与ChatGPT-3.5和ChatGPT-4 Turbo进行比较。我们还查看了使用Gemini之前的Bard模型的结果,以评估谷歌的进展。这些测试主要聚焦于普通用户每天都会涉及的任务。

在第一项测试中,我们要求聊天机器人生成5个原创的父亲笑话,但两个模型都在原创性方面遇到了困难。大部分笑话可以在谷歌搜索中以原文或稍作改写的形式找到。有趣的是,ChatGPT-4 Turbo提到了一个关于一个名叫布莱恩的孩子是以托马斯·爱迪生命名的笑话。尽管完全相同的措辞在搜索中找不到太多相关信息,但它引发了一个发现:国际足球明星贝利显然是以托马斯·爱迪生命名的。

在第二项测试中,我们要求聊天机器人写一段2000年时,一位PowerPC处理器的粉丝和一位Intel处理器的粉丝之间的5行辩论。与较老版本的Bard相比,采用Gemini动力的Bard提供了一个更多专业术语的答案。它提到了AltiVec指令,RISC与CISC设计,以及MMX技术。新的Bard还暗示这种辩论可以无限延续下去。在ChatGPT方面,GPT-3.5给出了一个冗长的回答,而GPT-4 Turbo则提供了一个更简洁的论点,关注于一个普遍的“性能 vs 兼容性”的论点。

总体而言,在父亲笑话方面,聊天机器人的表现同样缺乏原创性,但ChatGPT-4 Turbo因贝利的发现而受到赞赏。在辩论对话测试中,ChatGPT能够很好地解释辩论的双方观点,而不依赖于令人困惑的术语,这使它成为这一类别的赢家。

下一页
上一页