近日,宾夕法尼亚大学沃顿商学院副教授EthanMollick发表了三篇论文,证明了AI在实际情境中的创造力。
“GPT-4在替代用途测试中击败了91%的人类,在托伦斯创造性思维测试中击败了99%的人类。”
“我们得到的人工智能不再是全是逻辑的,而是能够编造信息、参与情感讨论,并且具有极强的创造力。”
论文翻译见下:
人工智能产生的想法通常被认为比人类提出的想法更有创意、更实用。
AI本该只有逻辑能力,没有想象力,但现在的AI却能编造信息,参与(看似)情感化的讨论,并展现出强大的创造力。这一现象让许多人深感不安。
创造力是什么?这在目前并没有统一的定义。不过,研究人员还是开发出了一系列针对人类的创造力测试,尽管这些测试或多或少都存在一些缺陷和争议,但在以往的应用中,这并不算太大的问题。
然而这些方法在面对人工智能,特别是GPT-4这样的先进人工智能时,却出现了问题。
如今,GPT-4在替代用途测试(AlternativeUsesTest)中超过了91%的人类,在托伦斯创造思维测试(TorranceTestsofCreativeThinking)中超过了99%的人类,这表明AI在创新思维和问题解决方面的能力已经超过了大部分人类。
这对AI的发展和应用无疑是一个重要的里程碑。但另一方面,我们也正在失去能够挑战AI创造力的测试工具。
虽然这些心理测试很有趣,但将人类的测试应用到AI上可能会有风险——因为AI可能已经接触过类似测试和题目的答案,那么它所做的只是在重复答案(尽管研究者已经采取措施尽量减少这种风险)。
并且,心理测试也不一定能证明AI能够提出现实可行的创意。
然而,在过去的几周里,我们从三篇新的实验性论文中了解到,AI确实能够在现实环境中展现出创造力。
我想简要讨论这些论文,然后根据他们的结果给出一些关于如何使用AI进行创意生成的实用建议。
01
AI在实践中的创造力
这三篇论文都直接在控制实验中比较了AI的“创造力”(AI-poweredcreativity)和人类的“创造性努力”(humancreativeeffort)。
第一篇重要的论文,来自沃顿商学院的研究者举办了一个创意生成比赛:让GPT-4与知名创业课程的学生们竞争。随后,研究者会让人类评委来评估AI和学生们的创意质量。
结果发现,GPT-4生成的创意比学生们的更多、更便宜、更好。更令人印象深刻的是,从商业角度来看,外部评委对AI生成的创意的购买意愿也更高!在评委评选出的40个最佳创意中,有35个来自GPT-4。
第二篇论文又进行了一项大众化的比赛,研究者邀请人们提出与再次利用、回收或共享产品相关的循环经济方面的商业创意,并让评委将这些创意与GPT-4生成的创意进行比较。
结果发现,AI和人类生成的创意的整体质量水平相似,但AI在可行性和影响力上被评价为更好,而人类生成的创意更具新颖性。
而在最后一篇论文里,研究者开始