阿里云CTO周靖人:“通义千问”不是起点也不是终点

  4月7日,阿里巴巴旗下大语言模型——“通义千问”开启邀测。

  开发“通义千问”的阿里巴巴达摩院如是解释这款大语言模型的命名:“千问,千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的,也一定是真有学问,以及,AI和我们一样,都有千万次交互的热情。”

  而在使用邀请码对大模型产品测试了一天后,我们也有机会和它背后的负责人,阿里云智能CTO周靖人进行了一次独家对话,提出了我们的“千问”。

  阿里云智能CTO周靖人:

  怎么去全面评测一个大模型本身是非常有挑战的。其实今天整个行业还没有一个标准。甚至每个人的评价其实也是很主观的,对吧?

  有时候更多的是说,让模型能面对你的一些回复,揣测到你到底是喜欢哪一种说话的方式,然后会不断去调整,这本身就是模型在理解方面的一个能力。

  我们会有一系列的评测,其中简单的测试包括一些创作,一些文案的续写,一些简单的推理,甚至一些简单的数学。包括今天跟一些多模态的延展,还有一些知识增强的测试。

  现在我们内部是有一个测试集,而慢慢以后都会从让人去评价一个模型,变成用模型去评价一个模型本身,我们一定会走到这一步。

  今天我们在不断探索基于多模态的大模型的路径上,或者说接近于多模态真正的趋近人类智慧体的路径上的一个节点。它不是起点也不是终点,是个既定路线上的节点。我们这次是把过去积累的一部分工作向社会,向开发者开放,但我们在这方面还有长足的工作,需要进一步地去突破去创新。

网友留言(0 条)

发表评论

验证码