为什么一个车企要自研大模型?这个决策是怎么做出的? 陈伟:这个事情也是逐渐达成共识的,我们当时已经把线上的关于自然语言处理的技术,切换到了预训练的模式下,任务型对话能够在车里面,做车控、媒体、导航这样非常多垂域的覆盖,上面用预训练的模式能够快速高效地、高质量地完成这样的能力。 2022年年底,ChatGPT发布了,我们看到了大模型带来的认知智能和语言智能上突飞猛进的变化,这件事情对我们来说是有非常大震撼的。我们内部也在想,为什么我们没有快速地考虑把这个模型架做得那么高那么大。 后来想哥就提了一个话题,他说现在我们应该回归用户体验,核心的问题在认知智能上面。那么认知智能这件事,我们就需要考虑怎么把技术做升维,能够用更厉害、更先进的技术,把理想同学的认知快速拉上来,把天花板拉高。这件事对于我们后面去做基座模型,我觉得是指引性的状态。 所以我们必须要从基座,从底层开始建设,这样未来我们在做更多技术创新的时候,产品和研发才能有更快速的迭代,体验才能持续地去做创新,而不是只做行业的一个平均水平。
为什么一个车企要自研大模型?这个决策是怎么做出的? 陈伟:这个事情也是逐渐达成共识的,我们当时已经把线上的关于自然语言处理的技术,切换到了预训练的模式下,任务型对话能够在车里面,做车控、媒体、导航这样非常多垂域的覆盖,上面用预训练的模式能够快速高效地、高质量地完成这样的能力。 2022年年底,ChatGPT发布了,我们看到了大模型带来的认知智能和语言智能上突飞猛进的变化,这件事情对我们来说是有非常大震撼的。我们内部也在想,为什么我们没有快速地考虑把这个模型架做得那么高那么大。 后来想哥就提了一个话题,他说现在我们应该回归用户体验,核心的问题在认知智能上面。那么认知智能这件事,我们就需要考虑怎么把技术做升维,能够用更厉害、更先进的技术,把理想同学的认知快速拉上来,把天花板拉高。这件事对于我们后面去做基座模型,我觉得是指引性的状态。 所以我们必须要从基座,从底层开始建设,这样未来我们在做更多技术创新的时候,产品和研发才能有更快速的迭代,体验才能持续地去做创新,而不是只做行业的一个平均水平。