打开金融界APP 快速获取更多重要资讯

衔远科技周伯文:大模型需要与应用场景相结合,中美GPT追赶是个动态过程

钛媒体 2023-05-31 09:18:19

  衔远科技创始人、清华大学惠妍讲席教授、电子工程系长聘教授 周伯文

  “现在像ChatGPT这样的大模型进展很快,但问题在于它可能一本正经的‘胡说八道’,尤其在专业领域,外行看它像内行,内行看它像外行;内容的原作者视其剽窃,但普通用户则视其在创造,实际它尚不具备原创性的思想。”5月28日2023中关村论坛期间,人工智能(AI)技术公司衔远科技创始人周伯文对钛媒体App表示。

  周伯文强调,大模型需要与应用场景相结合,衔远科技从一开始就把底层的 AI 技术跟解决实际问题紧密结合在一起,通过ProductGPT的生成式AI、多轮对话人机协同,以软件即服务的方式帮助企业与消费者实现 AI 时代的产品创新以及对数智化的正确认知。

  据悉,衔远科技成立于2021年底,是全球领先的致力于链接消费者与商品的 AI 公司。以前沿的 AI 技术帮助企业数实融合,自主研发并建立领衔CIP平台,实现从需求洞察到产品创新全过程数智化。

  建立衔远科技之前,周伯文是京东集团技术委员会主席,更早之前则是美国 IBM 人工智能基础研究院院长,目前任职清华大学惠妍讲席教授、电子工程系长聘教授,以及协同交互智能研究中心主任。

  周伯文提出的“自注意力融合多头机制”的自然语言表征机理,成为ChatGPT背后所使用的Transformer架构的核心思想之一,他还曾与图灵奖得主Yoshua Bengio在NLP方向合作发表论文,至今已被引用超2000次,其论文总引数已近15000次。

  随着ChatGPT引发微软、谷歌、阿里等科技巨头竞逐大模型,作为深耕 AI 领域二十年的产学研老兵,周伯文也不例外。今年3月,衔远科技宣布完成数亿元天使轮融资,由启明创投领投、经纬创投跟投。同时,周伯文发布了一则 AI 英雄帖,誓言要打造中国版ChatGPT。

  周伯文表示,中国的ChatGPT需要探索一条新的道路,即垂直整合从自有基础大模型到应用、到终端用户的全场景闭环,以实现生成式 AI 技术与商业价值“双落地”。目前,衔远科技基于 AI 的多模态理解、推理与生成能力,通过ProductGPT支持多轮对话,与专业人员深度交互与协同,帮助企业高效打造爆款创新产品并实现业务增长价值。

  在2023中关村论坛 AI 大模型发展论坛上,周伯文提到这轮GPT热潮和之前 AI 技术的不同:一是深层次 AI 是通用人工智能(AGI)的必经之路,以前是理解做 AI,判断出的结果是模糊的,如今是倒逼通过生成式 AI 来清晰的解决问题;二是之前的 AI 是通过击败人类来获得广泛的注意力,而本轮 AI 技术的成功是人与 AI 协同交互的结果,即人与机器共同创造了GPT大模型的成功,并带来新的技术突破。

  周伯文告诉钛媒体App,衔远科技研发的大模型可能是历史上第一次用统一的大模型,在五个阶段帮助企业去做全周期数字化升级,总结有四点:

  周伯文表示,衔远科技从一开始就将底层 AI 技术和实际问题紧密结合在一起,同时把核心能力和应用场景相结合,所以我们从技术、产品到市场的整个商业化路径非常清晰。

  “现在一方面,是帮助企业端去提升产品全周期创新效率。另一方面我希望衔远科技走出一条有自己坚持和判断的路径。同时,在商业模式上持续迭代底层能力,做与别人不一样的事情。”周伯文对钛媒体App表示。

  他认为,大模型的创业和之前互联网时代“小步快跑、快速迭代”的产品逻辑完全不同。举个简单的例子,之前大模型圈子有两个技术路线,一个是Attention注意力机制,另一个是self-attention自注意力机制,如果那时的技术团队没有选择去走后者即GPT的路径,那么即使小步快跑一样会输掉,再靠快速迭代也已来不及了。

  “互联网竞争时期资金效率更高,商业模式更成立。而现在,由于大模型技术的不断迭代,技术本身已不具备最终的确定性。”周伯文表示。

  对于中美大模型差距与追赶话题,周伯文对钛媒体App表示,这是一个动态的过程,如果是纯粹从追赶角度来说,两个国家的 AI 产业发展速度都很快。

  “我不是一个对追赶这件事愿意发表预测的人,因为我觉得还是要找到自己的(大模型)路线。”周伯文强调。(本文首发钛媒体App,作者|林志佳)

  

  

金融界提醒:本文内容、数据与工具不构成任何投资建议,仅供参考,不具备任何指导作用。股市有风险,投资需谨慎!
精彩推荐
全部评论
谈谈你的想法...
App内打开