智东西5月30日报道,今日,腾讯全新混元大模型首个App——“腾讯元宝”正式上线。
腾讯元宝定位于全能AI助手,针对效率场景的信息获取、处理和生产三大核心需求进行了深度优化。在日常生活中,它提供了图像生成、生活帮手、UGC创作等特色AI应用,并创新地加入了创建个人智能体等功能。
随着发布会结束,我们有幸与腾讯云副总裁、腾讯混元大模型负责人刘煜宏进行了深入交谈,探讨了元宝的差异化优势。
腾讯元宝的优势主要体现在三个方面:一是强大的产品工程能力,能够在工程方面有效压缩成本;二是腾讯的产品体系最全,对各个应用领域的适配度更强;三是混元大模型本身的性能优势,如去年开始在文生图方面采用DiT架构和MoE架构,技术演进迅速。
对于是否存在与其他AI产品同质化的问题,刘煜宏表示,腾讯做大模型的初衷是为了满足公司内部业务需求,并发现很多用户、企业也有这方面的需求,因此决定开放给大众使用。在产品化上,腾讯最优先考虑的是用户需求,而不是去对标竞品。
在商业模式方面,元宝App目前暂无C端收费计划。作为腾讯的首款混元大模型原生应用,腾讯元宝在生成速度和内容优质程度上表现出明显的优势。
刘煜宏提到,尽管AI应用层出不穷,但整体AI产品渗透率仍然很低。腾讯认为,这主要是因为大模型仍在发展期,产品解决方案不够成熟,应用场景有限。腾讯对未来的渗透率持有乐观态度,认为随着技术的不断进步和应用的不断拓展,AI产品将更加普及。
腾讯的混元大模型经过近一年的迭代,效果整体提升了50%,达到万亿参数规模,预训练预料也扩展到7万亿tokens。目前,腾讯内部已有600+业务接入混元大模型,每天调用量超2亿次。
基于用户洞察,腾讯认为大模型原生AI产品需要满足两大需求:一是贴近用户场景,包括职场办公、学习充电、休闲娱乐等;二是满足高频需求,如搜索问答、效率提升、创意生成等。为此,腾讯推出了全能AI助手腾讯元宝App,特别针对效率场景的信息获取、处理和生产进行了优化。
在AI搜索方面,腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎,并通过AI搜索增强技术提升时新类和知识类问题的效果。它覆盖了腾讯生态内容及互联网权威信源,答案准确性高,还提供参考资料和相关推荐,方便用户快速溯源及延伸阅读。
在AI总结方面,元宝支持上传最多10个PDF、word、txt等多种格式文档,并能够一次性解析多个微信公众号链接、网址,支持256k原生窗口上下文,功能强大。
在AI写作方面,元宝支持多轮问答,能够将对话的内容整理成报告,进行结构化输出。在日常生活中的各种场景下,腾讯元宝也能有问必答,提供图像生成、内容创作、学习助手、生活帮手、UGC创作等多种AI应用。
打开腾讯元宝App,主页面是一个对话框,顶部显示日期、天气、实时资讯以及随机问题建议,下方则提供了AI搜索、文档总结、网页总结、AI作图等能力的随机提问建议。设计简洁的提问降低了普通用户的使用门槛。
元宝的优化方向主要在于AI搜索、AI总结、AI写作。我首先试了AI搜索功能,系统推荐了“10元咖啡阿姨”的相关问题。元宝迅速给出了回答,从起源、背景信息、社会反响等多方面介绍了这一事情的发生经过和后续影响。当我追问店铺地址和营业时间时,元宝也准确提供了信息。
除了了解当下信息,用户也可以询问未来趋势或可能发生的事。我询问了苹果下个月的WWDC可能会发布什么新产品,元宝给出了合理的归纳整理。不过在部分信息上存在不够准确的情况,但通过查看参考资料链接可以纠正信息。
在图像识别方面,我上传了一张小猫实拍图,问元宝这是什么品种的猫。元宝首先答出是英国短毛猫,当我进一步追问具体品种时,它也能准确缩小范围至银渐层或蓝金渐层。
在AI总结能力上,元宝支持256k上下文窗口,我上传了一篇Llama论文让它帮我总结。元宝从引言、方法、主要结果等方面提炼了论文信息,并总结了主要贡献。对于英文财报的信息提取也是元宝的强项,我在使用中并未遇到数据不准确的问题。
对于长文本内容如《三体》中的故事内容提取,元宝虽然能提供一定的总结但