找图片的软件（头像搜索图片识别）-石高峰经验网

2024-12-0701:43:58综合资讯1

智东西5月30日报道，今日，腾讯全新混元大模型首个App——“腾讯元宝”正式上线。

腾讯元宝定位于全能AI助手，针对效率场景的信息获取、处理和生产三大核心需求进行了深度优化。在日常生活中，它提供了图像生成、生活帮手、UGC创作等特色AI应用，并创新地加入了创建个人智能体等功能。

随着发布会结束，我们有幸与腾讯云副总裁、腾讯混元大模型负责人刘煜宏进行了深入交谈，探讨了元宝的差异化优势。

腾讯元宝的优势主要体现在三个方面：一是强大的产品工程能力，能够在工程方面有效压缩成本；二是腾讯的产品体系最全，对各个应用领域的适配度更强；三是混元大模型本身的性能优势，如去年开始在文生图方面采用DiT架构和MoE架构，技术演进迅速。

对于是否存在与其他AI产品同质化的问题，刘煜宏表示，腾讯做大模型的初衷是为了满足公司内部业务需求，并发现很多用户、企业也有这方面的需求，因此决定开放给大众使用。在产品化上，腾讯最优先考虑的是用户需求，而不是去对标竞品。

在商业模式方面，元宝App目前暂无C端收费计划。作为腾讯的首款混元大模型原生应用，腾讯元宝在生成速度和内容优质程度上表现出明显的优势。

刘煜宏提到，尽管AI应用层出不穷，但整体AI产品渗透率仍然很低。腾讯认为，这主要是因为大模型仍在发展期，产品解决方案不够成熟，应用场景有限。腾讯对未来的渗透率持有乐观态度，认为随着技术的不断进步和应用的不断拓展，AI产品将更加普及。

腾讯的混元大模型经过近一年的迭代，效果整体提升了50%，达到万亿参数规模，预训练预料也扩展到7万亿tokens。目前，腾讯内部已有600+业务接入混元大模型，每天调用量超2亿次。

基于用户洞察，腾讯认为大模型原生AI产品需要满足两大需求：一是贴近用户场景，包括职场办公、学习充电、休闲娱乐等；二是满足高频需求，如搜索问答、效率提升、创意生成等。为此，腾讯推出了全能AI助手腾讯元宝App，特别针对效率场景的信息获取、处理和生产进行了优化。

在AI搜索方面，腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎，并通过AI搜索增强技术提升时新类和知识类问题的效果。它覆盖了腾讯生态内容及互联网权威信源，答案准确性高，还提供参考资料和相关推荐，方便用户快速溯源及延伸阅读。

在AI总结方面，元宝支持上传最多10个PDF、word、txt等多种格式文档，并能够一次性解析多个微信公众号链接、网址，支持256k原生窗口上下文，功能强大。

在AI写作方面，元宝支持多轮问答，能够将对话的内容整理成报告，进行结构化输出。在日常生活中的各种场景下，腾讯元宝也能有问必答，提供图像生成、内容创作、学习助手、生活帮手、UGC创作等多种AI应用。

打开腾讯元宝App，主页面是一个对话框，顶部显示日期、天气、实时资讯以及随机问题建议，下方则提供了AI搜索、文档总结、网页总结、AI作图等能力的随机提问建议。设计简洁的提问降低了普通用户的使用门槛。

元宝的优化方向主要在于AI搜索、AI总结、AI写作。我首先试了AI搜索功能，系统推荐了“10元咖啡阿姨”的相关问题。元宝迅速给出了回答，从起源、背景信息、社会反响等多方面介绍了这一事情的发生经过和后续影响。当我追问店铺地址和营业时间时，元宝也准确提供了信息。

除了了解当下信息，用户也可以询问未来趋势或可能发生的事。我询问了苹果下个月的WWDC可能会发布什么新产品，元宝给出了合理的归纳整理。不过在部分信息上存在不够准确的情况，但通过查看参考资料链接可以纠正信息。

在图像识别方面，我上传了一张小猫实拍图，问元宝这是什么品种的猫。元宝首先答出是英国短毛猫，当我进一步追问具体品种时，它也能准确缩小范围至银渐层或蓝金渐层。

在AI总结能力上，元宝支持256k上下文窗口，我上传了一篇Llama论文让它帮我总结。元宝从引言、方法、主要结果等方面提炼了论文信息，并总结了主要贡献。对于英文财报的信息提取也是元宝的强项，我在使用中并未遇到数据不准确的问题。

对于长文本内容如《三体》中的故事内容提取，元宝虽然能提供一定的总结但

登录 找回密码