低调又时髦,这才是男人眼
据他透露,目前很多创业公司正主动找到金山办公,希望跟金山办公承接好他们做完的网页。不久前,Soul全双工语音通话大模型全面升级,重新定义全双工交互范式,摒弃了传统语音交互中依赖的VAD(话音活性检测)机制与延迟控制逻辑,打破行业中普遍存在的轮次对话模式,赋予AI自主决策对话节奏的能力。据了解,全双工通话大模型即将在Soul平台内测,后续将陆续落地于虚拟人实时通话、AI匹配等1V1、多对多互动场景。此次活动现场,Soul也展示了关于全双工实时视频通话能力的最新探索成果,即基于全双工语音通话能力和实时视频生成能力,使用户可以看到AI的形象和世界,更多维、立体地塑造数字人格,促进关系的深度链接。SoulAppCTO陶明表示,在新质生产力深刻影响人类生活的当下,AI融入社交关系网络、重构交互方式已成为大势所趋。
大会期间,蘑菇车联围绕AI大模型在交通领域的应用,展示深度理解物理世界的AI大模型MogoMind、智能体与物理世界实时交互的AI网络等多项核心技术产品。田然指出,今天很多生成AIPPT的智能体产品,其实续费率是非常低的,他的用户留存、次月留存数据远低于一般产品的平均线,原因是这缺乏粘性和留存,只能解决用户一些简单的基础的问题,但却不能解决一些要求比较高的实用需求。据他透露,目前很多创业公司正主动找到金山办公,希望跟金山办公承接好他们做完的网页。在与新浪科技沟通中,金山办公助理总裁田然表示,一个好的AI办公软件或AI助理,是跟人一样的,你怎么去与一个(真人)助理沟通,就该怎样(用AI)去还原它。在他看来,对于office的理解就像是办公软件领域的芯片,外围的只是造手机,金山办公虽然
据悉,Wan2.2此次开源了文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-5B)三款模型,其中文生视频模型和图生视频模型均为业界首个使用MoE架构的视频生成模型,总参数量为27B,激活参数14B,均由高噪声专家模型和低噪专家模型组成,分别负责视频的整体布局和细节完善,在同参数规模下,可节省约50%的计算资源消耗,有效解决视频生成处理Token过长导致的计算资源消耗大问题,同时在复杂运动生成