主页(http://www.175shouji.com):智谱开源AutoGLM“会操作手机”AI
近日,国内人工智能公司智谱宣布了一项重要开源举措,将其核心AI智能体模型AutoGLM向公众开放。这一模型被官方定义为业内首个具备“手机操作”能力的开源AI Agent,标志着AI在理解和执行复杂、长序列手机应用操作任务方面取得了实质性突破。
根据官方介绍,AutoGLM的核心能力在于能够像真人用户一样,“看懂”手机屏幕上的信息,并精准模拟点击、输入、滑动等一系列交互操作,从而稳定完成诸如外卖点单、机票预订等涉及数十个步骤的复杂流程。这一能力与近期引发行业高度关注的“AI手机”演示功能颇为相似,但AutoGLM的开源策略,旨在将这种能力从少数厂商的封闭演示,推向更广阔的开放生态。
目前,AutoGLM已成功适配微信、淘宝、抖音、美团等超过50个国内高频使用的中文应用程序,覆盖了其核心使用场景。这意味着,硬件制造商、手机厂商以及广大的应用开发者,现在可以基于这一开源模型,在自己的设备或软件系统中,集成或开发出能够自动化处理日常手机任务的智能助手。此举有望彻底改变AI手机功能的开发模式,从过去依赖单一厂商深度定制和闭环优化,转变为由行业多方共同参与、快速迭代的“开放共创”新生态。
技术门槛与数据隐私,是当前AI手机普及面临的两大关键挑战。智谱此次开源AutoGLM,直接回应了这两个问题。一方面,开源模型大幅降低了企业,尤其是中小型硬件厂商和开发者,切入AI手机赛道所需的技术储备和研发成本,加速了相关功能的落地进程。另一方面,该项目同时支持本地与云端两种部署方案。用户或厂商可以选择将模型部署在本地设备上运行,确保所有的交互数据与隐私信息都保留在用户可控的范围内,这为对数据安全有严格要求的场景提供了可行的解决方案。
业界观察人士认为,AutoGLM的开源释放了一个明确信号:AI手机的未来竞争,将不仅仅是硬件算力或单一功能的比拼,更是生态开放性与协作效率的较量。通过开源核心的智能体模型,智谱试图在底层技术层面积聚更广泛的开发者共识,推动建立一套共通的、可互操作的标准和能力基础。这或将促使整个产业链重新思考AI与移动设备结合的方式,从打造封闭的“智能孤岛”转向构建开放的“智能网络”。
当然,作为一项前沿技术,AI智能体在实际大规模应用中仍面临诸多考验,例如对不同手机系统版本、千差万别的应用界面以及复杂异常情况的处理鲁棒性。AutoGLM的开源,为全球开发者社区提供了一个共同研究和改进的基线模型。其后续发展,不仅取决于智谱公司的持续投入,更有赖于开源社区能否汇聚合力,共同攻克这些长尾难题,最终让“会操作手机”的AI真正安全、可靠地服务于日常生活。

