豆包手机被微信「拒绝」后,阿里系 APP 被曝也禁止其登陆,如何看待这场「博弈」?核心矛盾是什么?
继豆包手机助手被微信拒绝登陆后,有网友反馈豆包手机无法正常登陆淘宝。经搜狐科技 测试,阿里系多款应用——淘宝、淘宝闪购、闲鱼、大麦等APP已开始拒绝“豆包手机”登陆。若用户手动操作打开上述APP,将触发安全机制,弹出登陆受阻提示。与此同时,手机银行和金融类APP,也先后出现了针对AI 、屏幕共享的监测以及封控措施。多名用户反馈,在使用豆包AI手机助手时,遭到了农行、建行App内的强弹窗提醒,要求关闭AI手机助手后再进行使用。
此外,游戏类APP如《王者荣耀》同样能监测到AI控制,目前仅支持手动打开,AI助手无法对其进行开启或控制。
这事儿说白了,就是字节想用AI重新定义手机交互方式,结果捅了整个互联网行业的马蜂窝。
豆包手机的AI助手能干什么?它可以跨应用操作,看你屏幕上的所有内容,帮你点击、输入、跳转。听起来很酷对吧?但问题就出在这,它打破了移动互联网最基本的游戏规则。
首先说句公道话,它们封杀豆包,在现有的技术框架下不仅合理,甚至可以说是必须的。
目前的所谓「AI 手机」或者「自动操作」,并不是真正意义上的系统级底层互通。因为 Android 系统的沙盒机制(Sandbox),应用之间的数据是隔离的。豆包要想操作淘宝或者银行 App,它主要依赖的是安卓的 AccessibilityService(无障碍服务)。
这东西本来是给视障人士用的,能读取屏幕内容、模拟点击。但在风控系统眼里,这就是个巨大的「后门」。
具体的安全隐患我就不细说了,这个搞安全的比我专业的多,我就举一个例子,完全可以用同样的接口写个脚本,绕过人脸识别把你的钱转走。所以银行、微信、支付宝这种涉及到钱的问题的app封它是技术本分。
置于王者荣耀我觉得就是胡扯,不过如果非要往这上面靠那可以说是避免充值的问题,也不是说不对。
其实这里涉及到一个流量入口与「去中介化」的争夺:
现在的互联网商业模式,建立在“注意力经济”之上。你需要打开淘宝,看开屏广告,刷首页的信息流,被直播间的主播忽悠,最后冲动下单。这个过程叫转化漏斗,每一个环节都是钱。
试想一下,你跟豆包说:帮我买箱最便宜的维他奶。AI 直接后台比价,绕过淘宝首页,绕过所有广告,直接调用接口下单。 在这个流程里,淘宝从一个万能的商业帝国,瞬间退化成了一个单纯的数据库 和 物流接口。 这种现象在 Ben Thompson 的聚合理论(Aggregation Theory)里其实早有预言,谁掌握了离用户最近的那个界面,谁就掌握了话语权 。以前这个界面是 App,现在豆包想取而代之,那你说你都这样了,不干你干谁呢?对吧
其实这事腾讯是最熟的,它们在23年就发了论文了:
https://arxiv.org/abs/2312.13771
以前回答我都懒得发图,今天特例发个截图,你看论文第一张图,一目了然,对吧。
论文里明确指出了一个点:目前的 AI Agent 是不需要 App 提供专门接口的,它就是通过视觉感知(看屏幕)和模拟操作(点屏幕)来硬解。这里面能干什么它们能不知道吗,门清。所以直接第一个出手,直接还是2选1,反正就是让你用不了。 以前防爬虫,防的是 API 接口被刷;现在防 AI,防的是GUI(图形用户界面)被理解。 一旦 AI 的视觉识别能力突破临界点,它就能无视 App 的 UI 变化,像一个不知疲倦的「全能管家」一样接管手机。这才是大厂们最怕得,因为他们掌握得流量入口就没了。
所以以资金安全为理由直接下线,这个理由非常冠冕堂皇,但是你又不得不说这个理由没毛病。
这次被围殴,其实是把 AI 行业那个秘而不宣的尴尬摆到了台面上: 在没有搞定利益分配机制之前,AI 越智能,由于它对旧生态的破坏力越强,它受到的抵制就会越猛烈。
这场冲突短期内很难有好结果。豆包手机现在核心应用都被封了,实用价值大打折扣,可能就沦为极客圈子里的玩具。中期来看,要么字节跟各平台谈判妥协,开放官方API接口,AI只能在"许可范围"内操作;要么就是技术军备竞赛,豆包想办法更隐蔽地模拟人类操作,平台用AI来检测AI。长远看,这事儿甚至会倒逼行业标准和监管介入,或者出台专门针对AI Agent的数据采集和用户授权规范,让大家有章可循,但是你信么?
最后,以上的观包含商业阴谋论等内容,仅供参考。
微信可以是以防止聊天记录泄露和资金安全为由踢掉你; 同样阿里也可以选择说是因为支付安全踢掉你。
理由很简单,你在支付宝的风控系统中,行为像是脚本。
阿里封杀豆包,根本不需要等到商业竞争那个层面,光是金融安全合规这一条红线,就足以让技术部门直接拉闸。
这不仅是保护阿里,也是在保护用户。毕竟,如果因为AI自动操作导致用户资金被盗,这个锅是算字节的,还是算阿里的?
当然,如果仅仅是安全问题,大家坐下来谈个API 接口标准也不是不可能。
真正让腾讯和阿里毛骨悚然的,是字节跳动试图通过AI实现的降维打击。
在字节的理想蓝图中,AI手机是这样的,用户对手机说,帮我买一箱最便宜的可乐。
AI迅速后台检索淘宝、京东、拼多多,对比价格,然后直接在后台下单完成支付。
在这个过程中,用户不需要打开淘宝,不需要看淘宝的开屏广告,不需要浏览淘宝的推荐流,甚至不知道这箱可乐到底是哪家店卖的。
App作用消失了,App变成了单纯的渠道商。就看不到用户停留、思考、浏览各种数据。这种数据的丢失,打击的平台可是纯利润。
这对于靠广告收租的阿里来说,是毁灭性的。淘宝的价值不仅仅是卖货,而是它作为一个逛的场所,商家为了争夺用户的注意力,需要向阿里购买流量比如直通车。并且你逛的越久,数据越详细,阿里更懂你,推荐的你物品越匹配,收的钱更多。
如果做成了AI手机,所有的流量分发权就从阿里、腾讯手里,转移到了做手机系统或者做系统层AI的字节跳动早已手里。
相当于去掉阿里和腾讯这两个中心。
字节跳动是算法起家,他们最擅长的就是把内容和人精准匹配。现在,他们想用AI把服务和人直接匹配,从而架空所有的中间商。而不仅是中间商,对于腾讯和阿里来说,他们就被架空了。
这场博弈的本质,是OS操作系统层级与App应用层级的权力倒置。过去,App在OS上跑马圈地,字节想利用AI把OS变成一个听话的管家,把所有App当搬砖的,巨头们肯定不愿意。
在移动互联网时代,字节虽然有了抖音这个流量黑洞,但它始终没有建立起像微信那样的社交体系,也没有阿里那样的交易基础设施。它一直是一个流量商。
现在流量都开始见顶,很多商家投产比都维持在1:1。字节做手机从来不是为了卖硬件赚钱,而是为了抢占 AI 时代的硬件入口。
但是,字节的吃的有点着急了。
在没有建立起行业公认的AI交互协议之前,字节直接利用系统底层的无障碍权限去指挥其他 App,在腾讯阿里看来,这就是破坏规矩啊,用户在我这使用,数据都是你的,我成你的打工仔了。不止是面子说不过去,利益也不允许。
我一直说这是三方利益博弈。
这场大战里,还有一个非常有意思的角色群体,华米OV。
这些主流手机厂商虽然也在做端侧AI,也想实现跨应用操作,但他们目前的步子迈得很谨慎。
因为他们有软肋。他们每年要卖出几亿台手机,如果微信和淘宝宣布停止适配某品牌手机,那个手机品牌当场就会暴毙。所以,传统手机大厂不敢跟腾讯阿里彻底撕破脸,他们只能走官方合作的路线,一点点谈判。
但字节不同。字节的硬件市场份额几乎可以忽略不计。它就像一个光脚的,不怕穿鞋的。相当于一个探路者,这也是很多大佬比如罗永浩、周鸿祎夸赞的原因。
主流手机厂商此刻大概率在暗爽,看着字节去冲塔,去测试腾讯和阿里的底线。如果字节把路冲开了,大家一起跟进;如果字节被打死了,反正死的不是自己。
这场博弈短期内不会有解法。阿里和腾讯绝对不会允许任何第三方AI在未授权的情况下接管他们的核心业务和巨额收益,这关乎身家性命。
豆包手机被阿里、腾讯双杀,不是一次简单的技术屏蔽,而是中国互联网巨头对流量分配权的争夺。
既然阿里和腾讯已经做了表率,相信京东、小红书、美团已经在路上了,这些要么有业务竞争要么是投资关系,大家谁都不愿意把数据入口给对手。
一句话搞定所有事的科幻想象,恐怕还要再等上很长很长一段时间。
我不关心博弈,但这个手机太离谱了。
一个ai助手试图动支付宝/微信/银行的app就十分里有十二分离谱。
这玩意全等于一台默认植入后门的手机,ai助手绝对有root权限,只要字节想,他可以24小时监控你手机上的一切。动什么操作,看什么文件,删什么数据,调gps看看你在哪,调摄像头看看你在干啥,给你弹个框是看得起你,不弹框毫无影响。
这和十几年前你电脑被挂马了,你喊一声让对面给你点种子有什么区别?科技是这么进步的?
如果这是大势所趋的话,下一台手机还是抱紧lineage吧,不行就Ubuntu touch/postmarket了
首先,大家不要用隐私来混淆操作权,这是两个维度的权限,后者的可操作性比前者大的多的多的多。也比试图向我科普隐私泄露现状兄弟们能想象到的大的多的多的多。
其次,我不是拒绝科技进步,我拒绝的是这种暴力的“科技进步”。这种功能怎么实现呢?至少用类似mcp的协议与其余app打通,而后操作系统或其他东西作为中立框架记录每一次的调用日志,而不是像现在这样用特权用户去模拟你的操作。
区别就是,你可以找个秘书让他帮你处理你所有的繁琐的事情,大家都知道秘书代表你。但这个是秘书拿了你的身份证易容成你了,而且他不受你的控制可以干任何事情。
核心矛盾是一个哲学问题。
【人要不要为自己充分授权后的AI决策承担责任】。
说白了就是,你愿不愿意为你的AI坐牢?
这不是商业问题,而是一个法律问题乃至哲学问题。
掌握你的一切数据和隐私的AI,在手机上以你的账号操作,到底能不能完全代表你?
事物是具有两面性的,不是只有好的一面。
当你为所谓AI可以帮你自动全平台比价下单之类的功能雀跃的时候,这里面还有另一面,另一面是,你完全交出了你的钱包的支配权。
能帮你自动下单,就能帮你自动转账自动充游戏币,就能帮你买理财买虚拟产品。
能帮你自动比价,就能悄悄把自家的东西塞进去告诉你这就是最优解。
这时候,对家(接手转账or下单的人)可不管你是不是AI操作的,都是算在你头上的。
这就像是现阶段的未成年人退款or转账转错人了,你说你不是,你怎么证明你不是?
当你为所谓AI可以帮你跟朋友圈好友互动的时候,这里面还有另一面,另一面是,AI在完全不合适的人那里留下了完全不合适的言论,AI替你讲话,你替AI承担后果。
能帮你自动跟人互动,就能帮你得罪人,就能帮你跟人结仇。
能帮你自动发布文案,就能帮你说出问题言论,帮你踩缝纫机。
这时候,别人可不管你这是不是AI发言,都是算在你的头上的,因为鬼知道是你还是AI,法律上也是算你头上。
因为,东西是你的账号发的。
这就像是现阶段的智能驾驶,一切锅是司机的,你愿不愿意用你的钱包和生命来帮助企业收集数据迭代模型呢?
记住,一切锅,是你的,你要替你的车替车厂承担责任。
所以,表面问题是各大APP各大手机厂商的所谓护城河,数据价值,领地意识,商业模式。
其底层的核心矛盾是,你作为人,你愿意交出一切,让AI来替你赛博生存么?
记住,AI做的好的赚到的,算你的。
做的烂的得罪人的亏损的,也算你的。
AI在帮你决策,AI也在替你活着。
而你,在替AI背锅。
就看你,愿不愿意了。
抖音广告收入是微信的几十倍,甚至可以说豆包 seed这些亏钱货纯靠吸血抖音养着,一个个整得像字节慈善家去推翻阿里腾讯邪恶大魔王一样……另外这种AI agent终端理念也提出快十年了,一点创新没有。 目前豆包这个控制手机的方式就和随时让别人帮你操作手机一样,是P0顶级的高风险行为。一旦出事,这些app要帮用户或者字节背锅。
①如果一个Agent控制手机的方式,技术原理上和外挂/脚本/远控一样,那大型app风控按外挂/脚本/远控来风控很正常
②如果用户基于豆包自动控制手机做出了他后悔的行为,那么这个行为算豆包的还是算用户的?包括但不限于说了不该说的话,转了钱,买了错的东西。该算用户买单还是字节?在这些东西扯清楚之前,一刀切是最稳妥的,起码不会出事
③上面两个东西的优先级和不可控性大概还是远高于一堆人所谓的影响别人流量入口的思路的。
不要低估人性,也不要高估技术,更不要眼里只有商战而没有法律和风险意识。ai在什么情况下可以作为人的意识进行代行,此时的责任在谁,是接下来这个时代的课题。 这些手机上的豆包不是一个纯粹的本地大模型
是云端大模型,是联网的!!!
各位难道不理解这是什么含义吗
如果他可以畅通无阻的控制你的手机
那么意味着实际上形成了伪赛博朋克2077里面的场景,字节有权利控制你的电子终端,并进一步控制你,你想摆脱控制的唯一办法是不用或者断网
我看还有很多说纳入监管就好了,字节在国内也跑不出去的人
ai的监管,道德标准,法律规定现在各国都还在吵;ai的云端大模型数据库可以被随便定向污染;缅甸境外诈骗时候你的钱从你的卡出去后几十秒就分成上百道数据流在全球转圈圈不可追踪了
所以这玩意目前也就只能局限于技术验证,真正的应用根本不可行,那么阿里腾讯根本不会陪字节去做这种对自己百害而无一例的技术验证
如果这种手机真的大规模被使用,那会发生什么呢?
比如说,我对豆包手机说,给我买一罐最便宜的可乐。一开始的时候,它可能确实会在各个平台比价,然后选择一个最便宜的下单。短期内可能会造成大量没有价格优势的网店关门。接着会发生什么呢?各个商家为了活下去,为了让豆包推荐自家的产品,会花钱买推荐位。所以,后面你对豆包说,给我买一瓶最便宜的可乐,它可能并不一定会给你推荐最便宜的,而是给你推荐投了最多广告费的。有点像百度的广告,谁给的钱多,谁排名靠前。至于是不是最便宜的,你也不知道啊。之前它给你推荐的确实是最便宜的,让你形成某种错觉和依赖,突然某一天,它开始不听话了,而你因为习惯根本无法察觉。就好比一个别有用心的人之前一直对你好迷惑你,某一天突然使坏,给你致命一击,你根本毫无招架之力。
紧接着,各大电商平台只有两个出路,要么和头条系达成某种合作,做它的货架,头条系给它们分点汤汤水水;要么彻底被头条系吞并,抖音电商一家独大。然后再发生哪个商家给的钱多豆包推荐谁的情况。
许多人幻想有完全的信息透明,完全的信息对称,以为想买最便宜的商品就真能买到,这是不可能的。因为算法的背后也是利益。
继续,在掌握了电商入口之后,接下来必定还会掌握信息入口。毕竟在信息时代,信息就是最值钱的。
比如,你生病了,想找个好医生。你就不怕遭遇当年魏则西在百度遭遇的事?即便它不谋你命,但它图你财怎么办?你因为懒得收集信息,或者因为过于依赖AI,就导致了被它欺骗。
再比如,它会不会被别有用心的人操控舆论呢?比如,你对豆包说,给我分析下未来中国两性关系,某些人会不会利用豆包煽动对立,从而达到自己的目的?又或者,它会不会因为控制了信息源,成为新的钳制人的思想的愚民工具呢?
我始终觉得百花齐放才是好事,因为有的比较,你才知道每个选择优点是什么缺点什么,这样在做决策的时候才会尽量客观。虽然这么做确实会花费许多的时间精力。如果某一天,某个问题AI给了你一个唯一解,它真的把你卖了你可能都还在帮它数钱。
表面上是因为AI能自动打开APP跳过用户看广告环节、影响到互联网大厂的流量和收入,根本原因是已经形成范式迭代的前奏。
而范式迭代一旦形成,就会把现在的平台经济及依附于此的互联网大厂连根拔起。
所以,这就不是故步自封或者不愿让利这种层次的小事,而是涉及生存危机层次的大事。预料到如此结果的互联网大厂自然不可能坐以待毙,必然要采取行动,试图把AI在智能手机端的扩张扼杀在摇篮里。
其实今天在周鸿祎谈豆包手机助手会“直击互联网大厂的护城河”的观点的问题下,我们就给出过范式迭代的观点。我们的基本结论是:
从近期看,豆包手机助手提供的AI“接管”手机的模式,会直接动摇以真人用户对APP的使用为流量起点、以启动次数、浏览与停留时长等操作画像为基础的整个移动互联网生态,直接冲击传统的流量逻辑,这就会直接损害目前的互联网大厂的利益。
但这还没完,因为最终的结果不止于此。AI助手会通过集成相关功能或者直接提供相关服务,把APP这个环节简化甚至跳过。因为用户在乎的本来就不是中间过程而是明确的结果。如果AI能够稳定可靠地理解用户需求并交付结果,作为中间载体的APP就不再具备存在的必要了。此时,现在的互联网大厂也好、平台经济也罢,就要被连根拔起。
其实基于功能集成和交互方式层面的降维打击,就可以充分形成范式迭代,范式迭代的结果也必然不是单纯的以优化为核心的竞争,而是新事物对旧事物的连根拔起式的取代。
先前的讨论中,我们举了电视这种典型的大屏幕被手机、平板和电脑这种小屏幕范式迭代的例子,以及百度搜索作为互联网网页时代的王者被APP范式迭代的例子。这种例子实际上还有很多,比如大屏智能手机对小屏功能手机的范式迭代、新媒体对纸媒的范式迭代、汽车对马车的范式迭代。说白了就是,战胜小屏功能手机的,并不是更好的小屏智能手机,而是另一种全新的大屏智能手机,其他也同理。
所以,过去APP是如何在功能集成和交互方式方面通过范式迭代战胜了立足网页浏览的百度,那么将来功能集成度更高、交互方式更便捷的AI助手就会通过同样的范式迭代战胜APP。这并不是预言,而是一种基于基本规律的趋势判断。
当然,我们也可以看到开发APP的互联网大厂们并没有坐以待毙,而是选择积极对抗。就今天一天之内,豆包手机助手先是在上午下线了金融类应用的功能,晚上又下线了操作微信的能力,现在在阿里系的APP又被禁止登陆。而且,无论有没有那么自然吧,舆论目前也主要在讨论AI助手接管手机带来的安全性的问题。
其实,恐惧往往是控制人心的最好手段,而且我们要认识到,范式迭代发生时,也一定会对原有社会秩序和常识造成冲击。
当年汽车横空出世时,马车行业也曾经大力进行抵制,马车夫也好、马厩主也罢,甚至饲料商也加入其中,拼命宣传汽车的危险、不可靠和对马匹的惊吓,而且试图游说政府制定限制性法律。但是结果呢?我们都已经看到了。当然也许这个例子有点久,那么说近一点的——面对智能手机的崛起,功能手机制造商为什么不抵制?面对小屏产品的崛起,大屏产品的制造商和电视台为什么不抵制?面对APP生态的崛起,百度这类基于传统的网页生态做内容集成和供应的平台为什么不抵制?
非不愿也,实无能也。
抵制豆包手机助手的第一枪是在金融安全领域打响的,其实我们看看在金融方面的演变,就会明白了。在实物货币时代的人,不会理解为何有人拿着一张纸就能花出去;在现金时代的人,不会相信一纸质存折就能证明存款;在网银时代的初始阶段,人们的转账行为往往还要结合U盾操作,当时的人也不会相信现在人们只是输个六位数密码或者按个指纹就敢完成转账。在范式迭代发生前,人们的想象力和接受能力,总是相对匮乏的!
我们还是那个结论:
其实每一次新技术带来的功能集成与交互便利性的巨大飞跃,往往都伴随着对新的安全和监管的担忧,但安全最终并不会阻碍新技术,而是会与新技术共同成长。监管也是一样,即使初期会相对滞后审慎,但长期来看也会转向立足新技术的框架下保护市场权益,而不是单纯的制止乃至扼杀。
当然,毕竟互联网大厂形成的利益壁垒更大,0APP嵌入日常生活的程度也很深,有些APP已经形成了某种程度上的基础设施。所以,AI助手对APP的范式迭代的过程,一定要比APP对百度搜索的范式迭代的过程要来得复杂、缓慢得多。但从历史发展角度,这只能是延缓进程而难以改变趋势的方向和最终结果。
但我们以上的判断,并不是单纯在看好豆包,因为范式迭代的一个特点,就是趋势可预测,但技术细节和实际走向往往是不可预测的。
一方面,AI助手崛起不太可能实现一家通吃,而是也会形成多家竞争的局面;另一方面,未来的主要颠覆者现在很可能还没有登上舞台,形象一点说它们很可能既不是豆包,也不是菜包、肉包,而是虾饺、蟹棒、鱼丸……
而且范式迭代的一个特点,就是打不过就加入,目前看确实是互联网大厂有抱团抵制AI助手的趋势,但如果天平明确开始倾斜,那么这些互联网大厂难道就没有做两手准备、将来推出自研AI助手的可能性吗?
总而言之,范式迭代现在刚刚进行到前奏部分,明确的博弈就已经开始了,而真正的重头戏往往在范式迭代的中期才会出现。