書接上回,世超用 Claude Cowork 把日常雜活兒干了個遍。這玩意看起來數(shù)據(jù)分析、文檔整理、路線規(guī)劃樣樣精通,實際細節(jié)上還是頻頻出錯。
(相關(guān)資料圖)
再加上開源模型群起攻之,Anthropic 架不住攻勢,Cowork 入門價立減 80 刀。
剛被這波大甩賣狠狠背刺的世超,今天就帶大伙兒來看看,這些 “ 類 Cowork ” 的免費開源 Agent 到底表現(xiàn)如何。
這次,世超一共測了三款榜上有名的開源項目,分別是 OpenWork、Eigent 和 AIonUi。
其中,只有 OpenWork 是在 Cowork 之后才發(fā)布的,Eigent 和 AIonUi 的原始版本早在去年八月就已經(jīng)上線,這一波屬于是蹭蹭 Cowork 翻紅了。而從實際體驗上來講,OpenWork 的完成度明顯高于后兩者,用起來也更接近 Cowork。
好消息是,如果只看能不能把活兒干完,那 Cowork 能干的,開源基本也能干。
壞消息是,這些免費的開源 Agent 各有各的毛病。慢,麻煩,質(zhì)量低,整體很難和 Cowork、Manus 這種成熟的商業(yè)產(chǎn)品相提并論。
好了,話不多說,咱們直接開搓。對標 Cowork,我們同樣設(shè)置了三個難度遞增的任務(wù),考察四類技能。
第一個,整理桌面錄屏,考文件文檔管理;第二個,規(guī)劃春節(jié)珠港澳旅游路線,考研究分析和文檔創(chuàng)建;第三個,整理 B 站差評君 2025 年度數(shù)據(jù),考數(shù)據(jù)收集分析。
開頭即巔峰,世超先給大伙兒看看 OpenWork。有一說一,這個做得還算不錯,自帶免費模型底座,效率也是最高的。
文件整理輕輕松松十秒內(nèi)搞定,快啊,太快了。不過它不能自己根據(jù)視頻內(nèi)容改文件名,這個比 Cowork 差點。
再看看行程規(guī)劃機酒推薦,兩分多鐘,doc 直接給我放桌面。這還說啥了,Cowork 都干了七分多。
生成的文檔雖然簡陋點吧,該有的都有。
即使價格上犯錯,和 Cowork 一樣拿平時價當春節(jié)價,但免費,世超愿意原諒它。
然而,在最難的數(shù)據(jù)收集分析上,OpenWork 還是嚴重翻車了。
數(shù)據(jù)整理得歪七扭八,又亂又缺又錯,更別提分析。五分鐘出結(jié)果,之后再怎么問它,多思考不了一點。
整體體驗下來,OpenWork 最大的優(yōu)點是快,但就像一個糊弄糊弄交差的低級打工人一樣,最多解決從無到有,別指望質(zhì)量多好。要是只想編份大差不差的報告給老板,用它勉強也夠。
而接下來的 Eigent 就很難繃了,它完美詮釋什么叫免費的,才是最貴的。
Eigent 自帶幾個免費可切換的模型,世超立選 Gemini 3 Pro Preview。高端模型免費用,還有這等好事?
實際上呢,預制模型巨慢無比,Eigent 二十分鐘都沒搞定桌面一個文件夾。
行吧,那我換自己的 API 再測測。
這下可好,讓它規(guī)劃個旅游攻略,任務(wù)開始兩分鐘不到,Eigent 上網(wǎng)東搜搜西看看,火速刷光了我 5 刀的 API余額,最后啥也沒做出來。。。
這么一算,它的使用成本比 100 刀一月的 Cowork 還夸張,這吃相多少有點離譜。
都說 Agent 是數(shù)字實習生,公司里要真有這種實習生,財務(wù)第一個報警,法務(wù)第二天起訴。
客觀來看,Eigent 的思路很美好,它試圖在一套系統(tǒng)里集成四種不同的 Agent,寫代碼的、找資料的、寫文檔的、看圖看視頻的,各司其職。而且你還能清楚看到每個 Agent 正在干什么,聽起來相當合理。
但現(xiàn)實是四個 Agent 各玩各的,不僅 token 消耗暴增,配合不好效率更低,我還得給它很忙的表演買單,最后一個任務(wù)都沒成功。
這表現(xiàn),只能說拉完了。
相比起來,下面這個 AIonUi 都顯得很可愛,純傻 NPC,不坑人。AIonUi 能回答問題但答不準,對文件文檔操作一竅不通。
AIonUi 小 bug 非常多,比如每一步操作都要反復請示;顯示任務(wù)執(zhí)行了五分鐘,世超后臺的 API 卻完全沒信號,說明 AI 純摸魚,一點活沒干。
從生成的內(nèi)容上看,旅游攻略大差不差,只是金額依舊不對。數(shù)據(jù)分析任務(wù)更離譜,一共只找了 4 條視頻,4 條都不是差評君 B 站賬號的。。。
總結(jié)一下戰(zhàn)績,OpenWork 三關(guān)勉強算過,但質(zhì)量一般;Eigent 和 AIonUi 基本全敗。一通操作下來,開源項目是真抗不下 Claude Cowork 降價這面大旗,這表現(xiàn)不是差了一點半點,完全沒威脅。
所以,世超在這里建議各位差友感興趣的話,淺嘗 OpenWork 就夠了。
而且只有上過手后,世超才發(fā)現(xiàn)自己對這些開源項目有很多誤解。
首先,開源項目不像一般軟件那樣,下載安裝就能放心使用。
像是 OpenWork 安裝后彈出了 CLI not found bug,要通過終端命令行才能解決,這對沒有技術(shù)背景的用戶來說很難做到。
另外,要是軟件沒有自帶模型,或者不好用,自備模型 API 是基操。
但怎么填寫這個 API 設(shè)置,對普通用戶來說都是門檻。
這也就引出了第二個誤區(qū),開源,不等于免費。
最后,世超發(fā)現(xiàn)了一個很反直覺的事兒:Agent 并不是模型能力的放大器,反而成了限幅器。
世超給 Agent 喂的 API,都是最上乘的 Claude-Opus-4.5。如果我直接問 Claude 旅游攻略,數(shù)據(jù)分析,肯定又快又穩(wěn)。怎么一套 Agent 上來,降智這么多?
這是因為,大多數(shù)開源 Agent 的設(shè)計,本身就在削弱模型能力。它們把一個本來可以一次想清楚的任務(wù),硬拆成無數(shù)彼此割裂的小步驟,每一步都要重新向模型復述背景、同步進度、強調(diào)目標。
這相當于讓 AI 每走一步失憶一次,把本該在模型內(nèi)部完成的連續(xù)思考,變成了低帶寬的文字交接。
比如,輪到 AI 訂酒店的步驟,至少得告訴它之前確認了哪些必玩景點,之后還要留點預算訂機票。這些 token 和時間,白白貢獻給了 AI 的自言自語,萬一溝通不到位來個幻覺,極容易忙中出錯。
作為對比,Claude Cowork 這類 Agent 產(chǎn)品會讓 AI 從頭到尾連續(xù)地完成同一件事。對 AI 來說,它始終知道 “ 我在做一個完整任務(wù) ”,可以自己決定先想什么、后做什么,流程看起來更簡單,思考連貫,中間不容易忘事跑偏。
只不過,Agent 的定位本來就是交付更完整的成果,所以它們往往會比大模型多做幾步驗證、結(jié)果整理和文檔編寫之類的工作。
換來的是輸出更完整好看,但你要是急,真不如直接問模型方便。
說到底,Agent 這玩意兒不是套個殼就能點石成金。至少在現(xiàn)在這個階段,不管開源還是閉源,大多數(shù) Agent 距離真正融入生產(chǎn)和生活,還有不小的距離。
它們確實能把流程包裝得更完整,但也往往犧牲了效率和穩(wěn)定性。對普通用戶來說,Agent 是個看起來聰明的助手,不一定是真聰明的那個。
所以,和它玩玩就好,別太認真。
撰文:莫莫莫甜甜
編輯:江江 & 面線
美編:萱萱
圖片、資料來源:
莫莫實測
Github、小紅書
熱門
關(guān)于我們| 廣告報價| 本站動態(tài)| 聯(lián)系我們| 版權(quán)所有| 信息舉報|
聯(lián)系郵箱:55 16 53 8 @qq.com
同花經(jīng)濟網(wǎng) 京ICP備2021034106號-50
Copyright©2011-2020 sl-c.com All Rights Reserved