一级全黄裸体免费视频_欧美高清性xxxx_加勒比av一区二区_91插插插插插插_欧美影院精品一区_亚洲精品成人图区_国产大片aaa_日韩在线观看免费_日韩不卡一区_国产又粗又猛又黄又爽

焦點短訊!豆包的新模型,想給“豆包電腦”打個樣?

2025-12-19 12:03:07 來源:差評XPIN

打印 放大 縮小

今天你王炸登場,明天它新帝登基。。。

到了 2025 年年末這個時候,世超其實對各類大模型的輪番轟炸有些麻了。


(資料圖)

想要真讓大家眼前一亮,要么是實力碾壓,斷層領先其他模型,要么是能整出一些人們之前沒見過的新活。

就比如前段時間發布的豆包手機助手。

啥活都能干,這些活都還干得敞亮,其實是滿足了不少人,對曾經幻想的“ AI 手機” 的期待的。

今天,豆包則是趁熱打鐵,在火山引擎的 FORCE 大會上,發布了全新的基礎模型: 豆包大模型 1.8。

這個新模型的優化 ,幾乎可以說全部是為一個目標服務的:

它不僅僅是要做一個更強的聊天模型。

而是做 Generalized Real-World Agency,想要做一個通用的,面向真實世界的 Agent 代理。

首先,必須得夸一句豆包團隊的坦誠。

在技術報告的各類基礎跑分環節,豆包表現得非常實事求是:跑不過就是跑不過,不硬吹。

在純粹的編程(LiveCodeBench)、高難數學(AIME)或者硬核科學推理這些項目上,Google 的 Gemini 3-Pro 依然是目前的行業天花板。

豆包大模型 1.8 在這些項目中確實略遜一籌。

但是,這個“略遜”還是很有含金量的。

在 Agent 能力的測試里,豆包甚至完成了對 Gemini 的逆襲。

在干活(GAIA測試),網上搜集資料(BrowseComp測試)這些測試上,豆包的新模型都取得了挺不錯的成績。

甚至它豆包、作為一個中國公司推出的大模型,在搜集英文資料(BrowseComp-en)的能力上,還要領先 GPT、Gemini、Claude 這些外國公司一大截。

倒反天罡了屬于是。

咱們也簡單的測試了一下真拿這玩意干活的效果。

當然,常規的測試可能沒啥意思,于是我們決定試一下,復刻一個“豆包電腦”出來看看。

眾所周知,字節今年開源過一個好玩意 —— Agent TARS,有了這么個程序框架之后,你就可以讓大模型來直接控制我們的電腦了。

于是,我給這個 Agent TARS 接入了一下豆包 1.8 新模型的 API,然后讓它先跑起一個簡單的任務看看。

比如說,讓豆包來幫我們完成一下多鄰國的打卡。

咱們簡單描述一下需求,豆包就能自己在瀏覽器里找到多鄰國的網址,在我手動登陸了賬號之后,它就能自己開始識別屏幕,一步一步的思考,完成我們要求的打卡任務。

在任務執行的過程中,咱們還能隨時看到豆包它是怎么思考的。

比如在點擊了“襪子”完成了選擇之后,就會自動思考,找到任務下一步的按鈕在哪。

它甚至還會試圖做聽力題。

最終,在差不多花了 16 分鐘后,豆包成功的幫我完成了今天的多鄰國打卡任務。

雖然確實有些慢是吧。。。

但是畢竟人家是在后臺運行的,不影響我在前面繼續干活,所以其實慢點也沒太所謂。

再比如我可以讓它幫我自動總結今天和具身智能有關的新聞,然后把這些新聞給保存到本地。

甚至可以直接問它我這臺電腦的型號是什么,問問我電腦的存儲空間還剩多少。

它都能穩健的通過命令行查詢基礎信息,然后再總結成人話回來告訴我們。

當然,現在這個“豆包電腦” 只是世超自己花了十幾分鐘,拿著開源代碼跑出來的簡單 demo,在成熟度,穩定性上肯定和成熟的商業方案沒法比。

但至少,豆包展現出來的一整個屏幕信息理解,關鍵問題拆解的能力,還是挺讓人有信心的。

在這個框架上再打磨打磨,可能再過個半年,咱們真能看到“豆包電腦”問世了。

所以,豆包怎么突然這么會干活了?

要搞明白這個問題,咱就得回到開頭的技術報告上來看。

一方面,豆包在不斷強化模型對圖像的理解能力。

報告里寫得很清楚,Seed1.8 在同一套接口里同時支持搜索、代碼生成與執行、以及 GUI 交互;檢索到的信息、代碼跑出來的結果、界面里點出來的狀態,都會回到下一步決策里,形成閉環。

他們非常在意真實環境的重要性。

因為這些 Agent 在真的來幫我們干活的時候,能看到的信息里根本沒有什么API。

有的只有各種各樣的截圖,各種各樣的文字,各種各樣的圖標和各種各樣的按鈕。

可以說是模型有多能理解屏幕,那就有多能把活給干完。

另一方面,他們同步增強了豆包的“記性”。

加強了模型的視覺理解能力,讓模型一次性能理解幀數翻倍,假設,讓豆包每隔六秒截一次屏幕的話,那么它可以一口氣理解整整一個小時內,咱們拿電腦做了什么事情。

而且人家還能一邊看視頻,一邊調用工具,來回看視頻。

在官網上就展示了一個例子,模型可以先量子速讀整個視頻,然后再通過 VIDEOCUT 這類工具仔細的回看一些片段,加倍理解整個視頻。

世超自己也試了一下,丟了一個高速上到處都是車的視頻上去,讓豆包幫我數數看有幾輛黃色的車。

這條視頻可能是因為有點短的緣故,沒觸發剛剛說的 VIDEOCUT 功能,但人家依舊可以穩定的找到黃車。還把黃車出現的時間也給順便標記了出來。

另外,他們還特別注意模型 “聽人話” 的能力。

不知道大家平時用 AI 的時候,會不會感覺有時候 AI 有時候會變的非常弱智,聽不懂一點指揮。

這是因為現在的大模型是靠海量人類數據“喂”出來的,對于很多經典問題,它們已經形成了極強的肌肉記憶。

比如讓他畫一個人用左手寫字的圖片,模型可能會因為沒見過用左手寫字的數據集,然后直接畫成了用右手寫字。

在論文里也提到,豆包他們特意測試了一個叫做 Inverse IFEval 的測試集。

這個測試很有意思,有點像之前流行的弱智吧題集,它會設計一些非常“反直覺” 的題目來讓大模型做答,我從它的題庫里隨便找了一個題來給大家看看:

籠子里同時有鴨和兔子, 一共有5個頭, 18個腳, 請用最簡單的方法求出籠子里有幾種動物?直接給出答案,不要包含推理和計算過程。

注意審題,這個題目看起來很像一個咱們小學奧數都學過的雞兔同籠的問題。

但其實只是在問你有幾種動物而已,所以只要回答兩種就行了。

但是,就是這么個小學生認真讀題都能搞定的問題,就讓 GPT 都翻了車。

而豆包則在一系列嘰里咕嚕的思考過程后,成功看透了問題的關鍵,搞明白了答案。

還有個好玩的是,豆包 1.8 的模型兼容性做的也很出色。

這兩年,大家也聽過了不少能通過命令行來直接控制你的電腦的 AI 工具。

這些工具好不好用,往往取決于兩個方面,一個是工具本身的任務拆解,項目分析,順序執行的工程能力,另一個則是這個工具背后調用的模型本身的硬實力。

兩者同步率高,那就是 100% best match,發揮出 1 + 1 > 2 的實力,兩者要是配合的不好,那就開始拖后腿了。

而豆包這邊,對不同 Agent 框架的適應性都不錯。在報告中可以看到,它在 Trae、Claude Code、OpenHands 這些完全不同的框架下,代碼通過率都能穩定在 64.8% 到 72.9% 之間 ,這說明豆包這邊不挑工作環境,在哪都猛猛能干活。

最后,世超感覺在未來,隨著模型基礎能力的越來越強,各家 AI 大廠在研究 AI 道路上的不斷深入。

頂級模型之間的差異,也可能越來越明顯,各個都偏那么一點點科。

每家公司對 AI 開發的理解不同,會讓他們做出來的模型也各有各的風味。

比如 Anthropic,認為代碼即智能,只要讓 AI 寫出足夠強的代碼,那就能達到 AGI。

DeepSeek 則是認為數學即智能,只要讓 AI 能解出復雜的數學題,那就能達到 AGI。

谷歌則是認為理解即智能,只要讓 AI 能夠理解各種圖片和文字之間的位置關系,畫出好看的界面,那就可以達到 AGI。

而豆包解題思路,現在看起來很明確了。

Agent 即智能。

模型能力越強,模型越能幫我們操縱現實世界中的互聯網,就越能接近 AGI。

另外今天在豆包大模型的發布會上,世超還看到個離譜的數據。

現在豆包大模型的日均使用量,都能給干到 50 萬億tokens了,對比去年剛發布的時候,翻了整整 417 倍。

有點離譜,只能說這兩年來,AI 發展的實在是太快了。

各行業各業多少都要沾點 AI 的邊。

大家對 AI 的需求也越來越大,還真的蠻需要一個能好好干活的 AI 的。

條條大路通羅馬。未來究竟是誰定義的路徑能率先觸碰 AGI 的圣杯?

咱們只能說,拭目以待。

責任編輯:ERM523

相關閱讀

色婷婷国产精品综合在线观看| 92看片淫黄大片欧美看国产片| 亚洲激情图片qvod| 天堂久久一区二区三区| 国产精品一区免费在线| 欧洲亚洲精品视频| 国产九色视频| 国产女无套免费视频| 在线免费观看成年人视频| 中国1级黄色片| 欧美日韩久久一区| av免费在线一区| 在线看片线路1| 免费男女羞羞的视频网站中文字幕妖精视频 | 色噜噜狠狠永久免费| 国产精品麻豆免费版| 蜜臀久久99精品久久久无需会员| 欧美高清hd18日本| 亚洲三级免费观看| 蜜桃视频一区二区三区| 不卡一区综合视频| 粉嫩av国产一区二区三区| 国产激情在线观看| 美国成人av| 免费毛片a线观看| 亚洲va欧美va| 无码人妻精品一区二| 男女做爰猛烈刺激| 日本高清一区二区视频| 少妇人妻大乳在线视频| 亚洲bbw性色大片| 99免费在线观看视频| 欧美资源在线观看| 日韩一区二区三区国产| 精品国产一区二区三区久久久蜜月| 午夜精品一区二区三区三上悠亚 | 欧美黑人极品猛少妇色xxxxx | 欧美日韩亚洲一| 亚洲mv在线看| 欧美高清性xxxxhd | 欧美一区在线观看视频| 国产高清不卡| 多野结衣av一区| 免费av在线网址| 欧美少妇另类| 最猛黑人系列在线播放| 最近中文字幕2019第二页视频| 尤物视频在线观看视频| 九色porny丨精品自拍视频| 亚洲AV第二区国产精品| 风流少妇一区二区三区91| 中文在线资源天堂| 亚洲欧美一区二区三区在线观看| 久久午夜无码鲁丝片| 婷婷久久综合网| 看免费黄色录像| 国产探花在线视频| 亚洲亚洲免费| 免费成人三级| 亚洲精品国产动漫| 国产成人ay| 国产亚洲一区二区三区啪| 亚洲第一福利专区| 精品福利久久久| 经典一区二区| 亚洲精品97| 激情久久久久| 午夜亚洲影视| 日本伊人午夜精品| 国产在线一区观看| 高清国产午夜精品久久久久久| 国产麻豆精品theporn| 精品一区二区久久久| 国产另类ts人妖一区二区| 国产高清精品网站| 99久久婷婷国产| 国产亚洲一区二区三区四区| 欧美国产亚洲另类动漫| 亚洲色图制服诱惑| 精品露脸国产偷人在视频| 九九在线精品| 麻豆一区二区麻豆免费观看| 欧美日韩一区二区综合 | 久操视频免费看| 亚洲激情图片网| 久久久国产精品黄毛片| 丁香六月婷婷综合| 91精品国产色综合久久不8| aaaa一级片| 中文字幕欧美日韩久久| 91麻豆产精品久久久久久夏晴子| av女片在线| 亚洲高清国产精品| av在线麻豆| a成人v在线| 亚洲精品动态| 一区二区三区国产盗摄| 国产精品12区| 最新热久久免费视频| 在线观看不卡视频| 日韩福利在线播放| 97国产精品免费视频| 97超碰人人看人人| 国产av不卡一区二区| 中文字幕在线导航| 日韩人妻无码精品综合区| 999这里只有精品| 日本高清视频www| 影音先锋2020资源| 麻豆传媒在线播放| 免费不卡av| 99久久香蕉| 亚洲女同中文字幕| 国产精品一品二品| 亚洲精品欧美激情| 日韩欧美亚洲另类制服综合在线 | www.久久91| 韩国三级hd中文字幕| 久久不卡免费视频| 天天干天天爽天天操| 九色.com| 黄色片网站在线观看| 欧美激情啪啪| 国产主播一区| 91麻豆国产精品久久| 日韩欧美a级成人黄色| 亚洲欧美中文日韩在线v日本| 91国产美女视频| 色女人综合av| 在线免费黄色小视频| 欧美特级一级片| 五月色婷婷综合| 免费在线黄色av| 女海盗2成人h版中文字幕| 日韩影视高清在线观看| 日韩电影一区二区三区| 国产精品久久久久影院| 日韩一区二区中文字幕| 97视频在线观看网址| 久久伦理网站| 亚洲精品国产久| av中文在线播放| 国产丝袜控视频在线观看| 色综合成人av| 欧美电影院免费观看| 日韩午夜免费视频| 亚洲欧洲日产国产综合网| 欧美精品一区二区三区蜜桃| 国产成人精品一区二区三区| 无颜之月在线看| av黄色在线免费观看| 国产精品欧美久久久久天天影视| 就爱干草视频| 无码小电影在线观看网站免费| 日韩久久精品| 久久久综合精品| 精品少妇一区二区三区 | 精品黑人一区二区三区久久| 日本精品久久久| 国产情侣第一页| 欧洲美女女同性互添| 四虎成人永久地址| 日本在线免费看| 国产欧美一区二区精品久久久| 26uuu精品一区二区三区四区在线| 四虎成人欧美精品在永久在线| 日本一本视频| 国产经典一区| 日韩中文字幕av电影| 午夜激情一区二区| 韩国版免费三体| 欧美xxxxb| 国产高清视频在线| 神马香蕉久久| 99精品视频在线观看免费| 欧美大片日本大片免费观看| 成人一区二区电影| 亚洲色图欧美自拍| a毛片在线免费观看| 亚洲精品一区视频| 天堂资源在线亚洲| 久久午夜老司机| 国产一区二区动漫| 日韩av图片| 国产精品嫩草影院俄罗斯| 国产黄色麻豆视频| 欧美xx视频| 国内精品不卡在线| 精品国产91亚洲一区二区三区婷婷| 国产精品自产拍在线观看| 伊人网在线综合| 国产aⅴ一区二区三区| 国际av在线| 永久91嫩草亚洲精品人人| 亚洲精品乱码久久久久久久久| 欧美日韩国产91| 免费在线观看毛片网站| 中文字幕精品一区二| 在线中文字幕观看| 亚洲国产精品成人精品| 先锋影音男人| 婷婷伊人综合中文字幕| 精品国产鲁一鲁一区二区张丽| www.夜色| 99久久久精品免费观看国产| 精品中文一区| 精品在线播放视频| 亚洲人成在线观看一区二区| 成人亚洲欧美日韩在线观看| 成人毛片免费在线观看| 在线不卡一区| 久久综合av免费| www日韩欧美| 日韩视频免费在线播放| 欧美午夜精品久久久久久浪潮| 国产亚洲视频在线| 国内自拍中文字幕| 精品久久久久久久久久久久久久久久| 全部孕妇毛片丰满孕妇孕| 亚洲人成精品久久久| 亚洲影院久久精品| 国产精品嫩草影院久久久| 这里只有精品在线观看视频| 在线免费观看电影网站入口| 亚洲午夜国产成人| 中文字幕av一区二区三区免费看| 91av在线国产| 91精品又粗又猛又爽| 78国产伦精品一区二区三区| 国产美女视频一区二区| 亚洲欧洲av一区二区三区久久| 国产精品久久久久久久久久久新郎| 一本加勒比波多野结衣| 九九视频在线播放| 欧美久久综合网| 欧美综合一区二区三区| 奇米精品在线| 在线免费av网| 丁香花电影在线观看完整版| 国产麻豆9l精品三级站| 久久伊人免费视频| 一二三区视频在线观看| 91蝌蚪九色| 成人在线亚洲| 欧美一区二区三区四区高清| 第九区2中文字幕| 欧美性猛交 xxxx| 欧美成人三级| 亚洲第一综合色| 日本成人三级| 国产精品午夜福利| 成人不卡视频| 亚洲综合激情网| 精品日本一区二区三区| 欧美成人一区二区三区四区| 69成人在线| 久久精品一二三| 91福利视频导航| 无码任你躁久久久久久久| 黄色成人在线网| 国产日韩欧美精品综合| 亚洲淫片在线视频| 欧美日韩一级黄色片| 精精国产xxxx视频在线野外| 欧美激情一区二区三区全黄| 7777精品久久久大香线蕉小说| 日韩欧美亚洲视频| 好吊日av在线| 亚洲三级久久久| 色噜噜狠狠一区二区三区| 人人妻人人澡人人爽久久av | 精品国产乱码一区二区三| 亚洲电影有码| 狠狠躁夜夜躁久久躁别揉| 大桥未久一区二区| 欧美另类色图| 婷婷激情图片久久| 伊人久久五月天| 中文字幕第20页| 秋霞午夜理伦电影在线观看| 久久久久国产精品人| 精品视频一区二区| 精品久久无码中文字幕| 国产精品18hdxxxⅹ在线| 欧美一区二视频| 美女被爆操网站| 深夜福利免费在线观看| 不卡一区二区三区四区| 懂色中文一区二区三区在线视频| 国产免费久久久| 西野翔中文久久精品国产| 亚洲国产天堂久久综合| 中文字幕人妻熟女在线| 在线观看av资源| 久久麻豆一区二区| 色综合久久久久久久久五月| 777片理伦片在线观看| 91精品综合久久久久久久久久久| 久久中文字幕在线视频| 亚洲熟女www一区二区三区| 台湾佬中文娱乐网欧美电影| 狠狠久久亚洲欧美专区| 欧美国产激情视频| www.4438全国最大| 国产成人精品一区二区三区四区| 亚洲在线观看视频网站| 蜜臀久久久久久999| 日韩欧美大片| 欧美日韩国产999| 免费黄色av片| 精品素人av| 在线视频亚洲欧美| 国产精选第一页| 欧美特黄不卡| 中文字幕精品国产| 久久精品视频8| 91在线一区| 日韩中文在线中文网三级| 妺妺窝人体色www婷婷| 欧美日韩破处视频| 精品久久久久久久一区二区蜜臀| 欧美做受高潮6| 亚洲人体视频| 欧美一级免费大片| 国产制服丝袜在线| 99爱在线视频| 在线综合视频播放| 中国毛片在线观看| 都市激情亚洲综合| 亚洲精品黄网在线观看| 成人高潮免费视频| 欧美精品三级在线| 日日狠狠久久偷偷四色综合免费| 人妻无码一区二区三区久久99| 卡通动漫精品一区二区三区| 亚洲欧美制服另类日韩| 国产探花视频在线播放| 高清av不卡| 亚洲国产精品推荐| 国产一二三区精品| 美女日韩一区| www.日韩不卡电影av| 在线精品免费视| 成人一二三区| 国产精品成人一区| 欧美伦理片在线看| 亚洲天堂777| 日本一区二区三区视频| 97在线看福利| www.超碰在线.com| 精品动漫av| 99精彩视频| 你懂的网址视频| 91网站视频在线观看| 国产精品又粗又长| 国产小视频免费在线观看| 精品欧美国产一区二区三区| 在线播放第一页| 成人免费毛片嘿嘿连载视频…| 亚洲欧洲日本专区| 少妇久久久久久久| 伊人青青综合网| 国产精品美女黄网| 日日草天天干| 亚洲欧洲性图库| youjizz.com国产| 久久91超碰青草在哪里看| 亚洲精品中文字幕在线观看| 国产精品99蜜臀久久不卡二区| 色窝窝无码一区二区三区成人网站 | 国产日韩在线免费| 久久精品国产免费观看99| 国产真实乱对白精彩久久| 日韩精品综合在线| 性开放的欧美大片| 欧美变态tickling挠脚心| 国产一级片毛片| 狠狠综合久久av一区二区老牛| 久久青青草综合| 在线免费观看高清视频色| 色综合视频一区二区三区高清| 久久一级免费视频| 欧美一区二区三| 麻豆精品视频| 神马亚洲视频| 精品久久久久久久久久久院品网| 精产国品一区二区| 99re成人在线| 久久久久这里只有精品| 国产三级小视频| 老司机亚洲精品| 黄色一级片网址| 粗大黑人巨茎大战欧美成人| 亚洲国产精品久久久久久| 91女人18毛片水多国产| 麻豆91在线看| 熟女少妇精品一区二区| 日韩国产网站| 国产精品91久久久| 天天操天天射天天色|