歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://app.aibase.com/zh
1、阿里云推出全球首個(gè)全模態(tài) AI 模型 Qwen3-Omni,實(shí)現(xiàn)文本、圖像、音頻與視頻的統(tǒng)一處理
阿里云發(fā)布了 Qwen3-Omni,這是全球首個(gè)原生端到端全模態(tài) AI 模型,支持文本、圖像、音頻和視頻的統(tǒng)一處理。該模型在多個(gè)領(lǐng)域展現(xiàn)出跨模態(tài)的先進(jìn)表現(xiàn),并且已開源,能夠滿足全球用戶的多語言需求。

【AiBase提要:】
?? Qwen3-Omni 是全球首個(gè)原生端到端全模態(tài) AI 模型,支持文本、圖像、音頻和視頻的統(tǒng)一處理。
?? 模型支持119種文本語言和19種語音輸入,能夠滿足全球用戶的多語言需求。
??? 新發(fā)布的 Qwen-Image-Edit-2509 支持多圖像編輯,顯著提升編輯的一致性和效果。
詳情鏈接:https://github.com/QwenLM/Qwen3-Omni huggingface:https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe
2、告別P圖煩惱!阿里Qwen-Image多圖像編輯功能一鍵合成專業(yè)級(jí)廣告大片
文章介紹了阿里巴巴旗下AI圖像編輯工具Qwen-Image的重大功能升級(jí),包括新增多圖像編輯功能、引入ControlNet關(guān)鍵點(diǎn)地圖技術(shù)以及擴(kuò)展應(yīng)用場景至模因制作,為電子商務(wù)和數(shù)字營銷行業(yè)提供了更高效的解決方案。

【AiBase提要:】
??? 新增多圖像編輯功能,支持人+人、人+產(chǎn)品、人+場景的靈活組合。
?? 引入ControlNet關(guān)鍵點(diǎn)地圖功能,提升人物姿勢控制精度。
?? 擴(kuò)展應(yīng)用場景,支持模因制作,助力電商和營銷行業(yè)。
詳情鏈接:https://chat.qwen.ai/?inputFeature=image_edit
3、百度推出 Qianfan-VL 模型 多尺寸模型滿足不同場景需求
百度智能云千帆團(tuán)隊(duì)推出了全新視覺理解模型 Qianfan-VL,該模型包括3B、8B 和70B 三種尺寸,針對(duì)企業(yè)級(jí)多模態(tài)應(yīng)用進(jìn)行了深度優(yōu)化。Qianfan-VL 在OCR、教育場景和數(shù)學(xué)解題方面表現(xiàn)出色,并且在基準(zhǔn)測試中展現(xiàn)了出色的通用能力和特定任務(wù)的優(yōu)秀表現(xiàn)。
【AiBase提要:】
?? 多尺寸模型滿足不同場景需求
?? 8B 和70B 模型具備思考推理能力
?? OCR 和文檔理解表現(xiàn)優(yōu)異
詳情鏈接:https://baidubce.github.io/Qianfan-VL/
4、谷歌推出 AP2 協(xié)議,攜手 PayPal 開啟 AI 支付新時(shí)代
谷歌推出的AP2協(xié)議為AI支付提供了安全可靠的框架,通過授權(quán)令牌機(jī)制確保交易的合法性和安全性,同時(shí)與PayPal合作推動(dòng)AI在支付領(lǐng)域的創(chuàng)新和應(yīng)用。

【AiBase提要:】
?? AP2協(xié)議為AI支付提供安全授權(quán)機(jī)制,確保交易合法性。
?? 谷歌與PayPal合作,推動(dòng)AI在支付領(lǐng)域的實(shí)際應(yīng)用。
?? 授權(quán)令牌系統(tǒng)明確責(zé)任劃分,提升交易透明度。
詳情鏈接:https://github.com/google-agentic-commerce/AP2
5、蘋果擴(kuò)展圖像生成平臺(tái):Image Playground 將引入更多第三方AI模型
蘋果在 macOS Tahoe26、iPadOS26 和 iOS26 中對(duì) Image Playground 進(jìn)行了重大更新,引入了 ChatGPT 作為圖像生成模型,并計(jì)劃支持更多第三方模型,如 Google 的 Gemini2.5Flash Image。

【AiBase提要:】
?? 蘋果擴(kuò)展 Image Playground 支持更多第三方 AI 模型,包括 OpenAI 和 Google 的 Gemini2.5Flash Image。
?? 新增“估計(jì)延遲”指標(biāo)和“提供商標(biāo)識(shí)符”,表明蘋果正在優(yōu)化模型選擇機(jī)制。
?? 蘋果可能更傾向于與外部合作伙伴合作,而非直接支持開源模型,以確保圖像生成工具的安全性。
6、一鍵變身學(xué)習(xí)機(jī)!百度搜索推出AI伴學(xué)
百度推出AI伴學(xué),通過AI技術(shù)將普通手機(jī)轉(zhuǎn)變?yōu)閷W(xué)習(xí)機(jī),為學(xué)生提供精準(zhǔn)練、口語訓(xùn)練等功能,助力教育公平和資源普及。
【AiBase提要:】
?? AI伴學(xué)通過AI技術(shù)將普通手機(jī)變?yōu)閷W(xué)習(xí)機(jī),提升教育公平性。
??? 提供AI口語、作文批改等工具,助力學(xué)生個(gè)性化學(xué)習(xí)。
?? 百度教育團(tuán)隊(duì)利用文心4.5等技術(shù)推動(dòng)教育資源整合與普及。
7、釘釘AI表格助理正式上線:一句話生成表格,打造企業(yè)級(jí)AI應(yīng)用平臺(tái)
釘釘推出AI表格助理,將AI表格升級(jí)為面向AI時(shí)代的應(yīng)用創(chuàng)建平臺(tái)。用戶只需更新到最新版本,即可體驗(yàn)這一新功能。AI表格助理支持自然語言描述想法,自動(dòng)生成表格、自動(dòng)化工作流和數(shù)據(jù)分析儀表盤,大大降低了使用門檻。
【AiBase提要:】
? AI表格助理支持自然語言描述想法,自動(dòng)生成表格、自動(dòng)化工作流和數(shù)據(jù)分析儀表盤。
?? 引入字段Agent,新增30款A(yù)gent,支持AI視頻理解、數(shù)字人等多模態(tài)AI能力。
?? 跨平臺(tái)工作流支持,新增對(duì)百煉、Coze等平臺(tái)工作流的支持,實(shí)現(xiàn)跨平臺(tái)的數(shù)據(jù)匯總和分析。
8、DeepSeek-V3.1-Terminus 重磅發(fā)布:性能全面提升,深度推理能力顯著增強(qiáng)
DeepSeek 發(fā)布了 DeepSeek-V3.1-Terminus 模型,并將其開源。該模型在原有基礎(chǔ)上修復(fù)了語言不一致和異常字符問題,優(yōu)化了編程和搜索智能體的性能。基準(zhǔn)測試數(shù)據(jù)顯示,其性能提升了0.2%至36.5%,尤其在高難度知識(shí)、多模態(tài)和深度推理方面表現(xiàn)突出。
【AiBase提要:】
?? DeepSeek-V3.1-Terminus 模型性能全面升級(jí),提升幅度達(dá)0.2%-36.5%
?? 重點(diǎn)優(yōu)化了編程和搜索智能體的性能,解決了舊版的語言不一致問題
?? 在 HLE 測試中表現(xiàn)尤為出色,展示了強(qiáng)大的深度推理與多模態(tài)處理能力
詳情鏈接:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
9、Kimi Agent會(huì)員驚喜上線!打賞秒變9個(gè)月VIP,49元享超值A(chǔ)I深度研究
Kimi推出了全新的Agent會(huì)員服務(wù),為早期打賞用戶提供了額外的福利,同時(shí)通過音樂節(jié)拍命名的會(huì)員體系,展現(xiàn)了品牌創(chuàng)意。深度研究功能基于專有模型,提供專業(yè)洞見,推動(dòng)了AI助手向智能化代理演進(jìn)。

【AiBase提要:】
? Kimi推出Agent會(huì)員服務(wù),打賞用戶可獲得額外會(huì)員時(shí)長。
?? 會(huì)員體系以古典音樂節(jié)拍術(shù)語命名,融合藝術(shù)與科技。
?? 深度研究功能基于專有模型,提供多維度觀點(diǎn)分析和認(rèn)知發(fā)現(xiàn)。
10、全球首個(gè)通用具身智能模型開源!智元機(jī)器人GO-1震撼來襲
智元機(jī)器人宣布其GO-1通用具身基座大模型全面開源,這是全球首個(gè)采用ViLLA架構(gòu)的具身智能模型,能夠理解和執(zhí)行復(fù)雜任務(wù)。這一舉措將推動(dòng)具身智能的應(yīng)用和研究,降低技術(shù)門檻,并吸引更多的開發(fā)者參與該生態(tài)系統(tǒng),促進(jìn)跨領(lǐng)域的創(chuàng)新與合作。
【AiBase提要:】
?? GO-1是全球首個(gè)采用ViLLA架構(gòu)的具身智能模型,結(jié)合視覺、語言和潛在動(dòng)作能力。
?? 開源GO-1將推動(dòng)具身智能的應(yīng)用和研究,降低技術(shù)門檻。
?? 智元機(jī)器人希望吸引更多開發(fā)者參與具身智能生態(tài)系統(tǒng),促進(jìn)跨領(lǐng)域創(chuàng)新與合作。
(舉報(bào))
