歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://app.aibase.com/zh
1、美團全新推理大模型 LongCat-Flash-Thinking發(fā)布
美團推出的LongCat-Flash-Thinking模型憑借其強大的性能和靈活的架構(gòu),在多個領(lǐng)域表現(xiàn)出色,為AI應(yīng)用開發(fā)提供了新的可能性。

【AiBase提要:】
?? LongCat-Flash-Thinking 是一款基于混合專家架構(gòu)的大型推理模型,參數(shù)量高達5600億,能動態(tài)激活186億至313億個參數(shù)。
?? 在數(shù)學(xué)推理、通用推理和代碼生成等任務(wù)中表現(xiàn)優(yōu)異,甚至在某些測試中達到頂級準確率。
?? 模型權(quán)重已開源,并提供詳細聊天模板和專屬聊天網(wǎng)站,便于開發(fā)者使用和研究。
詳情鏈接:https://longcat.chat/
2、一圖生動畫,人物無縫替換!Wan-Animate開源引爆AI視頻革命,阿里黑科技免費玩轉(zhuǎn)?
Wan-Animate模型的開源發(fā)布標志著AI視頻生成技術(shù)的重大突破,其雙任務(wù)處理能力和多模態(tài)融合技術(shù)為視頻創(chuàng)作帶來了革命性的變化。
【AiBase提要:】
?? 雙任務(wù)一鍵搞定:Wan-Animate可同時解決角色動畫生成和角色替換問題,用戶只需提供一張圖片和一段參考視頻即可生成高精度動畫視頻。
?? 多模態(tài)融合驅(qū)動:模型集成骨骼信號控制體動、面部隱式特征提取以及Relighting LoRA模塊優(yōu)化環(huán)境照明,提升唇同步精度和全身動作復(fù)刻效果。
?? 應(yīng)用前景廣闊:Wan-Animate在娛樂和商業(yè)場景中具有巨大潛力,如音樂視頻創(chuàng)作、電商廣告或企業(yè)培訓(xùn),未來有望擴展到多人物視頻支持。
詳情鏈接:https://github.com/Wan-Video/Wan2.2
3、字節(jié)跳動推出豆包翻譯大模型:28種語言互譯,比肩GPT-4o
字節(jié)跳動旗下火山引擎推出了全新的通用翻譯大模型——豆包翻譯模型,該模型支持28種語言的互譯,并且性能已達到或超越市場領(lǐng)先的GPT-4o和Gemini-2.5-Pro等模型。此外,豆包翻譯模型在價格方面也表現(xiàn)出色,每百萬字符輸入僅需1.20元,輸出為3.60元。

【AiBase提要:】
?? 豆包翻譯模型支持28種語言互譯,性能媲美GPT-4o和Gemini-2.5-Pro。
?? 翻譯價格極具競爭力,輸入每百萬字符僅需1.20元,輸出為3.60元。
?? 定價信息可查閱火山引擎官方文檔以獲取詳細信息。
詳情鏈接:https://www.volcengine.com/docs/82379/1820188
4、華為與浙大攜手發(fā)布 DeepSeek-R1-Safe 大模型:AI安全與性能完美平衡
華為與浙江大學(xué)聯(lián)合推出了國內(nèi)首個基于昇騰千卡算力平臺的基礎(chǔ)大模型 DeepSeek-R1-Safe,該模型在 AI 安全和性能方面取得了顯著突破,為未來 AI 產(chǎn)業(yè)生態(tài)協(xié)同發(fā)展提供了新的方向。
【AiBase提要:】
?? DeepSeek-R1-Safe 是基于昇騰千卡算力平臺構(gòu)建的,專注于解決 AI 領(lǐng)域的安全與性能問題。
??? 該模型在多個有害信息防御維度中表現(xiàn)出色,整體防御成功率接近 100%。
?? 在通用能力基準測試中,DeepSeek-R1-Safe 的性能損耗控制在 1% 以內(nèi),實現(xiàn)了安全與性能的平衡。
5、Qwen3-Omni 即將登場:端側(cè)跨模態(tài)模型再升級
Qwen3-Omni 是阿里巴巴云 Qwen 團隊推出的最新跨模態(tài)模型,預(yù)計即將正式發(fā)布。該模型已向 Hugging Face 的 Transformers 庫提交了支持 PR,標志著其開源集成的實現(xiàn)。Qwen3-Omni 采用 Thinker-Talker 雙軌設(shè)計,提升資源受限設(shè)備上的部署效率,并適用于實時交互場景。

【AiBase提要:】
?? Qwen3-Omni 是阿里巴巴云 Qwen 團隊的最新跨模態(tài)模型,旨在提升多模態(tài)處理能力。
?? 該模型采用 Thinker-Talker 雙軌設(shè)計,確保高效流式處理,適用于實時交互場景。
?? Qwen3-Omni 已向 Hugging Face 的 Transformers 庫提交支持 PR,標志著開源集成的實現(xiàn)。
6、xAI發(fā)布Grok4Fast:計算量降低40%,單任務(wù)成本竟然降至98%!
xAI公司推出的Grok4Fast模型在計算量和運行成本上實現(xiàn)了重大突破,同時在性能測試中表現(xiàn)出色,為用戶提供高效且經(jīng)濟的解決方案。

【AiBase提要:】
?? Grok4Fast的計算量減少了40%,提升了處理復(fù)雜任務(wù)的效率。
?? 單任務(wù)運行成本降低了98%,為企業(yè)節(jié)省開支提供了機會。
?? 在GPQA Diamond和AIME2025基準測試中表現(xiàn)優(yōu)異,展現(xiàn)了強大的性能。
7、YouTube 推出全新工具與功能,助力創(chuàng)作者更上一層樓
YouTube 在年度活動上發(fā)布了多項新功能和工具,涵蓋直播、貨幣化方式以及AI輔助創(chuàng)作等。這些更新旨在提升創(chuàng)作者的內(nèi)容管理效率和觀眾互動體驗。
【AiBase提要:】
?? 新工作室功能:引入靈感標簽、標題 A/B 測試和肖像識別等工具,助力創(chuàng)作者管理內(nèi)容。
?? 直播升級:支持小游戲、橫豎屏直播、AI 自動高亮功能,提升直播體驗。
?? 新貨幣化方式:通過品牌合作和購物計劃,創(chuàng)作者可獲取更多收益機會。
8、IBM 推出 Granite-Docling-258M 模型,助力文件轉(zhuǎn)換技術(shù)新突破
IBM 發(fā)布了輕量級視覺語言 AI 模型 Granite-Docling-258M,專為文檔處理設(shè)計。該模型在識別準確度、多語言支持和文檔元素處理方面表現(xiàn)突出,能夠保留原始文檔的版面結(jié)構(gòu),并支持多種輸出格式。

【AiBase提要:】
?? 輕量級模型:Granite-Docling-258M 專為文件轉(zhuǎn)換設(shè)計,參數(shù)量為 2.58 億。
?? 高準確度:相比傳統(tǒng) OCR 軟件,該模型在識別準確度上有顯著提升。
?? 多語言支持:目前支持中文、阿拉伯語和日語,未來將擴展更多語言。
詳情鏈接:https://huggingface.co/ibm-granite/granite-docling-258M
9、中科院推出類腦大模型 SpikingBrain:以2% 數(shù)據(jù)實現(xiàn)百倍速度突破
中科院推出的類腦大模型 SpikingBrain 在處理長文本時展現(xiàn)出驚人的速度和效率,其創(chuàng)新的架構(gòu)和算法為人工智能領(lǐng)域帶來了重大突破。

【AiBase提要:】
?? SpikingBrain 模型采用混合線性注意力架構(gòu),計算復(fù)雜度從二次方降至線性
?? 自適應(yīng)閾值脈沖神經(jīng)元機制顯著降低能耗,實現(xiàn)高計算稀疏度
?? 該模型在處理長文本時速度比主流模型快100倍,僅需2% 訓(xùn)練數(shù)據(jù)
詳情鏈接:https://github.com/BICLab/SpikingBrain-7B
10、OpenAI CEO透露將推計算密集型新功能,部分僅限Pro用戶
OpenAI首席執(zhí)行官Sam Altman宣布,公司將在未來幾周內(nèi)推出一系列需要更多計算資源的新服務(wù),初期將僅對Pro訂閱用戶開放,并可能收取額外費用。盡管如此,Altman表示OpenAI的目標是降低智能服務(wù)的成本,使其更廣泛可用。
【AiBase提要:】
?? OpenAI將推出計算密集型新服務(wù),初期僅限Pro用戶使用。
?? 新功能可能涉及額外費用,以應(yīng)對高昂的計算成本。
?? Altman強調(diào)降低智能服務(wù)成本,提升可及性是長期目標。
(舉報)
