HuggingFace 每日AI论文速递
Episodes
2025.09.23 | 少78条示范让AI飙73.5%;免掩膜视频插主体超Pika
23 Sep 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:21] 🚀 LIMI: Less is More for Agency(LIMI:少即是多,打造AI智能体)[00:55] 🎬 OmniInsert: Mask-Fr...
2025.09.22 | 有向图驱动代码生成;双通道视觉统一模型
22 Sep 2025
Contributed by Lukas
本期的 13 篇论文如下:[00:25] 🗺 RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation(RPG:用于统一可扩展...
【周末特辑】9月第4周最火AI论文 | OmniWorld打造4D数据工厂;WebWeaver让AI边搜边写
20 Sep 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:43] TOP1(🔥95) | 🌍 OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling(OmniWorld:面向...
2025.09.19 | 跨平台GUI模型刷榜;FlowRL分布匹配提推理
19 Sep 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:26] 🖥 ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data(ScaleCUA:基于跨平台数...
2025.09.18 | FP8压缩+翻译微调低成本炼阿语大模型;2B-8B小模型洗数据硬刚GPT-4o
18 Sep 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:19] 🐪 Hala Technical Report: Building Arabic-Centric Instruction & Translation Models at Scale(Hala技术报...
2025.09.17 | WebWeaver框架提升可信长文报告;Agentic预训练扩展智能体系统
17 Sep 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:27] 🔍 WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research(WebWeaver:...
2025.09.16 | OmniWorld建4D数据底座;UI-S1半在线驯界面代理
16 Sep 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:24] 🌍 OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling(OmniWorld:面向4D世界建模...
2025.09.15 | 数据集升级测互动;模型大小非长程瓶颈
15 Sep 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:25] 📚 IntrEx: A Dataset for Modeling Engagement in Educational Conversations(IntrEx:面向教育对话中参...
【周末特辑】9月第3周最火AI论文 | 群智RL提速大模型;小VLA零预训练控机械
14 Sep 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:40] TOP1(🔥455) | 🤝 Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing(共享...
2025.09.12 | HuMo多模态控人视频;SimpleVLA-RL强化升效
12 Sep 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:27] 🎭 HuMo: Human-Centric Video Generation via Collaborative Multi-Modal Conditioning(HuMo:通过协同多模...
2025.09.11 | 强化学习提升推理能力;奖励缩放优化视觉生成
11 Sep 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:24] 🧠 A Survey of Reinforcement Learning for Large Reasoning Models(大型推理模型的强化学习综述)...
2025.09.10 | 强化学习并行思维;视觉搜索推理扩展
10 Sep 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:22] 🧠 Parallel-R1: Towards Parallel Thinking via Reinforcement Learning(Parallel-R1: 通过强化学习实现并...
2025.09.09 | REER提升推理性能;WebExplorer训练智能体
09 Sep 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:21] 💡 Reverse-Engineered Reasoning for Open-Ended Generation(面向开放式生成的逆向工程推理)[00:...
2025.09.08 | 语言模型幻觉源于预训练;大模型图形编程性能提升
08 Sep 2025
Contributed by Lukas
本期的 12 篇论文如下:[00:24] 🤔 Why Language Models Hallucinate(语言模型为何产生幻觉)[00:47] 🎨 Symbolic Graphics Programm...
【周末特辑】9月第2周最火AI论文 | LLM智能体RL综述;AI代码安全基准
06 Sep 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:35] TOP1(🔥139) | 🤖 The Landscape of Agentic Reinforcement Learning for LLMs: A Survey(面向大语言模型的...
2025.09.05 | 大型语言模型语义理解弱;图像编辑模型提升几何估计
05 Sep 2025
Contributed by Lukas
本期的 13 篇论文如下:[00:22] 🤔 Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth(废话学:用深度解读无意义...
2025.09.04 | 机器人任务规划高效;数据推理能力提升
04 Sep 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:24] 🤖 Robix: A Unified Model for Robot Interaction, Reasoning and Planning(Robix:一个用于机器人交互、...
2025.09.03 | 智能体RL提升大模型自主性;SimpleTIR解多轮工具推理
03 Sep 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:19] 🤖 The Landscape of Agentic Reinforcement Learning for LLMs: A Survey(面向大语言模型的智能体强化...
2025.09.02 | PVPO优化推理性能;T2R-bench暴露模型短板
02 Sep 2025
Contributed by Lukas
本期的 6 篇论文如下:[00:23] 🧠 PVPO: Pre-Estimated Value-Based Policy Optimization for Agentic Reasoning(PVPO:基于预估值策略优...
2025.09.01 | R-4B模型优化思考效率;EO-1提升机器人控制能力
01 Sep 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🧠 R-4B: Incentivizing General-Purpose Auto-Thinking Capability in MLLMs via Bi-Mode Annealing and Reinforce ...
【月末特辑】8月最火AI论文 | 科学AI模型缩小性能差距;图像模型解决文本渲染与编辑
31 Aug 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:30] TOP1(🔥242) | 🧪 Intern-S1: A Scientific Multimodal Foundation Model(Intern-S1:一个科学多模态基...
【周末特辑】8月第5周最火AI论文 | 多模态模型效率提升;自博弈策略提高多样性
30 Aug 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:36] TOP1(🔥161) | 🚀 InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficie...
2025.08.29 | 稳定文本到图像生成;高效数学推理
29 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] ⚖ Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning(Pref-GRP...
2025.08.28 | 推理分解减幻觉;可解释性编码信息
28 Aug 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:25] 🧠 Self-Rewarding Vision-Language Model via Reasoning Decomposition(通过推理分解的自奖励视觉语...
2025.08.27 | 物理模型评估显不足;树算法优化提效降本
27 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🔬 CMPhysBench: A Benchmark for Evaluating Large Language Models in Condensed Matter Physics(CMPhysBench:...
2025.08.26 | 提升模型推理效率;增强生成语义对齐
26 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🚀 InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency(InternVL3...
2025.08.25 | 无微调智能体高效学习;四足机器人长周期探索
25 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🚀 AgentFly: Fine-tuning LLM Agents without Fine-tuning LLMs(AgentFly:无需微调LLM即可微调LLM智能...
【周末特辑】8月第4周最火AI论文 | 视觉模型新突破;科学多模态领先
24 Aug 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:39] TOP1(🔥172) | 🚀 DINOv3(DINOv3:视觉基础模型新里程碑)[01:39] TOP2(🔥170) | 🧪 Intern-S1: ...
2025.08.22 | 科学多模态缩小差距;GUI自动化解决挑战
23 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🧪 Intern-S1: A Scientific Multimodal Foundation Model(Intern-S1:一个科学多模态基础模型)[00:...
2025.08.21 | 金融大模型认知诊断;DuPO优化自验证
22 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🧠 From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models(从...
2025.08.20 | 智能体链提升效率;长视频3D重建优化
21 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🤖 Chain-of-Agents: End-to-End Agent Foundation Models via Multi-Agent Distillation and Agentic RL(智能体...
2025.08.19 | Ovis2.5提升多模态;ComoRAG优化长叙事推理
20 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:20] ✨ Ovis2.5 Technical Report(Ovis2.5 技术报告)[00:51] 🧠 ComoRAG: A Cognitive-Inspired Memory-Organiz...
2025.08.18 | 超越图像思考;自搜索强化
18 Aug 2025
Contributed by Lukas
本期的 13 篇论文如下:[00:19] 💡 Thyme: Think Beyond Images(Thyme:超越图像的思考)[00:48] 🧠 SSRL: Self-Search Reinforcement ...
【周末特辑】8月第3周最火AI论文 | GLM-4.5统一智能体推理编程;We-Math提升视觉数学推理
17 Aug 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:32] TOP1(🔥139) | 🚀 GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models(GLM-4.5:智能体、推...
2025.08.15 | 数学推理手册提升模型能力;连续令牌生成图像模型
16 Aug 2025
Contributed by Lukas
本期的 12 篇论文如下:[00:23] 📚 We-Math 2.0: A Versatile MathBook System for Incentivizing Visual Mathematical Reasoning(We-Math 2.0:一...
2025.08.14 | 分子推理框架提升性能;视频身份控制轻量高效
14 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:17] 🧪 Mol-R1: Towards Explicit Long-CoT Reasoning in Molecule Discovery(Mol-R1:迈向分子发现中的显式...
2025.08.13 | 多模态AI突破;3D世界生成
13 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🤖 WebWatcher: Breaking New Frontier of Vision-Language Deep Research Agent(WebWatcher:突破视觉-语言...
2025.08.12 | ReasonRank提升段落排序推理;WideSearch评估智能体广域搜寻
13 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:18] 🧠 ReasonRank: Empowering Passage Ranking with Strong Reasoning Ability(ReasonRank:赋予段落排序强大...
2025.08.11 | GLM-4.5统一智能体推理编程;Voost高保真虚拟试穿试脱
12 Aug 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:20] 🚀 GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models(GLM-4.5:智能体、推理与编程(...
【周末特辑】8月第2周最火AI论文 | CoT推理是幻象;Qwen-Image渲染领先
10 Aug 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:33] TOP1(🔥174) | 🤔 Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens(LLM思维链推理...
2025.08.08 | 动态微调优推理;零数据自演进强推理
09 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:16] ✨ On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification(关于SFT泛...
2025.08.07 | VeriGUI提升代理能力;CoT推理实为模式匹配
07 Aug 2025
Contributed by Lukas
本期的 13 篇论文如下:[00:20] 🤖 VeriGUI: Verifiable Long-Chain GUI Dataset(VeriGUI:可验证的长链GUI数据集)[00:40] 🤔 Is Ch...
2025.08.06 | 高速推理扩散模型;紧凑视觉生成模型
07 Aug 2025
Contributed by Lukas
本期的 13 篇论文如下:[00:17] 🚀 Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference(种子扩散:一种具...
2025.08.05 | 图像文本渲染编辑创新;上下文检索提升故事理解
06 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:18] 🎨 Qwen-Image Technical Report(Qwen-Image技术报告)[00:39] 🔍 SitEmb-v1.5: Improved Context-Aware De...
2025.08.04 | 扩散语言模型变长去噪,高效省资源;PixNerd图像扩散,高效高质量。
05 Aug 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:22] 🔄 Beyond Fixed: Variable-Length Denoising for Diffusion Large Language Models(超越固定长度:扩散大...
【月末特辑】7月最火AI论文 | GSPO稳训练;序列级裁剪降方差;上下文工程综述,动态拼装信息流
04 Aug 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:30] TOP1(🔥257) | 🚀 Group Sequence Policy Optimization(组序列策略优化)[02:21] TOP2(🔥227) | 🧮 ...
【周末特辑】8月第1周最火AI论文 | ARPO用高熵分叉省预算;混元世界一句话生成可编辑3D场景
03 Aug 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:32] TOP1(🔥114) | 🤖 Agentic Reinforced Policy Optimization(智能体强化策略优化)[02:17] TOP2(🔥94)...
2025.08.01 | Seed-Prover融合LLM解决IMO数学题;Phi-Ground提升GUI感知精度。
01 Aug 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🏆 Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving(Seed-Prover:自动化定理证明的...
2025.07.31 | ScreenCoder自动化UI转代码;Falcon-H1混合架构,提升长序列效率。
01 Aug 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:22] 💻 ScreenCoder: Advancing Visual-to-Code Generation for Front-End Automation via Modular Multimodal Agents(S...
2025.07.30 | 混元世界从文字像素生成沉浸3D世界;X-Omni用强化学习提升图像生成质量。
31 Jul 2025
Contributed by Lukas
本期的 8 篇论文如下:[00:23] 🌍 HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worlds from Words or Pixels(混元...
2025.07.29 | ARPO提升LLM工具交互性能;ARC-Hunyuan-Video-7B深耕短视频理解。
30 Jul 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🤖 Agentic Reinforced Policy Optimization(智能体强化策略优化)[00:55] 🧠 ARC-Hunyuan-Video-7B: ...
2025.07.28 | GPTQ揭示为Babai算法,保障精度;TTD-DR以扩散模型生成高质量研究报告。
29 Jul 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:25] 💡 The Geometry of LLM Quantization: GPTQ as Babai's Nearest Plane Algorithm(LLM 量化的几何学:GPTQ 作...
【周末特辑】7月第4周最火AI论文 | GUI-G2:高斯奖励提升GUI定位;MiroMind-M1:开源数学推理LLM
26 Jul 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:36] TOP1(🔥118) | 🎯 GUI-G$^2$: Gaussian Reward Modeling for GUI Grounding(GUI-G$^2$: 基于高斯奖励模型...
2025.07.25 | GSPO解决大模型训练崩溃;MUR提升LLM推理效率。
26 Jul 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🚀 Group Sequence Policy Optimization(组序列策略优化)[00:53] 🧠 MUR: Momentum Uncertainty guided...
2025.07.24 | MLLMs视觉感知仍不足;Yume模型可生成交互虚拟世界。
25 Jul 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:23] 👁 Pixels, Patterns, but No Poetry: To See The World like Humans(像素、模式,却无诗意:像人类一...
2025.07.23 | TIM模型突破LLM上下文限制;Step-Audio 2提升多模态语音对话。
24 Jul 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] ♾ Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning(超越上下文限制:用于长程...
2025.07.22 | MiroMind-M1提升数学推理;GUI-G$^2$高斯奖励助GUI定位。
22 Jul 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:25] 🧮 MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Opt...
2025.07.21 | dLLM新型安全漏洞,现有防御不足;俄语语音合成,数据与标注是核心。
22 Jul 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:20] 😈 The Devil behind the mask: An emergent safety vulnerability of Diffusion LLMs(隐藏在面具后的恶魔...
【周末特辑】7月第3周最火AI论文 | 上下文工程提升LLM性能;反射生成模型提高推理效率。
20 Jul 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:39] TOP1(🔥116) | 🧮 A Survey of Context Engineering for Large Language Models(大型语言模型上下文工程...
2025.07.18 | 优化LLMs上下文;提升视觉语言模型效率
19 Jul 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:27] 🧮 A Survey of Context Engineering for Large Language Models(大型语言模型上下文工程综述)[01:...
2025.07.17 | RAG提升LLM推理;PhysX生成物理3D资产
18 Jul 2025
Contributed by Lukas
本期的 13 篇论文如下:[00:26] 🧠 Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs(具身智能RAG与深...
2025.07.16 | VLV自编码器降低训练成本;EXAONE 4.0增强推理能力。
17 Jul 2025
Contributed by Lukas
本期的 8 篇论文如下:[00:28] 💡 Vision-Language-Vision Auto-Encoder: Scalable Knowledge Distillation from Diffusion Models(视觉-语言-...
2025.07.15 | 数据集支持虚拟人生成;强化学习需防数据污染。
16 Jul 2025
Contributed by Lukas
本期的 12 篇论文如下:[00:24] 🗣 SpeakerVid-5M: A Large-Scale High-Quality Dataset for Audio-Visual Dyadic Interactive Human Generation(S...
2025.07.14 | 高效推理路径选择;压缩光场令牌渲染
14 Jul 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:22] 🧠 Test-Time Scaling with Reflective Generative Model(基于反射生成模型的测试时缩放)[00:59] ...
【周末特辑】7月第2周最火AI论文 | 长视频推理框架创新;内存操作系统提升AI性能
13 Jul 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:42] TOP1(🔥109) | 🎬 Scaling RL to Long Videos(强化学习驱动视觉语言模型扩展至长视频)[02:54...
2025.07.11 | 长视频推理效率提升;单图像定制模型防过拟合。
11 Jul 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:25] 🎬 Scaling RL to Long Videos(强化学习驱动视觉语言模型扩展至长视频)[01:10] 🖼 T-LoRA: ...
2025.07.10 | 零样本运动生成突破;4K图像超分辨率提升。
10 Jul 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:22] 🤸 Go to Zero: Towards Zero-shot Motion Generation with Million-scale Data(趋向于零:基于百万级数...
2025.07.09 | 潜在推理提升LLM表达能力;SingLoRA优化低秩适应性能。
09 Jul 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:25] 🤔 A Survey on Latent Reasoning(潜在推理研究综述)[00:59] 💡 SingLoRA: Low Rank Adaptation Using...
2025.07.08 | MemOS提升内存管理效率;MLM与CLM结合优化编码器训练。
08 Jul 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:21] 🧠 MemOS: A Memory OS for AI System(MemOS:面向人工智能系统的内存操作系统)[01:07] 🤔 Sh...
2025.07.07 | GPT-4o在语义任务中表现良好;潜在空间模拟精度高。
07 Jul 2025
Contributed by Lukas
本期的 4 篇论文如下:[00:27] 🖼 How Well Does GPT-4o Understand Vision? Evaluating Multimodal Foundation Models on Standard Computer Vision...
【周末特辑】7月第1周最火AI论文 | 多模态推理模型提升;短视频理解领先。
06 Jul 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:35] TOP1(🔥165) | 🧠 GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learn...
【月末特辑】6月最火AI论文 | LLM通过自我反思提升性能;MiniMax-M1高效扩展测试计算。
05 Jul 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:37] TOP1(🔥258) | 💡 Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning(反思、重试、...
2025.07.04 | WebSailor提升LLM推理能力;LangScene-X优化3D场景重建。
04 Jul 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🧭 WebSailor: Navigating Super-human Reasoning for Web Agent(WebSailor:为Web Agent导航超人推理)[...
2025.07.03 | 多模态模型提升短视频理解;动画生成保持颜色一致。
04 Jul 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:21] 🎬 Kwai Keye-VL Technical Report(Kwai Keye-VL 技术报告)[01:02] 🎨 LongAnimation: Long Animation Gene...
2025.07.02 | 多模态推理提升;双向嵌入优化
02 Jul 2025
Contributed by Lukas
本期的 12 篇论文如下:[00:23] 💡 GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning(GLM-4.1V-...
2025.07.01 | 多模态生成领先;视频扩散效率提升
01 Jul 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:21] 🖼 Ovis-U1 Technical Report(Ovis-U1 技术报告)[00:58] 🎬 VMoBA: Mixture-of-Block Attention for Video...
2025.06.30 | 3D视觉编辑;视频令牌压缩
01 Jul 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:26] 🎨 BlenderFusion: 3D-Grounded Visual Editing and Generative Compositing(BlenderFusion:基于3D的视觉编...
【周末特辑】6月第5周最火AI论文 | 拖拽式大模型提升效率;法线光照恢复高精度。
28 Jun 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:42] TOP1(🔥107) | 🧲 Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights(拖拽式大语言模型:零样本提示...
2025.06.27 | 强化学习提升搜索效率;记忆增强生成逼真驾驶场景。
28 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:25] 🔍 MMSearch-R1: Incentivizing LMMs to Search(MMSearch-R1:激励大型多模态模型进行搜索)[00:59...
2025.06.26 | 高质量多模态模型;4比特量化提升性能
26 Jun 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:23] 🖼 ShareGPT-4o-Image: Aligning Multimodal Models with GPT-4o-Level Image Generation(ShareGPT-4o-Image:通...
2025.06.25 | AnimaX提升3D非生物体动画效果;Matrix-Game优化游戏世界模型。
26 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:25] 🤖 AnimaX: Animating the Inanimate in 3D with Joint Video-Pose Diffusion Models(AnimaX:利用联合视频...
2025.06.24 | 法线光照新方法提升细节;多模态生成模型表现优异。
25 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 💡 Light of Normals: Unified Feature Representation for Universal Photometric Stereo(法线光照:用于通...
2025.06.23 | DnD降低计算开销;视觉引导提升RAG性能。
23 Jun 2025
Contributed by Lukas
本期的 12 篇论文如下:[00:23] 🧲 Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights(拖拽式大语言模型:零样本提示到权重)[0...
【周末特辑】6月第4周最火AI论文 | 高效扩展推理能力;多模态金融评估基准。
21 Jun 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:36] TOP1(🔥216) | 💡 MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention(MiniMax-M1:利...
2025.06.20 | 强化学习提升跨领域推理;语音情感检测基准精细化。
20 Jun 2025
Contributed by Lukas
本期的 4 篇论文如下:[00:24] 🧠 Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective(跨领域视角下重...
2025.06.19 | SEKAI数据集提升视频生成;原型推理增强LLM泛化能力。
19 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🌍 Sekai: A Video Dataset towards World Exploration(Sekai:一个面向世界探索的视频数据集)[0...
2025.06.18 | MultiFinBen揭示金融模型局限;测试时计算提升LLM Agent性能。
18 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 📊 MultiFinBen: A Multilingual, Multimodal, and Difficulty-Aware Benchmark for Financial LLM Evaluation(Mul...
2025.06.17 | MiniMax-M1提升推理性能;多模态模型认知测试创新。
17 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 💡 MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention(MiniMax-M1:利用闪电注意...
2025.06.16 | 跨模态合成新视角图像;策略依从型智能体抗攻击
17 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🖼 Aligned Novel View Image and Geometry Synthesis via Cross-modal Attention Instillation(基于跨模态注...
【周末特辑】6月第3周最火AI论文 | 强化预训练提升语言模型推理能力;多语种分类器改善问答系统可信度。
15 Jun 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:43] TOP1(🔥199) | 🤖 Reinforcement Pre-Training(强化预训练)[03:06] TOP2(🔥124) | 🕰 Will It Still B...
2025.06.13 | 医学推理模型新范式;自动化构建软件工程数据集
14 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🩺 ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning(ReasonMed:一个用于...
2025.06.12 | 自信微调提升模型表现;视频生成模型高效优化。
12 Jun 2025
Contributed by Lukas
本期的 13 篇论文如下:[00:23] 🧠 Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models(自信即全部:基于语言模...
2025.06.11 | LLM存在地缘政治偏见;RuleReasoner提升推理效率。
11 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🌍 Geopolitical biases in LLMs: what are the "good" and the "bad" countries according to contemporary languag...
2025.06.10 | 强化学习改进语言模型;医学多模态模型提升推理能力。
10 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:21] 🤖 Reinforcement Pre-Training(强化预训练)[01:01] 🩺 Lingshu: A Generalist Foundation Model for Uni...
2025.06.09 | 常青问题分类提升问答系统;多模态融合优化音频描述。
10 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🕰 Will It Still Be True Tomorrow? Multilingual Evergreen Question Classification to Improve Trustworthy QA(...
【周末特辑】6月第2周最火AI论文 | LLM自我反思提升性能;高熵Token优化推理。
08 Jun 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:47] TOP1(🔥169) | 💡 Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning(反思、重试、...
2025.06.06 | 智能助手加速ComfyUI开发;单步视频修复提升效率。
07 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🤖 ComfyUI-Copilot: An Intelligent Assistant for Automated Workflow Development(ComfyUI-Copilot:用于自...
2025.06.05 | 紧凑强大视觉模型;多阶段训练提升推理能力
06 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:21] 🤖 MiMo-VL Technical Report(MiMo-VL 技术报告)[01:14] 💡 Advancing Multimodal Reasoning: From Optimi...
2025.06.04 | 强化学习提升LLM性能;UniWorld统一视觉理解与生成。
05 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 💡 Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning(反思、重试、奖励:通过...
2025.06.03 | 高熵Token提升LLM推理;推理健身房优化强化学习环境。
03 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🧠 Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasoni...