HuggingFace 每日AI论文速递

2025.03.25 | 稀疏自编码器解读LLM中的推理特征，交互视频革新

25 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:24] 🧠 I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Aut...

2025.03.24 | 多智能体协作提升性能，苏格拉底式对话优化提示。

24 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:22] 🧠 MAPS: A Multi-Agent Framework Based on Big Seven Personality and Socratic Guidance for Multimodal Scientif...

【周末特辑】3月第3周最火AI论文 | 序列建模创新，视频渲染突破

22 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:37] TOP1(🔥118) | 🦢 RWKV-7 "Goose" with Expressive Dynamic State Evolution（RWKV-7 "Goose"：具有表达性动...

2025.03.21 | 蒸馏提升超分辨率效率，优化推理减少计算负担。

21 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:23] 🖼 One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation（基于蒸馏的单步残...

2025.03.20 | 自适应前瞻采样优化推理；强化学习提升3D网格质量

20 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:23] 🔍 $φ$-Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation（$\ph...

2025.03.19 | 动态序列建模优势，视频生成理解挑战

19 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:21] 🦢 RWKV-7 "Goose" with Expressive Dynamic State Evolution（RWKV-7 "Goose"：具有表达性动态状态演化...

2025.03.18 | 视频生成新方法，人形机器人新框架

18 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:21] 🎥 DropletVideo: A Dataset and Approach to Explore Integral Spatio-Temporal Consistent Video Generation（Dro...

2025.03.17 | 新相机轨迹生成，稀疏性提升图像质量

17 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:25] 🎥 ReCamMaster: Camera-Controlled Generative Rendering from A Single Video（ReCamMaster：基于单视频的...

【周末特辑】3月第2周最火AI论文 | 稀疏自编码器提升文本检测，自动化ICD编码提高医疗效率。

15 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:44] TOP1(🔥208) | 🤖 Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders（基于稀疏...

2025.03.14 | CoSTA*优化多轮编辑效率，无声品牌攻击揭示扩散模型脆弱性。

14 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:25] 🖼 CoSTA$\ast$: Cost-Sensitive Toolpath Agent for Multi-turn Image Editing（CoSTA*：面向多轮图像编辑...

2025.03.13 | 降低视频扩散模型计算需求，提升多视角视频生成质量。

13 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:20] 🎥 TPDiff: Temporal Pyramid Video Diffusion Model（TPDiff：时间金字塔视频扩散模型）[00:58] 🎥...

2025.03.12 | 东南亚数据集创新构建，大模态模型推理能力显著提升

12 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:23] 🌏 Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast As...

2025.03.11 | 稀疏自编码器提升文本检测，SEAP优化语言模型效率

11 Mar 2025

Contributed by Lukas

本期的 11 篇论文如下：[00:25] 🤖 Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders（基于稀疏自编码器的...

2025.03.10 | 多模态任务新框架，俄语ICD编码提升。

10 Mar 2025

Contributed by Lukas

本期的 20 篇论文如下：[00:19] 🌐 Unified Reward Model for Multimodal Understanding and Generation（多模态理解和生成的统一奖励...

【周末特辑】3月第1周最火AI论文 | 多模态模型音频安全评估，集成工具提升推理效率。

08 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:35] TOP1(🔥64) | 🧠 Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-...

2025.03.07 | 提升推理效率，AI助手优化生活。

07 Mar 2025

Contributed by Lukas

本期的 18 篇论文如下：[00:21] 🛠 START: Self-taught Reasoner with Tools（自教工具集成推理器）[01:03] 👓 EgoLife: Towards Egoce...

2025.03.06 | 开源多语言模型Babel表现优异，多模态嵌入模型ABC提升控制能力。

06 Mar 2025

Contributed by Lukas

本期的 17 篇论文如下：[00:24] 🌍 Babel: Open Multilingual Large Language Models Serving Over 90% of Global Speakers（巴别塔：服务于...

2025.03.05 | MPO提升LLM规划效率，Mask-DPO增强事实性对齐。

05 Mar 2025

Contributed by Lukas

本期的 18 篇论文如下：[00:21] 🚀 MPO: Boosting LLM Agents with Meta Plan Optimization（MPO：通过元计划优化提升LLM代理）[00:59...

2025.03.04 | 强化视觉推理，提升3D重建质量。

04 Mar 2025

Contributed by Lukas

本期的 20 篇论文如下：[00:21] 🧠 Visual-RFT: Visual Reinforcement Fine-Tuning（视觉强化微调：视觉强化微调）[01:05] 🌐 Difi...

2025.03.03 | 工程设计效率提升，推理任务成本降低。

03 Mar 2025

Contributed by Lukas

本期的 10 篇论文如下：[00:20] 🌲 DeepSolution: Boosting Complex Engineering Solution Design via Tree-based Exploration and Bi-point Thinkin...

【月末特辑】2月最火AI论文 | 以数据为中心的小型语言模型训练；人类动画新框架。

02 Mar 2025

Contributed by Lukas

本期的 10 篇论文如下：[00:39] TOP1(🔥196) | 🤖 SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model（SmolLM2：...

【周末特辑】2月第4周最火AI论文 | 标点符号影响LLM记忆，SurveyX提升问卷质量。

01 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:50] TOP1(🔥152) | 🔍 LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers...

2025.02.28 | 自我校正提升数学推理，强化学习优化医疗推理。

28 Feb 2025

Contributed by Lukas

本期的 19 篇论文如下：[00:23] 🧠 Self-rewarding correction for mathematical reasoning（自我奖励的数学推理校正）[01:03] 🧠 Me...

2025.02.27 | Kanana提升韩英双语效率，GHOST 2.0实现高保真头部转移。

27 Feb 2025

Contributed by Lukas

本期的 18 篇论文如下：[00:23] 🌐 Kanana: Compute-efficient Bilingual Language Models（Kanana：计算高效的双语语言模型）[00:54]...

2025.02.26 | OmniAlign-V提升多模态模型对齐，SpargeAttn加速注意力计算

26 Feb 2025

Contributed by Lukas

本期的 14 篇论文如下：[00:23] 🤖 OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference（OmniAlign-V：迈向多模态大语...

2025.02.25 | 长上下文优化创新，视觉扩散高效通用。

25 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下：[00:27] 📖 Thus Spake Long-Context Large Language Model（长上下文大语言模型如是说）[01:09] 🌈 DICEPTI...

2025.02.24 | 高效学术调查生成，标点符号关键作用

24 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下：[00:23] 📚 SurveyX: Academic Survey Automation via Large Language Models（基于大型语言模型的学术调查自...

【周末特辑】2月第3周最火AI论文 | MLGym推动AI代理评估，Qwen2.5-VL提升多模态表现。

22 Feb 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:42] TOP1(🔥138) | 🧠 MLGym: A New Framework and Benchmark for Advancing AI Research Agents（MLGym：推进AI研...

2025.02.21 | AI代理评估新框架，LLM学科表现差异显著。

21 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下：[00:26] 🧠 MLGym: A New Framework and Benchmark for Advancing AI Research Agents（MLGym：推进AI研究代理的新...

2025.02.20 | 提升视觉感知，强化自动驾驶安全。

20 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下：[00:24] 🌐 Qwen2.5-VL Technical Report（Qwen2.5-VL 技术报告）[01:10] 🚗 RAD: Training an End-to-End Driving P...

2025.02.19 | 数据高效语音处理，嵌入空间压缩创新。

19 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下：[00:25] 🎙 Soundwave: Less is More for Speech-Text Alignment in LLMs（声波：减少数据需求，优化语音与文...

2025.02.18 | 稀疏注意力提升效率，机器人起身策略优化。

18 Feb 2025

Contributed by Lukas

本期的 29 篇论文如下：[00:23] ⚡ Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention（原生稀疏注意力：...

2025.02.17 | RAS加速扩散变换器，视频生成提升质量

17 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下：[00:22] 🌐 Region-Adaptive Sampling for Diffusion Transformers（区域自适应采样扩散变换器）[01:05] 🎥 ...

【周末特辑】2月第2周最火AI论文 | 1B LLM如何超越405B LLM；金融领域长上下文QA基准测试

15 Feb 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:54] TOP1(🔥121) | 🤔 Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling（10亿参数LLM能...

2025.02.14 | GPU扩展至300万tokens，文本编码器内存高效策略。

14 Feb 2025

Contributed by Lukas

本期的 18 篇论文如下：[00:21] 🚀 InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU（InfiniteHiP：在单...

2025.02.13 | 多语言评估工具填补空白，密集文本图像数据集挑战生成模型。

13 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下：[00:23] 🌍 BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models（BenchMAX：大型语言...

2025.02.12 | 强化学习提升编程竞赛，代码输入输出优化推理模型。

12 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下：[00:25] 🧠 Competitive Programming with Large Reasoning Models（使用大型推理模型进行编程竞赛）[01:03]...

2025.02.11 | LLMs生成多语言去毒数据，强化学习提升数学推理效率。

11 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下：[00:25] 🤖 SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators（SynthDetoxM：现代大语...

2025.02.10 | 视频处理性能提升，视频生成速度显著加快。

10 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下：[00:22] 🎥 VideoRoPE: What Makes for Good Video Rotary Position Embedding?（视频旋转位置嵌入：什么使得视...

【周末特辑】2月第1周最火AI论文 | OmniHuman提升动画模型性能，SmolLM2优化小型语言模型训练。

08 Feb 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:39] TOP1(🔥162) | 🤖 OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models（Om...

2025.02.07 | 特征流提升模型可解释性，超IF增强指令跟随能力。

07 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下：[00:24] 🔄 Analyze Feature Flow to Enhance Interpretation and Steering in Language Models（分析特征流以增强语...

2025.02.06 | 数据优化提升模型性能，模拟市场再现复杂行为。

06 Feb 2025

Contributed by Lukas

本期的 10 篇论文如下：[00:26] 🤖 SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model（SmolLM2：当小型模型...

2025.02.05 | 逆桥匹配蒸馏提速，视频JAM提升运动连贯。

05 Feb 2025

Contributed by Lukas

本期的 9 篇论文如下：[00:25] ⚡ Inverse Bridge Matching Distillation（逆桥匹配蒸馏）[01:02] 🎥 VideoJAM: Joint Appearance-Motion R...

2025.02.04 | DAAs性能提升，OmniHuman动画优化。

04 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下：[00:26] 🤔 The Differences Between Direct Alignment Algorithms are a Blur（直接对齐算法的差异逐渐模糊）...

2025.02.03 | 测试时缩放提升推理，奖励引导解码减少计算。

03 Feb 2025

Contributed by Lukas

本期的 9 篇论文如下：[00:26] 🧠 s1: Simple test-time scaling（简单的测试时缩放）[01:18] ⚡ Reward-Guided Speculative Decoding fo...

【月末特辑】1月最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力；长文本处理突破

02 Feb 2025

Contributed by Lukas

本期的 10 篇论文如下：[00:40] TOP1(🔥281) | 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning（DeepS...

【周末特辑】1月第4周最火AI论文 | 强化学习优于监督微调，HLE挑战LLMs能力。

01 Feb 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:35] TOP1(🔥53) | 🧠 SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training（监督...

2025.01.31 | GuardReasoner提升LLM安全，MedXpertQA挑战医疗AI推理。

31 Jan 2025

Contributed by Lukas

本期的 8 篇论文如下：[00:25] 🛡 GuardReasoner: Towards Reasoning-based LLM Safeguards（GuardReasoner：面向基于推理的LLM安全防护...

2025.01.30 | 批评提升推理，AI能耗引关注

30 Jan 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:25] 🧠 Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate（批评微调：学习...

2025.01.29 | RL泛化优，SFT稳定输出；FP4量化降成本，精度保持。

29 Jan 2025

Contributed by Lukas

本期的 8 篇论文如下：[00:26] 🧠 SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training（监督微调记忆，...

2025.01.28 | Baichuan多模态模型表现优异，长上下文处理成本降低。

28 Jan 2025

Contributed by Lukas

本期的 9 篇论文如下：[00:26] 🎙 Baichuan-Omni-1.5 Technical Report（百川全能1.5技术报告）[01:03] 📚 Qwen2.5-1M Technical Report...

2025.01.27 | 测试复杂性提升，冗余问题待解决

27 Jan 2025

Contributed by Lukas

本期的 9 篇论文如下：[00:25] 🧠 Humanity's Last Exam（人类最后的考试）[01:06] 📊 Redundancy Principles for MLLMs Benchmarks（多...

【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力，进化搜索优化复杂任务解决。

25 Jan 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:37] TOP1(🔥167) | 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning（DeepSe...

2025.01.24 | SRMT提升多智能体协作能力，VideoReward优化视频生成质量。

24 Jan 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:26] 🧠 SRMT: Shared Memory for Multi-agent Lifelong Pathfinding（SRMT：多智能体终身路径规划中的共享...

2025.01.23 | DeepSeek-R1强化学习提升推理能力，多智能体框架实现虚拟电影自动化

23 Jan 2025

Contributed by Lukas

本期的 9 篇论文如下：[00:24] 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning（DeepSeek-R1：通过强...

2025.01.22 | Agent-R提升语言模型实时纠错能力，MMVU评估多学科视频理解专家级表现。

22 Jan 2025

Contributed by Lukas

本期的 16 篇论文如下：[00:24] 🤔 Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training（Agent-R：通过迭代自...

2025.01.21 | GameFactory实现多样化游戏生成，VideoWorld通过视频学习复杂知识。

21 Jan 2025

Contributed by Lukas

本期的 2 篇论文如下：[00:27] 🎮 GameFactory: Creating New Games with Generative Interactive Videos（GameFactory：利用生成式交互视...

2025.01.20 | 思维进化提升LLM推理能力，PaSa优化学术搜索效率。

20 Jan 2025

Contributed by Lukas

本期的 9 篇论文如下：[00:28] 🧠 Evolving Deeper LLM Thinking（演化更深层次的LLM思维）[01:04] 🔍 PaSa: An LLM Agent for Compreh...

【周末特辑】1月第2周最火AI论文 | MiniMax-01扩展长上下文处理，数学推理PRM提升过程监督。

18 Jan 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:35] TOP1(🔥258) | ⚡ MiniMax-01: Scaling Foundation Models with Lightning Attention（MiniMax-01：基于闪电注...

2025.01.17 | OmniThink提升机器写作深度与新颖性，扩散模型推理扩展提升生成质量。

18 Jan 2025

Contributed by Lukas

本期的 12 篇论文如下：[00:26] 🧠 OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking（OmniThink：通过思考扩...

2025.01.16 | MMDocIR推动多模态检索标准化，CityDreamer4D创新4D城市生成模型。

16 Jan 2025

Contributed by Lukas

本期的 9 篇论文如下：[00:25] 📊 MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents（MMDocIR：长文档多模态检索的基准...

2025.01.15 | MiniMax-01扩展基础模型处理长上下文，填充符在T2I模型中影响图像生成。

15 Jan 2025

Contributed by Lukas

本期的 15 篇论文如下：[00:23] ⚡ MiniMax-01: Scaling Foundation Models with Lightning Attention（MiniMax-01：基于闪电注意力机制扩...

2025.01.14 | 数学推理提升，内存开销减少

14 Jan 2025

Contributed by Lukas

本期的 11 篇论文如下：[00:24] 📊 The Lessons of Developing Process Reward Models in Mathematical Reasoning（数学推理中过程奖励模...

2025.01.13 | OmniManip实现通用机器人操作，VideoRAG提升视频检索生成性能。

13 Jan 2025

Contributed by Lukas

本期的 10 篇论文如下：[00:24] 🤖 OmniManip: Towards General Robotic Manipulation via Object-Centric Interaction Primitives as Spatial Const...

【周末特辑】1月第1周最火AI论文 | 小型模型超越大型模型，REINFORCE++简化对齐方法

11 Jan 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:39] TOP1(🔥173) | 🧠 rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking（rStar-Ma...

2025.01.10 每日AI论文 | GAN训练简化性能提升，视频自回归预训练竞争力显著。

10 Jan 2025

Contributed by Lukas

本期的 7 篇论文如下：[00:23] 🧠 The GAN is dead; long live the GAN! A Modern GAN Baseline（GAN已死；GAN万岁！一个现代的GAN基线...

2025.01.09 每日AI论文 | 小型模型自我进化超越GPT-3，多模态模型提升数学推理能力。

09 Jan 2025

Contributed by Lukas

本期的 11 篇论文如下：[00:25] 🧠 rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking（rStar-Math：小型语言...

2025.01.08 每日AI论文 | REINFORCE++提升大模型对齐效率，MotionBench优化视频运动理解

08 Jan 2025

Contributed by Lukas

本期的 11 篇论文如下：[00:24] 🚀 REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models（REINFORCE++：一种简单...

2025.01.07 每日AI论文 | STAR提升视频超分辨率时空一致性，BoostStep增强大模型数学推理能力。

07 Jan 2025

Contributed by Lukas

本期的 16 篇论文如下：[00:24] 🎥 STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution（STAR...

2025.01.06 每日AI论文 | EnerVerse提升机器人操作规划能力，VITA-1.5优化实时视觉语音交互。

06 Jan 2025

Contributed by Lukas

本期的 8 篇论文如下：[00:24] 🤖 EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation（EnerVerse：面向机器人操作的...

【月末特辑】12月最火AI论文 | Qwen2.5提升大语言模型性能，阿波罗优化视频理解效率。

05 Jan 2025

Contributed by Lukas

本期的 10 篇论文如下：[00:31] TOP1(🔥335) | 🤖 Qwen2.5 Technical Report（Qwen2.5技术报告）[02:44] TOP2(🔥136) | 🎥 Apollo: An E...

【周末特辑】12月第5周最火AI论文 | 提升医学推理能力，自动化GUI轨迹构建。

04 Jan 2025

Contributed by Lukas

本期的 5 篇论文如下：[00:35] TOP1(🔥83) | 🧠 HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs（华佗GPT-o1：迈向医学复杂...

2025.01.03 每日AI论文 | 多模态教科书提升视觉语言模型性能，VideoAnydoor实现高保真视频对象插入

03 Jan 2025

Contributed by Lukas

本期的 17 篇论文如下：[00:24] 📚 2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining（2.5年课堂：用于视觉-语...

2025.01.02 每日AI论文 | 自动化GUI代理轨迹构建，优化推理任务语言模型。

02 Jan 2025

Contributed by Lukas

本期的 2 篇论文如下：[00:26] 🤖 OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis（OS-Genesis：通过逆...

2024.12.31 每日AI论文 | 解释性指令提升视觉任务泛化，多模态模型优化医学影像泛化。

31 Dec 2024

Contributed by Lukas

本期的 10 篇论文如下：[00:25] 🔍 Explanatory Instructions: Towards Unified Vision Tasks Understanding and Zero-shot Generalization（解释...

2024.12.30 每日AI论文 | 华佗GPT-o1提升医学推理，Orient Anything精准估计物体方向。

30 Dec 2024

Contributed by Lukas

本期的 8 篇论文如下：[00:30] 🧠 HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs（华佗GPT-o1：迈向医学复杂推理的大语...

【周末特辑】12月第4周最火AI论文 | 鲁棒微调提升大模型抗噪能力，并行生成加速视觉模型效率。

28 Dec 2024

Contributed by Lukas

本期的 5 篇论文如下：[00:37] TOP1(🔥78) | 🛡 RobustFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response（Rob...

2024.12.27 每日AI论文 | YuLan-Mini提升数据效率，Gist Token优化上下文压缩。

27 Dec 2024

Contributed by Lukas

本期的 4 篇论文如下：[00:26] 🧠 YuLan-Mini: An Open Data-efficient Language Model（YuLan-Mini：一个开放的数据高效语言模型）...

2024.12.26 每日AI论文 | Token预算优化推理，Video-Panda提升视频处理效率。

26 Dec 2024

Contributed by Lukas

本期的 4 篇论文如下：[00:27] 💡 Token-Budget-Aware LLM Reasoning（基于Token预算的大语言模型推理）[01:07] 🎥 Video-Panda: Pa...

2024.12.25 每日AI论文 | 提升三维场景理解，填补深度信息缺失。

25 Dec 2024

Contributed by Lukas

本期的 9 篇论文如下：[00:26] 🧠 3DGraphLLM: Combining Semantic Graphs and Large Language Models for 3D Scene Understanding（3DGraphLLM：结...

2024.12.24 每日AI论文 | 探索与利用平衡，噪声数据处理提升。

24 Dec 2024

Contributed by Lukas

本期的 16 篇论文如下：[00:24] 🔄 B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners（B-STaR：监控和...

2024.12.23 每日AI论文 | 加速视觉生成，优化多步推理

23 Dec 2024

Contributed by Lukas

本期的 10 篇论文如下：[00:22] ⚡ Parallelized Autoregressive Visual Generation（并行自回归视觉生成）[01:05] 🧠 Offline Reinforc...

【周末特辑】12月第3周最火AI论文 | Qwen2.5提升LLMs性能，阿波罗优化视频理解。

21 Dec 2024

Contributed by Lukas

本期的 5 篇论文如下：[00:40] TOP1(🔥252) | 🤖 Qwen2.5 Technical Report（Qwen2.5技术报告）[02:31] TOP2(🔥127) | 🎥 Apollo: An Ex...

2024.12.20 每日AI论文 | 数据扩增提升LLMs性能，多模态推理框架创新突破

20 Dec 2024

Contributed by Lukas

本期的 14 篇论文如下：[00:22] 🤖 Qwen2.5 Technical Report（Qwen2.5技术报告）[01:00] 🧠 Progressive Multimodal Reasoning via Active ...

2024.12.19 每日AI论文 | AI代理任务表现有限，动画制作效率提升。

19 Dec 2024

Contributed by Lukas

本期的 18 篇论文如下：[00:24] 🤖 TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks（TheAgentCompany：在具有重...

2024.12.18 每日AI论文 | 推理能力待提升，多模态模型需优化。

18 Dec 2024

Contributed by Lukas

本期的 8 篇论文如下：[00:24] 🧠 Are Your LLMs Capable of Stable Reasoning?（你的LLM是否具备稳定推理能力？）[01:06] 📊 Mult...

2024.12.17 每日AI论文 | 提升检索生成效率，优化视觉生成评估。

17 Dec 2024

Contributed by Lukas

本期的 18 篇论文如下：[00:23] 🧠 RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation（RetroLLM：...

2024.12.16 每日AI论文 | 视频理解新突破，AI探索3D环境。

16 Dec 2024

Contributed by Lukas

本期的 14 篇论文如下：[00:23] 🎥 Apollo: An Exploration of Video Understanding in Large Multimodal Models（阿波罗：大型多模态模型...

【周末特辑】12月第2周最火AI论文 | 扩展策略提升模型性能，多模态系统优化长期交互。

14 Dec 2024

Contributed by Lukas

本期的 5 篇论文如下：[00:43] TOP1(🔥95) | 🌐 Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test...

2024.12.13 每日AI论文 | 多模态系统提升长期交互，phi-4优化STEM问答表现。

13 Dec 2024

Contributed by Lukas

本期的 23 篇论文如下：[00:23] 🎥 InternLM-XComposer2.5-OmniLive: A Comprehensive Multimodal System for Long-term Streaming Video and Audio ...

2024.12.12 每日AI论文 | 多视角视频生成突破，复杂场景模型提升

12 Dec 2024

Contributed by Lukas

本期的 14 篇论文如下：[00:23] 🎥 SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints（SynCamMaster：同步多...

2024.12.11 每日AI论文 | 代码模型评估改进，视频生成技术突破

11 Dec 2024

Contributed by Lukas

本期的 23 篇论文如下：[00:25] 🧑 Evaluating and Aligning CodeLLMs on Human Preference（评估与对齐代码大语言模型的人类偏好...

2024.12.10 每日AI论文 | 识别数学推理错误，评估强化学习记忆。

10 Dec 2024

Contributed by Lukas

本期的 9 篇论文如下：[00:23] 🧮 ProcessBench: Identifying Process Errors in Mathematical Reasoning（ProcessBench：识别数学推理中的...

2024.12.09 每日AI论文 | 提升多模态模型性能，优化文本到视频生成质量。

09 Dec 2024

Contributed by Lukas

本期的 11 篇论文如下：[00:27] 🌐 Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling（...

【周末特辑】12月第1周最火AI论文 | SNOOPI提升文生图模型效率，PaliGemma 2优化视觉语言模型迁移性能

07 Dec 2024

Contributed by Lukas

本期的 5 篇论文如下：[00:40] TOP1(🔥102) | 🚀 SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance（SNOOPI：超强...

2024.12.06 每日AI论文 | 视觉压缩提升效率，代码监控增强机器人可靠性。

06 Dec 2024

Contributed by Lukas

本期的 23 篇论文如下：[00:23] 🔍 VisionZip: Longer is Better but Not Necessary in Vision Language Models（视觉压缩：视觉语言模型...

2024.12.05 每日AI论文 | 提升文本到图像扩散模型，生成沉浸式360度视频。

05 Dec 2024

Contributed by Lukas

本期的 15 篇论文如下：[00:24] 🚀 SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance（SNOOPI：超强一步扩散蒸...

2024.12.04 每日AI论文 | 多镜头视频生成框架提升叙事连贯性，关键令牌识别增强LLM推理能力。

04 Dec 2024

Contributed by Lukas

本期的 15 篇论文如下：[00:24] 🎥 VideoGen-of-Thought: A Collaborative Framework for Multi-Shot Video Generation（视频思维生成：多镜...

2024.12.03 每日AI论文 | X-Prompt提升图像生成，GATE OpenING评估图文生成。

03 Dec 2024

Contributed by Lukas

本期的 24 篇论文如下：[00:23] 🖼 X-Prompt: Towards Universal In-Context Image Generation in Auto-Regressive Vision Language Foundation Mode...

【月末特辑】11月最火AI论文 | OpenCoder性能媲美专有模型，SDXL Turbo增强图像模型可解释性。

03 Dec 2024

Contributed by Lukas

本期的 10 篇论文如下：[00:41] TOP1(🔥109) | 🔓 OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models（开放编码器：顶...

Activity Overview

Episodes

2025.03.25 | 稀疏自编码器解读LLM中的推理特征，交互视频革新

2025.03.24 | 多智能体协作提升性能，苏格拉底式对话优化提示。

【周末特辑】3月第3周最火AI论文 | 序列建模创新，视频渲染突破

2025.03.21 | 蒸馏提升超分辨率效率，优化推理减少计算负担。

2025.03.20 | 自适应前瞻采样优化推理；强化学习提升3D网格质量

2025.03.19 | 动态序列建模优势，视频生成理解挑战

2025.03.18 | 视频生成新方法，人形机器人新框架

2025.03.17 | 新相机轨迹生成，稀疏性提升图像质量

【周末特辑】3月第2周最火AI论文 | 稀疏自编码器提升文本检测，自动化ICD编码提高医疗效率。

2025.03.14 | CoSTA*优化多轮编辑效率，无声品牌攻击揭示扩散模型脆弱性。

2025.03.13 | 降低视频扩散模型计算需求，提升多视角视频生成质量。

2025.03.12 | 东南亚数据集创新构建，大模态模型推理能力显著提升

2025.03.11 | 稀疏自编码器提升文本检测，SEAP优化语言模型效率

2025.03.10 | 多模态任务新框架，俄语ICD编码提升。

【周末特辑】3月第1周最火AI论文 | 多模态模型音频安全评估，集成工具提升推理效率。

2025.03.07 | 提升推理效率，AI助手优化生活。

2025.03.06 | 开源多语言模型Babel表现优异，多模态嵌入模型ABC提升控制能力。

2025.03.05 | MPO提升LLM规划效率，Mask-DPO增强事实性对齐。

2025.03.04 | 强化视觉推理，提升3D重建质量。

2025.03.03 | 工程设计效率提升，推理任务成本降低。

【月末特辑】2月最火AI论文 | 以数据为中心的小型语言模型训练；人类动画新框架。

【周末特辑】2月第4周最火AI论文 | 标点符号影响LLM记忆，SurveyX提升问卷质量。

2025.02.28 | 自我校正提升数学推理，强化学习优化医疗推理。

2025.02.27 | Kanana提升韩英双语效率，GHOST 2.0实现高保真头部转移。

2025.02.26 | OmniAlign-V提升多模态模型对齐，SpargeAttn加速注意力计算

2025.02.25 | 长上下文优化创新，视觉扩散高效通用。

2025.02.24 | 高效学术调查生成，标点符号关键作用

【周末特辑】2月第3周最火AI论文 | MLGym推动AI代理评估，Qwen2.5-VL提升多模态表现。

2025.02.21 | AI代理评估新框架，LLM学科表现差异显著。

2025.02.20 | 提升视觉感知，强化自动驾驶安全。

2025.02.19 | 数据高效语音处理，嵌入空间压缩创新。

2025.02.18 | 稀疏注意力提升效率，机器人起身策略优化。

2025.02.17 | RAS加速扩散变换器，视频生成提升质量

【周末特辑】2月第2周最火AI论文 | 1B LLM如何超越405B LLM；金融领域长上下文QA基准测试

2025.02.14 | GPU扩展至300万tokens，文本编码器内存高效策略。

2025.02.13 | 多语言评估工具填补空白，密集文本图像数据集挑战生成模型。

2025.02.12 | 强化学习提升编程竞赛，代码输入输出优化推理模型。

2025.02.11 | LLMs生成多语言去毒数据，强化学习提升数学推理效率。

2025.02.10 | 视频处理性能提升，视频生成速度显著加快。

【周末特辑】2月第1周最火AI论文 | OmniHuman提升动画模型性能，SmolLM2优化小型语言模型训练。

2025.02.07 | 特征流提升模型可解释性，超IF增强指令跟随能力。

2025.02.06 | 数据优化提升模型性能，模拟市场再现复杂行为。

2025.02.05 | 逆桥匹配蒸馏提速，视频JAM提升运动连贯。

2025.02.04 | DAAs性能提升，OmniHuman动画优化。

2025.02.03 | 测试时缩放提升推理，奖励引导解码减少计算。

【月末特辑】1月最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力；长文本处理突破

【周末特辑】1月第4周最火AI论文 | 强化学习优于监督微调，HLE挑战LLMs能力。

2025.01.31 | GuardReasoner提升LLM安全，MedXpertQA挑战医疗AI推理。

2025.01.30 | 批评提升推理，AI能耗引关注

2025.01.29 | RL泛化优，SFT稳定输出；FP4量化降成本，精度保持。

2025.01.28 | Baichuan多模态模型表现优异，长上下文处理成本降低。

2025.01.27 | 测试复杂性提升，冗余问题待解决

【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力，进化搜索优化复杂任务解决。

2025.01.24 | SRMT提升多智能体协作能力，VideoReward优化视频生成质量。

2025.01.23 | DeepSeek-R1强化学习提升推理能力，多智能体框架实现虚拟电影自动化

2025.01.22 | Agent-R提升语言模型实时纠错能力，MMVU评估多学科视频理解专家级表现。

2025.01.21 | GameFactory实现多样化游戏生成，VideoWorld通过视频学习复杂知识。

2025.01.20 | 思维进化提升LLM推理能力，PaSa优化学术搜索效率。

【周末特辑】1月第2周最火AI论文 | MiniMax-01扩展长上下文处理，数学推理PRM提升过程监督。

2025.01.17 | OmniThink提升机器写作深度与新颖性，扩散模型推理扩展提升生成质量。

2025.01.16 | MMDocIR推动多模态检索标准化，CityDreamer4D创新4D城市生成模型。

2025.01.15 | MiniMax-01扩展基础模型处理长上下文，填充符在T2I模型中影响图像生成。

2025.01.14 | 数学推理提升，内存开销减少

2025.01.13 | OmniManip实现通用机器人操作，VideoRAG提升视频检索生成性能。

【周末特辑】1月第1周最火AI论文 | 小型模型超越大型模型，REINFORCE++简化对齐方法

2025.01.10 每日AI论文 | GAN训练简化性能提升，视频自回归预训练竞争力显著。

2025.01.09 每日AI论文 | 小型模型自我进化超越GPT-3，多模态模型提升数学推理能力。

2025.01.08 每日AI论文 | REINFORCE++提升大模型对齐效率，MotionBench优化视频运动理解

2025.01.07 每日AI论文 | STAR提升视频超分辨率时空一致性，BoostStep增强大模型数学推理能力。

2025.01.06 每日AI论文 | EnerVerse提升机器人操作规划能力，VITA-1.5优化实时视觉语音交互。

【月末特辑】12月最火AI论文 | Qwen2.5提升大语言模型性能，阿波罗优化视频理解效率。

【周末特辑】12月第5周最火AI论文 | 提升医学推理能力，自动化GUI轨迹构建。

2025.01.03 每日AI论文 | 多模态教科书提升视觉语言模型性能，VideoAnydoor实现高保真视频对象插入

2025.01.02 每日AI论文 | 自动化GUI代理轨迹构建，优化推理任务语言模型。

2024.12.31 每日AI论文 | 解释性指令提升视觉任务泛化，多模态模型优化医学影像泛化。

2024.12.30 每日AI论文 | 华佗GPT-o1提升医学推理，Orient Anything精准估计物体方向。

【周末特辑】12月第4周最火AI论文 | 鲁棒微调提升大模型抗噪能力，并行生成加速视觉模型效率。