HuggingFace 每日AI论文速递
Episodes
【月末特辑】5月最火AI论文 | 小型语言模型在翻译中表现优异;多模态推理模型发展历程综述。
03 Jun 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:40] TOP1(🔥209) | 🌐 Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model(...
2025.06.02 | 延长RL提升推理;快慢思考优化推理。
02 Jun 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🧠 ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models(ProRL:延...
【周末特辑】6月第1周最火AI论文 | 小型模型在翻译中表现优异;数据中心压缩提升AI效率。
01 Jun 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:43] TOP1(🔥205) | 🌐 Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model(...
2025.05.30 | 推理扩展提升表格推理;多模态模型视频反馈有待优化。
30 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 📊 Table-R1: Inference-Time Scaling for Table Reasoning(Table-R1:表格推理的推理时扩展)[01:02]...
2025.05.29 | 熵机制提升模型性能;令牌路由优化推理效率。
29 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🤖 The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models(用于推理语言模型的...
2025.05.28 | 多模态Agent科研任务成功率低;逻辑推理模型存在显著局限。
28 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🧪 ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows(ScienceBoard:评...
2025.05.27 | AI效率提升需数据压缩;小型模型翻译更高效。
27 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🗜 Shifting AI Efficiency From Model-Centric to Data-Centric Compression(AI效率转移:从以模型为中...
2025.05.26 | TabSTAR提升表格数据分类性能;QwenLong-L1优化长文本推理
26 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 📊 TabSTAR: A Foundation Tabular Model With Semantically Target-Aware Representations(TabSTAR:具有语义...
【周末特辑】5月第4周最火AI论文 | Qwen3提升LLMs性能;BAGEL增强多模态推理。
24 May 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:42] TOP1(🔥146) | 🤖 Qwen3 Technical Report(Qwen3技术报告)[03:08] TOP2(🔥114) | 💡 Emerging Properti...
2025.05.23 | 智能体加速科研;推理模型指令遵循不佳。
23 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🧪 NovelSeek: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification...
2025.05.22 | Web导航效率提升;量化误差优化。
22 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:25] 🤖 Web-Shepherd: Advancing PRMs for Reinforcing Web Agents(Web-Shepherd:用于增强Web代理的PRM的进...
2025.05.21 | 多模态预训练提升复杂任务能力;注意力机制优化推理与训练效率。
21 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 💡 Emerging Properties in Unified Multimodal Pretraining(统一多模态预训练中的涌现属性)[01:0...
2025.05.20 | 模型链学习提升效率;AdaptThink优化推理速度。
20 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🔗 Chain-of-Model Learning for Language Model(模型链学习:一种用于语言模型的新型学习范式...
2025.05.19 | Qwen3提升LLMs性能;GuardReasoner-VL强化VLM安全。
19 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🤖 Qwen3 Technical Report(Qwen3技术报告)[01:14] 🛡 GuardReasoner-VL: Safeguarding VLMs via Reinforc...
【周末特辑】5月第3周最火AI论文 | Seed1.5-VL多模态推理领先;MiniMax-Speech零样本语音克隆
17 May 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:38] TOP1(🔥126) | 💡 Seed1.5-VL Technical Report(Seed1.5-VL 技术报告)[03:11] TOP2(🔥109) | 🗣 MiniMa...
2025.05.16 | 推理模型元能力提升;系统提示优化与鲁棒性增强
16 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 💡 Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models(超越“Aha!”时刻...
2025.05.15 | 解耦学习提升感知性能;多模态模型优化图像生成。
15 May 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:23] 🖼 DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception(DeCLIP:用于开放词汇密集感知的...
2025.05.14 | 零样本语音合成新模型;多维度评估LLM指令能力
14 May 2025
Contributed by Lukas
本期的 8 篇论文如下:[00:25] 🗣 MiniMax-Speech: Intrinsic Zero-Shot Text-to-Speech with a Learnable Speaker Encoder(MiniMax-Speech:具有...
2025.05.13 | 视觉-语言模型提升多模态能力;优化训练策略增强推理潜力。
13 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 💡 Seed1.5-VL Technical Report(Seed1.5-VL 技术报告)[01:04] 🧠 MiMo: Unlocking the Reasoning Potenti...
2025.05.12 | 波兰语模型优化;高效参数利用
12 May 2025
Contributed by Lukas
本期的 7 篇论文如下:[00:23] 🇵 Bielik v3 Small: Technical Report(Bielik v3 Small:技术报告)[01:07] 🇵 Bielik 11B v2 Technical R...
【周末特辑】5月第2周最火AI论文 | 零数据自博弈推理;多模态长推理模型综述
10 May 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:42] TOP1(🔥93) | 🚀 Absolute Zero: Reinforced Self-play Reasoning with Zero Data(绝对零度:基于零数据...
2025.05.09 | 多模态推理模型发展综述;通用智能评估框架提出
09 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🧠 Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models(感知、推理、思...
2025.05.08 | 多模态模型整合潜力大;零搜索提升LLMs效率。
08 May 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:21] 💡 Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities(统一多...
2025.05.07 | 多模态思维链提升模型性能;零数据自博弈强化推理能力。
07 May 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:24] 🧠 Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning(基于强化微调的...
2025.05.06 | Voila实现低延迟全双工对话;RM-R1提升大模型推理奖励。
06 May 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🤖 Voila: Voice-Language Foundation Models for Real-Time Autonomous Interaction and Voice Role-Play(Voila:...
2025.05.05 | PixelHacker提升图像修复质量;分层记忆增强图像编辑可控性。
05 May 2025
Contributed by Lukas
本期的 8 篇论文如下:[00:21] 🖼 PixelHacker: Image Inpainting with Structural and Semantic Consistency(PixelHacker:基于结构和语义...
【周末特辑】5月第1周最火AI论文 | 相机运动理解显著提升;单样本强化学习提升推理能力。
03 May 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:43] TOP1(🔥149) | 🎥 Towards Understanding Camera Motions in Any Video(迈向理解任意视频中的相机运...
2025.05.02 | 交互式视频生成技术探讨;DeepCritic提升大模型评判能力。
02 May 2025
Contributed by Lukas
本期的 8 篇论文如下:[00:28] 🎮 A Survey of Interactive Generative Video(交互式生成视频综述)[01:05] 🧐 DeepCritic: Deliberat...
2025.05.01 | 阿拉伯语变音难题新解;深度推理模型能力增强
01 May 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:21] 🗣 Sadeed: Advancing Arabic Diacritization Through Small Language Model(Sadeed:通过小型语言模型推...
2025.04.30 | 多模态检索增强生成;单样本强化学习提升推理。
30 Apr 2025
Contributed by Lukas
本期的 12 篇论文如下:[00:24] 🔍 UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with Diverse Modalities and Granulariti...
2025.04.29 | RepText提升多语言文本渲染;LLM改进手机GUI自动化。
29 Apr 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:23] ✍ RepText: Rendering Visual Text via Replicating(RepText:通过复制渲染视觉文本)[01:02] 📱 LL...
2025.04.28 | 视频相机运动理解提升;多模态推理模型优化
28 Apr 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:22] 🎥 Towards Understanding Camera Motions in Any Video(迈向理解任意视频中的相机运动)[01:04] 🧠...
【周末特辑】4月第4周最火AI论文 | 阿拉伯语模型扩展成功;强化学习提升有限。
26 Apr 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:33] TOP1(🔥108) | 💡 Kuwain 1.5B: An Arabic SLM via Language Injection(Kuwain 1.5B:一种基于语言注入的...
2025.04.25 | 开源模型超越闭源;新型评估指标提升生成质量。
25 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🖼 Step1X-Edit: A Practical Framework for General Image Editing(Step1X-Edit:一个通用的图像编辑实...
2025.04.24 | 视觉推理评估新基准;高保真人脸替换技术
24 Apr 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:23] 👁 VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models(VisuLogic:...
2025.04.23 | 阿拉伯语性能提升;推理任务性能显著提高。
23 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 💡 Kuwain 1.5B: An Arabic SLM via Language Injection(Kuwain 1.5B:一种基于语言注入的阿拉伯语S...
2025.04.22 | LUFFY提升推理性能;FlowReasoner增强系统适应性。
22 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:25] 🧠 Learning to Reason under Off-Policy Guidance(离线策略指导下的推理学习)[01:00] 🤖 FlowRea...
2025.04.21 | 强化学习未提升新推理能力;MIG优化指令微调数据选择。
21 Apr 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:22] 🤔 Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?(强化学...
【周末特辑】4月第3周最火AI论文 | 多模态模型InternVL3创新预训练;Seaweed-7B高效视频生成。
19 Apr 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:52] TOP1(🔥223) | 🖼 InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Mod...
2025.04.18 | CLIMB提升领域模型表现;反蒸馏采样防止模型被盗用。
18 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🗂 CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training(CLIMB:基...
2025.04.17 | ColorBench测试VLM颜色理解;BitNet提升计算效率。
17 Apr 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:27] 🎨 ColorBench: Can VLMs See and Understand the Colorful World? A Comprehensive Benchmark for Color Perception...
2025.04.16 | Genius提升LLM推理能力;xVerify高效验证推理模型。
16 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🧠 Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning(Genius:...
2025.04.15 | 多模态模型性能提升;低资源推理加速优化
15 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🖼 InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models(InternVL3...
2025.04.14 | 经济高效视频生成;自回归图像生成扩展。
14 Apr 2025
Contributed by Lukas
本期的 13 篇论文如下:[00:24] 🎬 Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model(Seaweed-7B:一种经济高效...
【周末特辑】4月第2周最火AI论文 | SmolVLM优化多模态模型性能;OmniSVG提升SVG生成质量。
12 Apr 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:44] TOP1(🔥149) | 💡 SmolVLM: Redefining small and efficient multimodal models(SmolVLM:重新定义小型高...
2025.04.11 | Kimi-VL模型表现优异;VCR-Bench评估推理瓶颈。
11 Apr 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:22] 🧠 Kimi-VL Technical Report(Kimi-VL技术报告)[01:05] 🎬 VCR-Bench: A Comprehensive Evaluation Framew...
2025.04.10 | DDT提升图像生成质量;GenDoP优化相机轨迹生成。
10 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:25] 🎨 DDT: Decoupled Diffusion Transformer(解耦扩散Transformer)[01:05] 🎬 GenDoP: Auto-regressive Came...
2025.04.09 | OmniSVG生成高质量SVG图形;Skywork R1V多模态推理出色。
09 Apr 2025
Contributed by Lukas
本期的 13 篇论文如下:[00:22] 🎨 OmniSVG: A Unified Scalable Vector Graphics Generation Model(OmniSVG:一个统一的可扩展矢量图...
2025.04.08 | 分钟级AI视频生成;小型模型超越大型模型
08 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:21] 🎬 One-Minute Video Generation with Test-Time Training(基于测试时训练的分钟级视频生成)[01:...
2025.04.07 | 多语言基准测试揭示LLMs跨语言泛化局限,具身智能新方法提升规划效率与适应性。
07 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🛠 Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving(Multi-SWE-bench:一个用于问题解决...
【月末特辑】3月最火AI论文 | 稀疏自编码器提升文本检测,动态Tanh优化Transformer
06 Apr 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:42] TOP1(🔥226) | 🤖 Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders(基于稀...
【周末特辑】4月第1周最火AI论文 | 智能体设计挑战,视觉文本生成创新。
05 Apr 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:40] TOP1(🔥101) | 🧠 Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolution...
2025.04.04 | 智能体自主提升,视觉编辑推理重要。
04 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:19] 🧠 Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborat...
2025.04.03 | MergeVQ高效生成高质量图像,类R1-Zero提升视觉空间推理。
03 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🎨 MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and ...
2025.04.02 | 视频生成精度提升,强化学习增强视频理解。
02 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:21] 🎬 Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation(Any2Caption:将任...
2025.04.01 | 多文本渲染新方法,电影级对话角色合成
01 Apr 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🖼 TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes(TextCrafter:复杂视觉场景...
2025.03.31 | 减少token使用,提升领域效率。
31 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 💡 AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation(Adapt...
【周末特辑】3月第4周最火AI论文 | 稀疏自编码器解读LLM推理特征,多模态模型创新。
29 Mar 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:37] TOP1(🔥109) | 🧠 I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models...
2025.03.28 | 视频推理提升,GUI动作预测优化
28 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🧠 Video-R1: Reinforcing Video Reasoning in MLLMs(Video-R1:增强多模态大语言模型中的视频推理...
2025.03.27 | Dita跨模态策略优异,Qwen2.5-Omni多模态实时响应。
27 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:26] 🤖 Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy(Dita:扩展扩散Tran...
2025.03.26 | 视频预测性能提升,多模态预训练效果显著。
26 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🎬 Long-Context Autoregressive Video Modeling with Next-Frame Prediction(基于下一帧预测的长程上下...
2025.03.25 | 稀疏自编码器解读LLM中的推理特征,交互视频革新
25 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🧠 I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Aut...
2025.03.24 | 多智能体协作提升性能,苏格拉底式对话优化提示。
24 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:22] 🧠 MAPS: A Multi-Agent Framework Based on Big Seven Personality and Socratic Guidance for Multimodal Scientif...
【周末特辑】3月第3周最火AI论文 | 序列建模创新,视频渲染突破
22 Mar 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:37] TOP1(🔥118) | 🦢 RWKV-7 "Goose" with Expressive Dynamic State Evolution(RWKV-7 "Goose":具有表达性动...
2025.03.21 | 蒸馏提升超分辨率效率,优化推理减少计算负担。
21 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🖼 One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation(基于蒸馏的单步残...
2025.03.20 | 自适应前瞻采样优化推理;强化学习提升3D网格质量
20 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🔍 $φ$-Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation($\ph...
2025.03.19 | 动态序列建模优势,视频生成理解挑战
19 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:21] 🦢 RWKV-7 "Goose" with Expressive Dynamic State Evolution(RWKV-7 "Goose":具有表达性动态状态演化...
2025.03.18 | 视频生成新方法,人形机器人新框架
18 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:21] 🎥 DropletVideo: A Dataset and Approach to Explore Integral Spatio-Temporal Consistent Video Generation(Dro...
2025.03.17 | 新相机轨迹生成,稀疏性提升图像质量
17 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:25] 🎥 ReCamMaster: Camera-Controlled Generative Rendering from A Single Video(ReCamMaster:基于单视频的...
【周末特辑】3月第2周最火AI论文 | 稀疏自编码器提升文本检测,自动化ICD编码提高医疗效率。
15 Mar 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:44] TOP1(🔥208) | 🤖 Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders(基于稀疏...
2025.03.14 | CoSTA*优化多轮编辑效率,无声品牌攻击揭示扩散模型脆弱性。
14 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:25] 🖼 CoSTA$\ast$: Cost-Sensitive Toolpath Agent for Multi-turn Image Editing(CoSTA*:面向多轮图像编辑...
2025.03.13 | 降低视频扩散模型计算需求,提升多视角视频生成质量。
13 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:20] 🎥 TPDiff: Temporal Pyramid Video Diffusion Model(TPDiff:时间金字塔视频扩散模型)[00:58] 🎥...
2025.03.12 | 东南亚数据集创新构建,大模态模型推理能力显著提升
12 Mar 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] 🌏 Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast As...
2025.03.11 | 稀疏自编码器提升文本检测,SEAP优化语言模型效率
11 Mar 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:25] 🤖 Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders(基于稀疏自编码器的...
2025.03.10 | 多模态任务新框架,俄语ICD编码提升。
10 Mar 2025
Contributed by Lukas
本期的 20 篇论文如下:[00:19] 🌐 Unified Reward Model for Multimodal Understanding and Generation(多模态理解和生成的统一奖励...
【周末特辑】3月第1周最火AI论文 | 多模态模型音频安全评估,集成工具提升推理效率。
08 Mar 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:35] TOP1(🔥64) | 🧠 Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-...
2025.03.07 | 提升推理效率,AI助手优化生活。
07 Mar 2025
Contributed by Lukas
本期的 18 篇论文如下:[00:21] 🛠 START: Self-taught Reasoner with Tools(自教工具集成推理器)[01:03] 👓 EgoLife: Towards Egoce...
2025.03.06 | 开源多语言模型Babel表现优异,多模态嵌入模型ABC提升控制能力。
06 Mar 2025
Contributed by Lukas
本期的 17 篇论文如下:[00:24] 🌍 Babel: Open Multilingual Large Language Models Serving Over 90% of Global Speakers(巴别塔:服务于...
2025.03.05 | MPO提升LLM规划效率,Mask-DPO增强事实性对齐。
05 Mar 2025
Contributed by Lukas
本期的 18 篇论文如下:[00:21] 🚀 MPO: Boosting LLM Agents with Meta Plan Optimization(MPO:通过元计划优化提升LLM代理)[00:59...
2025.03.04 | 强化视觉推理,提升3D重建质量。
04 Mar 2025
Contributed by Lukas
本期的 20 篇论文如下:[00:21] 🧠 Visual-RFT: Visual Reinforcement Fine-Tuning(视觉强化微调:视觉强化微调)[01:05] 🌐 Difi...
2025.03.03 | 工程设计效率提升,推理任务成本降低。
03 Mar 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:20] 🌲 DeepSolution: Boosting Complex Engineering Solution Design via Tree-based Exploration and Bi-point Thinkin...
【月末特辑】2月最火AI论文 | 以数据为中心的小型语言模型训练;人类动画新框架。
02 Mar 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:39] TOP1(🔥196) | 🤖 SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model(SmolLM2:...
【周末特辑】2月第4周最火AI论文 | 标点符号影响LLM记忆,SurveyX提升问卷质量。
01 Mar 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:50] TOP1(🔥152) | 🔍 LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers...
2025.02.28 | 自我校正提升数学推理,强化学习优化医疗推理。
28 Feb 2025
Contributed by Lukas
本期的 19 篇论文如下:[00:23] 🧠 Self-rewarding correction for mathematical reasoning(自我奖励的数学推理校正)[01:03] 🧠 Me...
2025.02.27 | Kanana提升韩英双语效率,GHOST 2.0实现高保真头部转移。
27 Feb 2025
Contributed by Lukas
本期的 18 篇论文如下:[00:23] 🌐 Kanana: Compute-efficient Bilingual Language Models(Kanana:计算高效的双语语言模型)[00:54]...
2025.02.26 | OmniAlign-V提升多模态模型对齐,SpargeAttn加速注意力计算
26 Feb 2025
Contributed by Lukas
本期的 14 篇论文如下:[00:23] 🤖 OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference(OmniAlign-V:迈向多模态大语...
2025.02.25 | 长上下文优化创新,视觉扩散高效通用。
25 Feb 2025
Contributed by Lukas
本期的 20 篇论文如下:[00:27] 📖 Thus Spake Long-Context Large Language Model(长上下文大语言模型如是说)[01:09] 🌈 DICEPTI...
2025.02.24 | 高效学术调查生成,标点符号关键作用
24 Feb 2025
Contributed by Lukas
本期的 20 篇论文如下:[00:23] 📚 SurveyX: Academic Survey Automation via Large Language Models(基于大型语言模型的学术调查自...
【周末特辑】2月第3周最火AI论文 | MLGym推动AI代理评估,Qwen2.5-VL提升多模态表现。
22 Feb 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:42] TOP1(🔥138) | 🧠 MLGym: A New Framework and Benchmark for Advancing AI Research Agents(MLGym:推进AI研...
2025.02.21 | AI代理评估新框架,LLM学科表现差异显著。
21 Feb 2025
Contributed by Lukas
本期的 20 篇论文如下:[00:26] 🧠 MLGym: A New Framework and Benchmark for Advancing AI Research Agents(MLGym:推进AI研究代理的新...
2025.02.20 | 提升视觉感知,强化自动驾驶安全。
20 Feb 2025
Contributed by Lukas
本期的 20 篇论文如下:[00:24] 🌐 Qwen2.5-VL Technical Report(Qwen2.5-VL 技术报告)[01:10] 🚗 RAD: Training an End-to-End Driving P...
2025.02.19 | 数据高效语音处理,嵌入空间压缩创新。
19 Feb 2025
Contributed by Lukas
本期的 20 篇论文如下:[00:25] 🎙 Soundwave: Less is More for Speech-Text Alignment in LLMs(声波:减少数据需求,优化语音与文...
2025.02.18 | 稀疏注意力提升效率,机器人起身策略优化。
18 Feb 2025
Contributed by Lukas
本期的 29 篇论文如下:[00:23] ⚡ Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention(原生稀疏注意力:...
2025.02.17 | RAS加速扩散变换器,视频生成提升质量
17 Feb 2025
Contributed by Lukas
本期的 21 篇论文如下:[00:22] 🌐 Region-Adaptive Sampling for Diffusion Transformers(区域自适应采样扩散变换器)[01:05] 🎥 ...
【周末特辑】2月第2周最火AI论文 | 1B LLM如何超越405B LLM;金融领域长上下文QA基准测试
15 Feb 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:54] TOP1(🔥121) | 🤔 Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling(10亿参数LLM能...
2025.02.14 | GPU扩展至300万tokens,文本编码器内存高效策略。
14 Feb 2025
Contributed by Lukas
本期的 18 篇论文如下:[00:21] 🚀 InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU(InfiniteHiP:在单...
2025.02.13 | 多语言评估工具填补空白,密集文本图像数据集挑战生成模型。
13 Feb 2025
Contributed by Lukas
本期的 20 篇论文如下:[00:23] 🌍 BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models(BenchMAX:大型语言...
2025.02.12 | 强化学习提升编程竞赛,代码输入输出优化推理模型。
12 Feb 2025
Contributed by Lukas
本期的 21 篇论文如下:[00:25] 🧠 Competitive Programming with Large Reasoning Models(使用大型推理模型进行编程竞赛)[01:03]...
2025.02.11 | LLMs生成多语言去毒数据,强化学习提升数学推理效率。
11 Feb 2025
Contributed by Lukas
本期的 21 篇论文如下:[00:25] 🤖 SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators(SynthDetoxM:现代大语...
2025.02.10 | 视频处理性能提升,视频生成速度显著加快。
10 Feb 2025
Contributed by Lukas
本期的 21 篇论文如下:[00:22] 🎥 VideoRoPE: What Makes for Good Video Rotary Position Embedding?(视频旋转位置嵌入:什么使得视...