Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Blog Pricing
Podcast Image

HuggingFace 每日AI论文速递

Technology Science

Episodes

Showing 301-400 of 591
«« ← Prev Page 4 of 6 Next → »»

【月末特辑】5月最火AI论文 | 小型语言模型在翻译中表现优异;多模态推理模型发展历程综述。

03 Jun 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:40] TOP1(🔥209) | 🌐 Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model(...

2025.06.02 | 延长RL提升推理;快慢思考优化推理。

02 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🧠 ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models(ProRL:延...

【周末特辑】6月第1周最火AI论文 | 小型模型在翻译中表现优异;数据中心压缩提升AI效率。

01 Jun 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:43] TOP1(🔥205) | 🌐 Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model(...

2025.05.30 | 推理扩展提升表格推理;多模态模型视频反馈有待优化。

30 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 📊 Table-R1: Inference-Time Scaling for Table Reasoning(Table-R1:表格推理的推理时扩展)[01:02]...

2025.05.29 | 熵机制提升模型性能;令牌路由优化推理效率。

29 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🤖 The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models(用于推理语言模型的...

2025.05.28 | 多模态Agent科研任务成功率低;逻辑推理模型存在显著局限。

28 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🧪 ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows(ScienceBoard:评...

2025.05.27 | AI效率提升需数据压缩;小型模型翻译更高效。

27 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🗜 Shifting AI Efficiency From Model-Centric to Data-Centric Compression(AI效率转移:从以模型为中...

2025.05.26 | TabSTAR提升表格数据分类性能;QwenLong-L1优化长文本推理

26 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 📊 TabSTAR: A Foundation Tabular Model With Semantically Target-Aware Representations(TabSTAR:具有语义...

【周末特辑】5月第4周最火AI论文 | Qwen3提升LLMs性能;BAGEL增强多模态推理。

24 May 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:42] TOP1(🔥146) | 🤖 Qwen3 Technical Report(Qwen3技术报告)[03:08] TOP2(🔥114) | 💡 Emerging Properti...

2025.05.23 | 智能体加速科研;推理模型指令遵循不佳。

23 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🧪 NovelSeek: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification...

2025.05.22 | Web导航效率提升;量化误差优化。

22 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🤖 Web-Shepherd: Advancing PRMs for Reinforcing Web Agents(Web-Shepherd:用于增强Web代理的PRM的进...

2025.05.21 | 多模态预训练提升复杂任务能力;注意力机制优化推理与训练效率。

21 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 💡 Emerging Properties in Unified Multimodal Pretraining(统一多模态预训练中的涌现属性)[01:0...

2025.05.20 | 模型链学习提升效率;AdaptThink优化推理速度。

20 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🔗 Chain-of-Model Learning for Language Model(模型链学习:一种用于语言模型的新型学习范式...

2025.05.19 | Qwen3提升LLMs性能;GuardReasoner-VL强化VLM安全。

19 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🤖 Qwen3 Technical Report(Qwen3技术报告)[01:14] 🛡 GuardReasoner-VL: Safeguarding VLMs via Reinforc...

【周末特辑】5月第3周最火AI论文 | Seed1.5-VL多模态推理领先;MiniMax-Speech零样本语音克隆

17 May 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:38] TOP1(🔥126) | 💡 Seed1.5-VL Technical Report(Seed1.5-VL 技术报告)[03:11] TOP2(🔥109) | 🗣 MiniMa...

2025.05.16 | 推理模型元能力提升;系统提示优化与鲁棒性增强

16 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 💡 Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models(超越“Aha!”时刻...

2025.05.15 | 解耦学习提升感知性能;多模态模型优化图像生成。

15 May 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:23] 🖼 DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception(DeCLIP:用于开放词汇密集感知的...

2025.05.14 | 零样本语音合成新模型;多维度评估LLM指令能力

14 May 2025

Contributed by Lukas

本期的 8 篇论文如下:[00:25] 🗣 MiniMax-Speech: Intrinsic Zero-Shot Text-to-Speech with a Learnable Speaker Encoder(MiniMax-Speech:具有...

2025.05.13 | 视觉-语言模型提升多模态能力;优化训练策略增强推理潜力。

13 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 💡 Seed1.5-VL Technical Report(Seed1.5-VL 技术报告)[01:04] 🧠 MiMo: Unlocking the Reasoning Potenti...

2025.05.12 | 波兰语模型优化;高效参数利用

12 May 2025

Contributed by Lukas

本期的 7 篇论文如下:[00:23] 🇵 Bielik v3 Small: Technical Report(Bielik v3 Small:技术报告)[01:07] 🇵 Bielik 11B v2 Technical R...

【周末特辑】5月第2周最火AI论文 | 零数据自博弈推理;多模态长推理模型综述

10 May 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:42] TOP1(🔥93) | 🚀 Absolute Zero: Reinforced Self-play Reasoning with Zero Data(绝对零度:基于零数据...

2025.05.09 | 多模态推理模型发展综述;通用智能评估框架提出

09 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🧠 Perception, Reason, Think, and Plan: A Survey on Large Multimodal Reasoning Models(感知、推理、思...

2025.05.08 | 多模态模型整合潜力大;零搜索提升LLMs效率。

08 May 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:21] 💡 Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities(统一多...

2025.05.07 | 多模态思维链提升模型性能;零数据自博弈强化推理能力。

07 May 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:24] 🧠 Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning(基于强化微调的...

2025.05.06 | Voila实现低延迟全双工对话;RM-R1提升大模型推理奖励。

06 May 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🤖 Voila: Voice-Language Foundation Models for Real-Time Autonomous Interaction and Voice Role-Play(Voila:...

2025.05.05 | PixelHacker提升图像修复质量;分层记忆增强图像编辑可控性。

05 May 2025

Contributed by Lukas

本期的 8 篇论文如下:[00:21] 🖼 PixelHacker: Image Inpainting with Structural and Semantic Consistency(PixelHacker:基于结构和语义...

【周末特辑】5月第1周最火AI论文 | 相机运动理解显著提升;单样本强化学习提升推理能力。

03 May 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:43] TOP1(🔥149) | 🎥 Towards Understanding Camera Motions in Any Video(迈向理解任意视频中的相机运...

2025.05.02 | 交互式视频生成技术探讨;DeepCritic提升大模型评判能力。

02 May 2025

Contributed by Lukas

本期的 8 篇论文如下:[00:28] 🎮 A Survey of Interactive Generative Video(交互式生成视频综述)[01:05] 🧐 DeepCritic: Deliberat...

2025.05.01 | 阿拉伯语变音难题新解;深度推理模型能力增强

01 May 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:21] 🗣 Sadeed: Advancing Arabic Diacritization Through Small Language Model(Sadeed:通过小型语言模型推...

2025.04.30 | 多模态检索增强生成;单样本强化学习提升推理。

30 Apr 2025

Contributed by Lukas

本期的 12 篇论文如下:[00:24] 🔍 UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with Diverse Modalities and Granulariti...

2025.04.29 | RepText提升多语言文本渲染;LLM改进手机GUI自动化。

29 Apr 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:23] ✍ RepText: Rendering Visual Text via Replicating(RepText:通过复制渲染视觉文本)[01:02] 📱 LL...

2025.04.28 | 视频相机运动理解提升;多模态推理模型优化

28 Apr 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:22] 🎥 Towards Understanding Camera Motions in Any Video(迈向理解任意视频中的相机运动)[01:04] 🧠...

【周末特辑】4月第4周最火AI论文 | 阿拉伯语模型扩展成功;强化学习提升有限。

26 Apr 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:33] TOP1(🔥108) | 💡 Kuwain 1.5B: An Arabic SLM via Language Injection(Kuwain 1.5B:一种基于语言注入的...

2025.04.25 | 开源模型超越闭源;新型评估指标提升生成质量。

25 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🖼 Step1X-Edit: A Practical Framework for General Image Editing(Step1X-Edit:一个通用的图像编辑实...

2025.04.24 | 视觉推理评估新基准;高保真人脸替换技术

24 Apr 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:23] 👁 VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models(VisuLogic:...

2025.04.23 | 阿拉伯语性能提升;推理任务性能显著提高。

23 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 💡 Kuwain 1.5B: An Arabic SLM via Language Injection(Kuwain 1.5B:一种基于语言注入的阿拉伯语S...

2025.04.22 | LUFFY提升推理性能;FlowReasoner增强系统适应性。

22 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🧠 Learning to Reason under Off-Policy Guidance(离线策略指导下的推理学习)[01:00] 🤖 FlowRea...

2025.04.21 | 强化学习未提升新推理能力;MIG优化指令微调数据选择。

21 Apr 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:22] 🤔 Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?(强化学...

【周末特辑】4月第3周最火AI论文 | 多模态模型InternVL3创新预训练;Seaweed-7B高效视频生成。

19 Apr 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:52] TOP1(🔥223) | 🖼 InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Mod...

2025.04.18 | CLIMB提升领域模型表现;反蒸馏采样防止模型被盗用。

18 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🗂 CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training(CLIMB:基...

2025.04.17 | ColorBench测试VLM颜色理解;BitNet提升计算效率。

17 Apr 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:27] 🎨 ColorBench: Can VLMs See and Understand the Colorful World? A Comprehensive Benchmark for Color Perception...

2025.04.16 | Genius提升LLM推理能力;xVerify高效验证推理模型。

16 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🧠 Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning(Genius:...

2025.04.15 | 多模态模型性能提升;低资源推理加速优化

15 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🖼 InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models(InternVL3...

2025.04.14 | 经济高效视频生成;自回归图像生成扩展。

14 Apr 2025

Contributed by Lukas

本期的 13 篇论文如下:[00:24] 🎬 Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model(Seaweed-7B:一种经济高效...

【周末特辑】4月第2周最火AI论文 | SmolVLM优化多模态模型性能;OmniSVG提升SVG生成质量。

12 Apr 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:44] TOP1(🔥149) | 💡 SmolVLM: Redefining small and efficient multimodal models(SmolVLM:重新定义小型高...

2025.04.11 | Kimi-VL模型表现优异;VCR-Bench评估推理瓶颈。

11 Apr 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:22] 🧠 Kimi-VL Technical Report(Kimi-VL技术报告)[01:05] 🎬 VCR-Bench: A Comprehensive Evaluation Framew...

2025.04.10 | DDT提升图像生成质量;GenDoP优化相机轨迹生成。

10 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🎨 DDT: Decoupled Diffusion Transformer(解耦扩散Transformer)[01:05] 🎬 GenDoP: Auto-regressive Came...

2025.04.09 | OmniSVG生成高质量SVG图形;Skywork R1V多模态推理出色。

09 Apr 2025

Contributed by Lukas

本期的 13 篇论文如下:[00:22] 🎨 OmniSVG: A Unified Scalable Vector Graphics Generation Model(OmniSVG:一个统一的可扩展矢量图...

2025.04.08 | 分钟级AI视频生成;小型模型超越大型模型

08 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🎬 One-Minute Video Generation with Test-Time Training(基于测试时训练的分钟级视频生成)[01:...

2025.04.07 | 多语言基准测试揭示LLMs跨语言泛化局限,具身智能新方法提升规划效率与适应性。

07 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🛠 Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving(Multi-SWE-bench:一个用于问题解决...

【月末特辑】3月最火AI论文 | 稀疏自编码器提升文本检测,动态Tanh优化Transformer

06 Apr 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:42] TOP1(🔥226) | 🤖 Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders(基于稀...

【周末特辑】4月第1周最火AI论文 | 智能体设计挑战,视觉文本生成创新。

05 Apr 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:40] TOP1(🔥101) | 🧠 Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolution...

2025.04.04 | 智能体自主提升,视觉编辑推理重要。

04 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:19] 🧠 Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborat...

2025.04.03 | MergeVQ高效生成高质量图像,类R1-Zero提升视觉空间推理。

03 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🎨 MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and ...

2025.04.02 | 视频生成精度提升,强化学习增强视频理解。

02 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🎬 Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation(Any2Caption:将任...

2025.04.01 | 多文本渲染新方法,电影级对话角色合成

01 Apr 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🖼 TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes(TextCrafter:复杂视觉场景...

2025.03.31 | 减少token使用,提升领域效率。

31 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 💡 AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation(Adapt...

【周末特辑】3月第4周最火AI论文 | 稀疏自编码器解读LLM推理特征,多模态模型创新。

29 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:37] TOP1(🔥109) | 🧠 I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models...

2025.03.28 | 视频推理提升,GUI动作预测优化

28 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🧠 Video-R1: Reinforcing Video Reasoning in MLLMs(Video-R1:增强多模态大语言模型中的视频推理...

2025.03.27 | Dita跨模态策略优异,Qwen2.5-Omni多模态实时响应。

27 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:26] 🤖 Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy(Dita:扩展扩散Tran...

2025.03.26 | 视频预测性能提升,多模态预训练效果显著。

26 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🎬 Long-Context Autoregressive Video Modeling with Next-Frame Prediction(基于下一帧预测的长程上下...

2025.03.25 | 稀疏自编码器解读LLM中的推理特征,交互视频革新

25 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🧠 I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Aut...

2025.03.24 | 多智能体协作提升性能,苏格拉底式对话优化提示。

24 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🧠 MAPS: A Multi-Agent Framework Based on Big Seven Personality and Socratic Guidance for Multimodal Scientif...

【周末特辑】3月第3周最火AI论文 | 序列建模创新,视频渲染突破

22 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:37] TOP1(🔥118) | 🦢 RWKV-7 "Goose" with Expressive Dynamic State Evolution(RWKV-7 "Goose":具有表达性动...

2025.03.21 | 蒸馏提升超分辨率效率,优化推理减少计算负担。

21 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🖼 One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation(基于蒸馏的单步残...

2025.03.20 | 自适应前瞻采样优化推理;强化学习提升3D网格质量

20 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🔍 $φ$-Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation($\ph...

2025.03.19 | 动态序列建模优势,视频生成理解挑战

19 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🦢 RWKV-7 "Goose" with Expressive Dynamic State Evolution(RWKV-7 "Goose":具有表达性动态状态演化...

2025.03.18 | 视频生成新方法,人形机器人新框架

18 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🎥 DropletVideo: A Dataset and Approach to Explore Integral Spatio-Temporal Consistent Video Generation(Dro...

2025.03.17 | 新相机轨迹生成,稀疏性提升图像质量

17 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🎥 ReCamMaster: Camera-Controlled Generative Rendering from A Single Video(ReCamMaster:基于单视频的...

【周末特辑】3月第2周最火AI论文 | 稀疏自编码器提升文本检测,自动化ICD编码提高医疗效率。

15 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:44] TOP1(🔥208) | 🤖 Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders(基于稀疏...

2025.03.14 | CoSTA*优化多轮编辑效率,无声品牌攻击揭示扩散模型脆弱性。

14 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🖼 CoSTA$\ast$: Cost-Sensitive Toolpath Agent for Multi-turn Image Editing(CoSTA*:面向多轮图像编辑...

2025.03.13 | 降低视频扩散模型计算需求,提升多视角视频生成质量。

13 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:20] 🎥 TPDiff: Temporal Pyramid Video Diffusion Model(TPDiff:时间金字塔视频扩散模型)[00:58] 🎥...

2025.03.12 | 东南亚数据集创新构建,大模态模型推理能力显著提升

12 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🌏 Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast As...

2025.03.11 | 稀疏自编码器提升文本检测,SEAP优化语言模型效率

11 Mar 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:25] 🤖 Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders(基于稀疏自编码器的...

2025.03.10 | 多模态任务新框架,俄语ICD编码提升。

10 Mar 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:19] 🌐 Unified Reward Model for Multimodal Understanding and Generation(多模态理解和生成的统一奖励...

【周末特辑】3月第1周最火AI论文 | 多模态模型音频安全评估,集成工具提升推理效率。

08 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:35] TOP1(🔥64) | 🧠 Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-...

2025.03.07 | 提升推理效率,AI助手优化生活。

07 Mar 2025

Contributed by Lukas

本期的 18 篇论文如下:[00:21] 🛠 START: Self-taught Reasoner with Tools(自教工具集成推理器)[01:03] 👓 EgoLife: Towards Egoce...

2025.03.06 | 开源多语言模型Babel表现优异,多模态嵌入模型ABC提升控制能力。

06 Mar 2025

Contributed by Lukas

本期的 17 篇论文如下:[00:24] 🌍 Babel: Open Multilingual Large Language Models Serving Over 90% of Global Speakers(巴别塔:服务于...

2025.03.05 | MPO提升LLM规划效率,Mask-DPO增强事实性对齐。

05 Mar 2025

Contributed by Lukas

本期的 18 篇论文如下:[00:21] 🚀 MPO: Boosting LLM Agents with Meta Plan Optimization(MPO:通过元计划优化提升LLM代理)[00:59...

2025.03.04 | 强化视觉推理,提升3D重建质量。

04 Mar 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:21] 🧠 Visual-RFT: Visual Reinforcement Fine-Tuning(视觉强化微调:视觉强化微调)[01:05] 🌐 Difi...

2025.03.03 | 工程设计效率提升,推理任务成本降低。

03 Mar 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:20] 🌲 DeepSolution: Boosting Complex Engineering Solution Design via Tree-based Exploration and Bi-point Thinkin...

【月末特辑】2月最火AI论文 | 以数据为中心的小型语言模型训练;人类动画新框架。

02 Mar 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:39] TOP1(🔥196) | 🤖 SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model(SmolLM2:...

【周末特辑】2月第4周最火AI论文 | 标点符号影响LLM记忆,SurveyX提升问卷质量。

01 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:50] TOP1(🔥152) | 🔍 LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers...

2025.02.28 | 自我校正提升数学推理,强化学习优化医疗推理。

28 Feb 2025

Contributed by Lukas

本期的 19 篇论文如下:[00:23] 🧠 Self-rewarding correction for mathematical reasoning(自我奖励的数学推理校正)[01:03] 🧠 Me...

2025.02.27 | Kanana提升韩英双语效率,GHOST 2.0实现高保真头部转移。

27 Feb 2025

Contributed by Lukas

本期的 18 篇论文如下:[00:23] 🌐 Kanana: Compute-efficient Bilingual Language Models(Kanana:计算高效的双语语言模型)[00:54]...

2025.02.26 | OmniAlign-V提升多模态模型对齐,SpargeAttn加速注意力计算

26 Feb 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:23] 🤖 OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference(OmniAlign-V:迈向多模态大语...

2025.02.25 | 长上下文优化创新,视觉扩散高效通用。

25 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:27] 📖 Thus Spake Long-Context Large Language Model(长上下文大语言模型如是说)[01:09] 🌈 DICEPTI...

2025.02.24 | 高效学术调查生成,标点符号关键作用

24 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:23] 📚 SurveyX: Academic Survey Automation via Large Language Models(基于大型语言模型的学术调查自...

【周末特辑】2月第3周最火AI论文 | MLGym推动AI代理评估,Qwen2.5-VL提升多模态表现。

22 Feb 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:42] TOP1(🔥138) | 🧠 MLGym: A New Framework and Benchmark for Advancing AI Research Agents(MLGym:推进AI研...

2025.02.21 | AI代理评估新框架,LLM学科表现差异显著。

21 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:26] 🧠 MLGym: A New Framework and Benchmark for Advancing AI Research Agents(MLGym:推进AI研究代理的新...

2025.02.20 | 提升视觉感知,强化自动驾驶安全。

20 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:24] 🌐 Qwen2.5-VL Technical Report(Qwen2.5-VL 技术报告)[01:10] 🚗 RAD: Training an End-to-End Driving P...

2025.02.19 | 数据高效语音处理,嵌入空间压缩创新。

19 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:25] 🎙 Soundwave: Less is More for Speech-Text Alignment in LLMs(声波:减少数据需求,优化语音与文...

2025.02.18 | 稀疏注意力提升效率,机器人起身策略优化。

18 Feb 2025

Contributed by Lukas

本期的 29 篇论文如下:[00:23] ⚡ Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention(原生稀疏注意力:...

2025.02.17 | RAS加速扩散变换器,视频生成提升质量

17 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下:[00:22] 🌐 Region-Adaptive Sampling for Diffusion Transformers(区域自适应采样扩散变换器)[01:05] 🎥 ...

【周末特辑】2月第2周最火AI论文 | 1B LLM如何超越405B LLM;金融领域长上下文QA基准测试

15 Feb 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:54] TOP1(🔥121) | 🤔 Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling(10亿参数LLM能...

2025.02.14 | GPU扩展至300万tokens,文本编码器内存高效策略。

14 Feb 2025

Contributed by Lukas

本期的 18 篇论文如下:[00:21] 🚀 InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU(InfiniteHiP:在单...

2025.02.13 | 多语言评估工具填补空白,密集文本图像数据集挑战生成模型。

13 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:23] 🌍 BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models(BenchMAX:大型语言...

2025.02.12 | 强化学习提升编程竞赛,代码输入输出优化推理模型。

12 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下:[00:25] 🧠 Competitive Programming with Large Reasoning Models(使用大型推理模型进行编程竞赛)[01:03]...

2025.02.11 | LLMs生成多语言去毒数据,强化学习提升数学推理效率。

11 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下:[00:25] 🤖 SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators(SynthDetoxM:现代大语...

2025.02.10 | 视频处理性能提升,视频生成速度显著加快。

10 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下:[00:22] 🎥 VideoRoPE: What Makes for Good Video Rotary Position Embedding?(视频旋转位置嵌入:什么使得视...

«« ← Prev Page 4 of 6 Next → »»