Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Blog Pricing
Podcast Image

HuggingFace 每日AI论文速递

Technology Science

Episodes

Showing 201-300 of 591
«« ← Prev Page 3 of 6 Next → »»

2025.09.23 | 少78条示范让AI飙73.5%;免掩膜视频插主体超Pika

23 Sep 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🚀 LIMI: Less is More for Agency(LIMI:少即是多,打造AI智能体)[00:55] 🎬 OmniInsert: Mask-Fr...

2025.09.22 | 有向图驱动代码生成;双通道视觉统一模型

22 Sep 2025

Contributed by Lukas

本期的 13 篇论文如下:[00:25] 🗺 RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation(RPG:用于统一可扩展...

【周末特辑】9月第4周最火AI论文 | OmniWorld打造4D数据工厂;WebWeaver让AI边搜边写

20 Sep 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:43] TOP1(🔥95) | 🌍 OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling(OmniWorld:面向...

2025.09.19 | 跨平台GUI模型刷榜;FlowRL分布匹配提推理

19 Sep 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:26] 🖥 ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data(ScaleCUA:基于跨平台数...

2025.09.18 | FP8压缩+翻译微调低成本炼阿语大模型;2B-8B小模型洗数据硬刚GPT-4o

18 Sep 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:19] 🐪 Hala Technical Report: Building Arabic-Centric Instruction & Translation Models at Scale(Hala技术报...

2025.09.17 | WebWeaver框架提升可信长文报告;Agentic预训练扩展智能体系统

17 Sep 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:27] 🔍 WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research(WebWeaver:...

2025.09.16 | OmniWorld建4D数据底座;UI-S1半在线驯界面代理

16 Sep 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:24] 🌍 OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling(OmniWorld:面向4D世界建模...

2025.09.15 | 数据集升级测互动;模型大小非长程瓶颈

15 Sep 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:25] 📚 IntrEx: A Dataset for Modeling Engagement in Educational Conversations(IntrEx:面向教育对话中参...

【周末特辑】9月第3周最火AI论文 | 群智RL提速大模型;小VLA零预训练控机械

14 Sep 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:40] TOP1(🔥455) | 🤝 Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing(共享...

2025.09.12 | HuMo多模态控人视频;SimpleVLA-RL强化升效

12 Sep 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:27] 🎭 HuMo: Human-Centric Video Generation via Collaborative Multi-Modal Conditioning(HuMo:通过协同多模...

2025.09.11 | 强化学习提升推理能力;奖励缩放优化视觉生成

11 Sep 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:24] 🧠 A Survey of Reinforcement Learning for Large Reasoning Models(大型推理模型的强化学习综述)...

2025.09.10 | 强化学习并行思维;视觉搜索推理扩展

10 Sep 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:22] 🧠 Parallel-R1: Towards Parallel Thinking via Reinforcement Learning(Parallel-R1: 通过强化学习实现并...

2025.09.09 | REER提升推理性能;WebExplorer训练智能体

09 Sep 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 💡 Reverse-Engineered Reasoning for Open-Ended Generation(面向开放式生成的逆向工程推理)[00:...

2025.09.08 | 语言模型幻觉源于预训练;大模型图形编程性能提升

08 Sep 2025

Contributed by Lukas

本期的 12 篇论文如下:[00:24] 🤔 Why Language Models Hallucinate(语言模型为何产生幻觉)[00:47] 🎨 Symbolic Graphics Programm...

【周末特辑】9月第2周最火AI论文 | LLM智能体RL综述;AI代码安全基准

06 Sep 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:35] TOP1(🔥139) | 🤖 The Landscape of Agentic Reinforcement Learning for LLMs: A Survey(面向大语言模型的...

2025.09.05 | 大型语言模型语义理解弱;图像编辑模型提升几何估计

05 Sep 2025

Contributed by Lukas

本期的 13 篇论文如下:[00:22] 🤔 Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth(废话学:用深度解读无意义...

2025.09.04 | 机器人任务规划高效;数据推理能力提升

04 Sep 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:24] 🤖 Robix: A Unified Model for Robot Interaction, Reasoning and Planning(Robix:一个用于机器人交互、...

2025.09.03 | 智能体RL提升大模型自主性;SimpleTIR解多轮工具推理

03 Sep 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:19] 🤖 The Landscape of Agentic Reinforcement Learning for LLMs: A Survey(面向大语言模型的智能体强化...

2025.09.02 | PVPO优化推理性能;T2R-bench暴露模型短板

02 Sep 2025

Contributed by Lukas

本期的 6 篇论文如下:[00:23] 🧠 PVPO: Pre-Estimated Value-Based Policy Optimization for Agentic Reasoning(PVPO:基于预估值策略优...

2025.09.01 | R-4B模型优化思考效率;EO-1提升机器人控制能力

01 Sep 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🧠 R-4B: Incentivizing General-Purpose Auto-Thinking Capability in MLLMs via Bi-Mode Annealing and Reinforce ...

【月末特辑】8月最火AI论文 | 科学AI模型缩小性能差距;图像模型解决文本渲染与编辑

31 Aug 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:30] TOP1(🔥242) | 🧪 Intern-S1: A Scientific Multimodal Foundation Model(Intern-S1:一个科学多模态基...

【周末特辑】8月第5周最火AI论文 | 多模态模型效率提升;自博弈策略提高多样性

30 Aug 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:36] TOP1(🔥161) | 🚀 InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficie...

2025.08.29 | 稳定文本到图像生成;高效数学推理

29 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] ⚖ Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning(Pref-GRP...

2025.08.28 | 推理分解减幻觉;可解释性编码信息

28 Aug 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:25] 🧠 Self-Rewarding Vision-Language Model via Reasoning Decomposition(通过推理分解的自奖励视觉语...

2025.08.27 | 物理模型评估显不足;树算法优化提效降本

27 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🔬 CMPhysBench: A Benchmark for Evaluating Large Language Models in Condensed Matter Physics(CMPhysBench:...

2025.08.26 | 提升模型推理效率;增强生成语义对齐

26 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🚀 InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency(InternVL3...

2025.08.25 | 无微调智能体高效学习;四足机器人长周期探索

25 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🚀 AgentFly: Fine-tuning LLM Agents without Fine-tuning LLMs(AgentFly:无需微调LLM即可微调LLM智能...

【周末特辑】8月第4周最火AI论文 | 视觉模型新突破;科学多模态领先

24 Aug 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:39] TOP1(🔥172) | 🚀 DINOv3(DINOv3:视觉基础模型新里程碑)[01:39] TOP2(🔥170) | 🧪 Intern-S1: ...

2025.08.22 | 科学多模态缩小差距;GUI自动化解决挑战

23 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🧪 Intern-S1: A Scientific Multimodal Foundation Model(Intern-S1:一个科学多模态基础模型)[00:...

2025.08.21 | 金融大模型认知诊断;DuPO优化自验证

22 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🧠 From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models(从...

2025.08.20 | 智能体链提升效率;长视频3D重建优化

21 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🤖 Chain-of-Agents: End-to-End Agent Foundation Models via Multi-Agent Distillation and Agentic RL(智能体...

2025.08.19 | Ovis2.5提升多模态;ComoRAG优化长叙事推理

20 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:20] ✨ Ovis2.5 Technical Report(Ovis2.5 技术报告)[00:51] 🧠 ComoRAG: A Cognitive-Inspired Memory-Organiz...

2025.08.18 | 超越图像思考;自搜索强化

18 Aug 2025

Contributed by Lukas

本期的 13 篇论文如下:[00:19] 💡 Thyme: Think Beyond Images(Thyme:超越图像的思考)[00:48] 🧠 SSRL: Self-Search Reinforcement ...

【周末特辑】8月第3周最火AI论文 | GLM-4.5统一智能体推理编程;We-Math提升视觉数学推理

17 Aug 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:32] TOP1(🔥139) | 🚀 GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models(GLM-4.5:智能体、推...

2025.08.15 | 数学推理手册提升模型能力;连续令牌生成图像模型

16 Aug 2025

Contributed by Lukas

本期的 12 篇论文如下:[00:23] 📚 We-Math 2.0: A Versatile MathBook System for Incentivizing Visual Mathematical Reasoning(We-Math 2.0:一...

2025.08.14 | 分子推理框架提升性能;视频身份控制轻量高效

14 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:17] 🧪 Mol-R1: Towards Explicit Long-CoT Reasoning in Molecule Discovery(Mol-R1:迈向分子发现中的显式...

2025.08.13 | 多模态AI突破;3D世界生成

13 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🤖 WebWatcher: Breaking New Frontier of Vision-Language Deep Research Agent(WebWatcher:突破视觉-语言...

2025.08.12 | ReasonRank提升段落排序推理;WideSearch评估智能体广域搜寻

13 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:18] 🧠 ReasonRank: Empowering Passage Ranking with Strong Reasoning Ability(ReasonRank:赋予段落排序强大...

2025.08.11 | GLM-4.5统一智能体推理编程;Voost高保真虚拟试穿试脱

12 Aug 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:20] 🚀 GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models(GLM-4.5:智能体、推理与编程(...

【周末特辑】8月第2周最火AI论文 | CoT推理是幻象;Qwen-Image渲染领先

10 Aug 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:33] TOP1(🔥174) | 🤔 Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens(LLM思维链推理...

2025.08.08 | 动态微调优推理;零数据自演进强推理

09 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:16] ✨ On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification(关于SFT泛...

2025.08.07 | VeriGUI提升代理能力;CoT推理实为模式匹配

07 Aug 2025

Contributed by Lukas

本期的 13 篇论文如下:[00:20] 🤖 VeriGUI: Verifiable Long-Chain GUI Dataset(VeriGUI:可验证的长链GUI数据集)[00:40] 🤔 Is Ch...

2025.08.06 | 高速推理扩散模型;紧凑视觉生成模型

07 Aug 2025

Contributed by Lukas

本期的 13 篇论文如下:[00:17] 🚀 Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference(种子扩散:一种具...

2025.08.05 | 图像文本渲染编辑创新;上下文检索提升故事理解

06 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:18] 🎨 Qwen-Image Technical Report(Qwen-Image技术报告)[00:39] 🔍 SitEmb-v1.5: Improved Context-Aware De...

2025.08.04 | 扩散语言模型变长去噪,高效省资源;PixNerd图像扩散,高效高质量。

05 Aug 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:22] 🔄 Beyond Fixed: Variable-Length Denoising for Diffusion Large Language Models(超越固定长度:扩散大...

【月末特辑】7月最火AI论文 | GSPO稳训练;序列级裁剪降方差;上下文工程综述,动态拼装信息流

04 Aug 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:30] TOP1(🔥257) | 🚀 Group Sequence Policy Optimization(组序列策略优化)[02:21] TOP2(🔥227) | 🧮 ...

【周末特辑】8月第1周最火AI论文 | ARPO用高熵分叉省预算;混元世界一句话生成可编辑3D场景

03 Aug 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:32] TOP1(🔥114) | 🤖 Agentic Reinforced Policy Optimization(智能体强化策略优化)[02:17] TOP2(🔥94)...

2025.08.01 | Seed-Prover融合LLM解决IMO数学题;Phi-Ground提升GUI感知精度。

01 Aug 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🏆 Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving(Seed-Prover:自动化定理证明的...

2025.07.31 | ScreenCoder自动化UI转代码;Falcon-H1混合架构,提升长序列效率。

01 Aug 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:22] 💻 ScreenCoder: Advancing Visual-to-Code Generation for Front-End Automation via Modular Multimodal Agents(S...

2025.07.30 | 混元世界从文字像素生成沉浸3D世界;X-Omni用强化学习提升图像生成质量。

31 Jul 2025

Contributed by Lukas

本期的 8 篇论文如下:[00:23] 🌍 HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worlds from Words or Pixels(混元...

2025.07.29 | ARPO提升LLM工具交互性能;ARC-Hunyuan-Video-7B深耕短视频理解。

30 Jul 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🤖 Agentic Reinforced Policy Optimization(智能体强化策略优化)[00:55] 🧠 ARC-Hunyuan-Video-7B: ...

2025.07.28 | GPTQ揭示为Babai算法,保障精度;TTD-DR以扩散模型生成高质量研究报告。

29 Jul 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:25] 💡 The Geometry of LLM Quantization: GPTQ as Babai's Nearest Plane Algorithm(LLM 量化的几何学:GPTQ 作...

【周末特辑】7月第4周最火AI论文 | GUI-G2:高斯奖励提升GUI定位;MiroMind-M1:开源数学推理LLM

26 Jul 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:36] TOP1(🔥118) | 🎯 GUI-G$^2$: Gaussian Reward Modeling for GUI Grounding(GUI-G$^2$: 基于高斯奖励模型...

2025.07.25 | GSPO解决大模型训练崩溃;MUR提升LLM推理效率。

26 Jul 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🚀 Group Sequence Policy Optimization(组序列策略优化)[00:53] 🧠 MUR: Momentum Uncertainty guided...

2025.07.24 | MLLMs视觉感知仍不足;Yume模型可生成交互虚拟世界。

25 Jul 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:23] 👁 Pixels, Patterns, but No Poetry: To See The World like Humans(像素、模式,却无诗意:像人类一...

2025.07.23 | TIM模型突破LLM上下文限制;Step-Audio 2提升多模态语音对话。

24 Jul 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] ♾ Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning(超越上下文限制:用于长程...

2025.07.22 | MiroMind-M1提升数学推理;GUI-G$^2$高斯奖励助GUI定位。

22 Jul 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🧮 MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Opt...

2025.07.21 | dLLM新型安全漏洞,现有防御不足;俄语语音合成,数据与标注是核心。

22 Jul 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:20] 😈 The Devil behind the mask: An emergent safety vulnerability of Diffusion LLMs(隐藏在面具后的恶魔...

【周末特辑】7月第3周最火AI论文 | 上下文工程提升LLM性能;反射生成模型提高推理效率。

20 Jul 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:39] TOP1(🔥116) | 🧮 A Survey of Context Engineering for Large Language Models(大型语言模型上下文工程...

2025.07.18 | 优化LLMs上下文;提升视觉语言模型效率

19 Jul 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:27] 🧮 A Survey of Context Engineering for Large Language Models(大型语言模型上下文工程综述)[01:...

2025.07.17 | RAG提升LLM推理;PhysX生成物理3D资产

18 Jul 2025

Contributed by Lukas

本期的 13 篇论文如下:[00:26] 🧠 Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs(具身智能RAG与深...

2025.07.16 | VLV自编码器降低训练成本;EXAONE 4.0增强推理能力。

17 Jul 2025

Contributed by Lukas

本期的 8 篇论文如下:[00:28] 💡 Vision-Language-Vision Auto-Encoder: Scalable Knowledge Distillation from Diffusion Models(视觉-语言-...

2025.07.15 | 数据集支持虚拟人生成;强化学习需防数据污染。

16 Jul 2025

Contributed by Lukas

本期的 12 篇论文如下:[00:24] 🗣 SpeakerVid-5M: A Large-Scale High-Quality Dataset for Audio-Visual Dyadic Interactive Human Generation(S...

2025.07.14 | 高效推理路径选择;压缩光场令牌渲染

14 Jul 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:22] 🧠 Test-Time Scaling with Reflective Generative Model(基于反射生成模型的测试时缩放)[00:59] ...

【周末特辑】7月第2周最火AI论文 | 长视频推理框架创新;内存操作系统提升AI性能

13 Jul 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:42] TOP1(🔥109) | 🎬 Scaling RL to Long Videos(强化学习驱动视觉语言模型扩展至长视频)[02:54...

2025.07.11 | 长视频推理效率提升;单图像定制模型防过拟合。

11 Jul 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🎬 Scaling RL to Long Videos(强化学习驱动视觉语言模型扩展至长视频)[01:10] 🖼 T-LoRA: ...

2025.07.10 | 零样本运动生成突破;4K图像超分辨率提升。

10 Jul 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:22] 🤸 Go to Zero: Towards Zero-shot Motion Generation with Million-scale Data(趋向于零:基于百万级数...

2025.07.09 | 潜在推理提升LLM表达能力;SingLoRA优化低秩适应性能。

09 Jul 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🤔 A Survey on Latent Reasoning(潜在推理研究综述)[00:59] 💡 SingLoRA: Low Rank Adaptation Using...

2025.07.08 | MemOS提升内存管理效率;MLM与CLM结合优化编码器训练。

08 Jul 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🧠 MemOS: A Memory OS for AI System(MemOS:面向人工智能系统的内存操作系统)[01:07] 🤔 Sh...

2025.07.07 | GPT-4o在语义任务中表现良好;潜在空间模拟精度高。

07 Jul 2025

Contributed by Lukas

本期的 4 篇论文如下:[00:27] 🖼 How Well Does GPT-4o Understand Vision? Evaluating Multimodal Foundation Models on Standard Computer Vision...

【周末特辑】7月第1周最火AI论文 | 多模态推理模型提升;短视频理解领先。

06 Jul 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:35] TOP1(🔥165) | 🧠 GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learn...

【月末特辑】6月最火AI论文 | LLM通过自我反思提升性能;MiniMax-M1高效扩展测试计算。

05 Jul 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:37] TOP1(🔥258) | 💡 Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning(反思、重试、...

2025.07.04 | WebSailor提升LLM推理能力;LangScene-X优化3D场景重建。

04 Jul 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🧭 WebSailor: Navigating Super-human Reasoning for Web Agent(WebSailor:为Web Agent导航超人推理)[...

2025.07.03 | 多模态模型提升短视频理解;动画生成保持颜色一致。

04 Jul 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:21] 🎬 Kwai Keye-VL Technical Report(Kwai Keye-VL 技术报告)[01:02] 🎨 LongAnimation: Long Animation Gene...

2025.07.02 | 多模态推理提升;双向嵌入优化

02 Jul 2025

Contributed by Lukas

本期的 12 篇论文如下:[00:23] 💡 GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning(GLM-4.1V-...

2025.07.01 | 多模态生成领先;视频扩散效率提升

01 Jul 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🖼 Ovis-U1 Technical Report(Ovis-U1 技术报告)[00:58] 🎬 VMoBA: Mixture-of-Block Attention for Video...

2025.06.30 | 3D视觉编辑;视频令牌压缩

01 Jul 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:26] 🎨 BlenderFusion: 3D-Grounded Visual Editing and Generative Compositing(BlenderFusion:基于3D的视觉编...

【周末特辑】6月第5周最火AI论文 | 拖拽式大模型提升效率;法线光照恢复高精度。

28 Jun 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:42] TOP1(🔥107) | 🧲 Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights(拖拽式大语言模型:零样本提示...

2025.06.27 | 强化学习提升搜索效率;记忆增强生成逼真驾驶场景。

28 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🔍 MMSearch-R1: Incentivizing LMMs to Search(MMSearch-R1:激励大型多模态模型进行搜索)[00:59...

2025.06.26 | 高质量多模态模型;4比特量化提升性能

26 Jun 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:23] 🖼 ShareGPT-4o-Image: Aligning Multimodal Models with GPT-4o-Level Image Generation(ShareGPT-4o-Image:通...

2025.06.25 | AnimaX提升3D非生物体动画效果;Matrix-Game优化游戏世界模型。

26 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🤖 AnimaX: Animating the Inanimate in 3D with Joint Video-Pose Diffusion Models(AnimaX:利用联合视频...

2025.06.24 | 法线光照新方法提升细节;多模态生成模型表现优异。

25 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 💡 Light of Normals: Unified Feature Representation for Universal Photometric Stereo(法线光照:用于通...

2025.06.23 | DnD降低计算开销;视觉引导提升RAG性能。

23 Jun 2025

Contributed by Lukas

本期的 12 篇论文如下:[00:23] 🧲 Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights(拖拽式大语言模型:零样本提示到权重)[0...

【周末特辑】6月第4周最火AI论文 | 高效扩展推理能力;多模态金融评估基准。

21 Jun 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:36] TOP1(🔥216) | 💡 MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention(MiniMax-M1:利...

2025.06.20 | 强化学习提升跨领域推理;语音情感检测基准精细化。

20 Jun 2025

Contributed by Lukas

本期的 4 篇论文如下:[00:24] 🧠 Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective(跨领域视角下重...

2025.06.19 | SEKAI数据集提升视频生成;原型推理增强LLM泛化能力。

19 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🌍 Sekai: A Video Dataset towards World Exploration(Sekai:一个面向世界探索的视频数据集)[0...

2025.06.18 | MultiFinBen揭示金融模型局限;测试时计算提升LLM Agent性能。

18 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 📊 MultiFinBen: A Multilingual, Multimodal, and Difficulty-Aware Benchmark for Financial LLM Evaluation(Mul...

2025.06.17 | MiniMax-M1提升推理性能;多模态模型认知测试创新。

17 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 💡 MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention(MiniMax-M1:利用闪电注意...

2025.06.16 | 跨模态合成新视角图像;策略依从型智能体抗攻击

17 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🖼 Aligned Novel View Image and Geometry Synthesis via Cross-modal Attention Instillation(基于跨模态注...

【周末特辑】6月第3周最火AI论文 | 强化预训练提升语言模型推理能力;多语种分类器改善问答系统可信度。

15 Jun 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:43] TOP1(🔥199) | 🤖 Reinforcement Pre-Training(强化预训练)[03:06] TOP2(🔥124) | 🕰 Will It Still B...

2025.06.13 | 医学推理模型新范式;自动化构建软件工程数据集

14 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🩺 ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning(ReasonMed:一个用于...

2025.06.12 | 自信微调提升模型表现;视频生成模型高效优化。

12 Jun 2025

Contributed by Lukas

本期的 13 篇论文如下:[00:23] 🧠 Confidence Is All You Need: Few-Shot RL Fine-Tuning of Language Models(自信即全部:基于语言模...

2025.06.11 | LLM存在地缘政治偏见;RuleReasoner提升推理效率。

11 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🌍 Geopolitical biases in LLMs: what are the "good" and the "bad" countries according to contemporary languag...

2025.06.10 | 强化学习改进语言模型;医学多模态模型提升推理能力。

10 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🤖 Reinforcement Pre-Training(强化预训练)[01:01] 🩺 Lingshu: A Generalist Foundation Model for Uni...

2025.06.09 | 常青问题分类提升问答系统;多模态融合优化音频描述。

10 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🕰 Will It Still Be True Tomorrow? Multilingual Evergreen Question Classification to Improve Trustworthy QA(...

【周末特辑】6月第2周最火AI论文 | LLM自我反思提升性能;高熵Token优化推理。

08 Jun 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:47] TOP1(🔥169) | 💡 Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning(反思、重试、...

2025.06.06 | 智能助手加速ComfyUI开发;单步视频修复提升效率。

07 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🤖 ComfyUI-Copilot: An Intelligent Assistant for Automated Workflow Development(ComfyUI-Copilot:用于自...

2025.06.05 | 紧凑强大视觉模型;多阶段训练提升推理能力

06 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🤖 MiMo-VL Technical Report(MiMo-VL 技术报告)[01:14] 💡 Advancing Multimodal Reasoning: From Optimi...

2025.06.04 | 强化学习提升LLM性能;UniWorld统一视觉理解与生成。

05 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 💡 Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning(反思、重试、奖励:通过...

2025.06.03 | 高熵Token提升LLM推理;推理健身房优化强化学习环境。

03 Jun 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🧠 Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasoni...

«« ← Prev Page 3 of 6 Next → »»