Menu
Sign In Search Podcasts Libraries Charts People & Topics Add Podcast API Blog Pricing
Podcast Image

HuggingFace 每日AI论文速递

Technology Science

Episodes

Showing 401-500 of 630
«« ← Prev Page 5 of 7 Next → »»

2025.03.25 | 稀疏自编码器解读LLM中的推理特征,交互视频革新

25 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🧠 I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Aut...

2025.03.24 | 多智能体协作提升性能,苏格拉底式对话优化提示。

24 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:22] 🧠 MAPS: A Multi-Agent Framework Based on Big Seven Personality and Socratic Guidance for Multimodal Scientif...

【周末特辑】3月第3周最火AI论文 | 序列建模创新,视频渲染突破

22 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:37] TOP1(🔥118) | 🦢 RWKV-7 "Goose" with Expressive Dynamic State Evolution(RWKV-7 "Goose":具有表达性动...

2025.03.21 | 蒸馏提升超分辨率效率,优化推理减少计算负担。

21 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🖼 One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation(基于蒸馏的单步残...

2025.03.20 | 自适应前瞻采样优化推理;强化学习提升3D网格质量

20 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🔍 $φ$-Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation($\ph...

2025.03.19 | 动态序列建模优势,视频生成理解挑战

19 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🦢 RWKV-7 "Goose" with Expressive Dynamic State Evolution(RWKV-7 "Goose":具有表达性动态状态演化...

2025.03.18 | 视频生成新方法,人形机器人新框架

18 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:21] 🎥 DropletVideo: A Dataset and Approach to Explore Integral Spatio-Temporal Consistent Video Generation(Dro...

2025.03.17 | 新相机轨迹生成,稀疏性提升图像质量

17 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🎥 ReCamMaster: Camera-Controlled Generative Rendering from A Single Video(ReCamMaster:基于单视频的...

【周末特辑】3月第2周最火AI论文 | 稀疏自编码器提升文本检测,自动化ICD编码提高医疗效率。

15 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:44] TOP1(🔥208) | 🤖 Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders(基于稀疏...

2025.03.14 | CoSTA*优化多轮编辑效率,无声品牌攻击揭示扩散模型脆弱性。

14 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:25] 🖼 CoSTA$\ast$: Cost-Sensitive Toolpath Agent for Multi-turn Image Editing(CoSTA*:面向多轮图像编辑...

2025.03.13 | 降低视频扩散模型计算需求,提升多视角视频生成质量。

13 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:20] 🎥 TPDiff: Temporal Pyramid Video Diffusion Model(TPDiff:时间金字塔视频扩散模型)[00:58] 🎥...

2025.03.12 | 东南亚数据集创新构建,大模态模型推理能力显著提升

12 Mar 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] 🌏 Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast As...

2025.03.11 | 稀疏自编码器提升文本检测,SEAP优化语言模型效率

11 Mar 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:25] 🤖 Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders(基于稀疏自编码器的...

2025.03.10 | 多模态任务新框架,俄语ICD编码提升。

10 Mar 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:19] 🌐 Unified Reward Model for Multimodal Understanding and Generation(多模态理解和生成的统一奖励...

【周末特辑】3月第1周最火AI论文 | 多模态模型音频安全评估,集成工具提升推理效率。

08 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:35] TOP1(🔥64) | 🧠 Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-...

2025.03.07 | 提升推理效率,AI助手优化生活。

07 Mar 2025

Contributed by Lukas

本期的 18 篇论文如下:[00:21] 🛠 START: Self-taught Reasoner with Tools(自教工具集成推理器)[01:03] 👓 EgoLife: Towards Egoce...

2025.03.06 | 开源多语言模型Babel表现优异,多模态嵌入模型ABC提升控制能力。

06 Mar 2025

Contributed by Lukas

本期的 17 篇论文如下:[00:24] 🌍 Babel: Open Multilingual Large Language Models Serving Over 90% of Global Speakers(巴别塔:服务于...

2025.03.05 | MPO提升LLM规划效率,Mask-DPO增强事实性对齐。

05 Mar 2025

Contributed by Lukas

本期的 18 篇论文如下:[00:21] 🚀 MPO: Boosting LLM Agents with Meta Plan Optimization(MPO:通过元计划优化提升LLM代理)[00:59...

2025.03.04 | 强化视觉推理,提升3D重建质量。

04 Mar 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:21] 🧠 Visual-RFT: Visual Reinforcement Fine-Tuning(视觉强化微调:视觉强化微调)[01:05] 🌐 Difi...

2025.03.03 | 工程设计效率提升,推理任务成本降低。

03 Mar 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:20] 🌲 DeepSolution: Boosting Complex Engineering Solution Design via Tree-based Exploration and Bi-point Thinkin...

【月末特辑】2月最火AI论文 | 以数据为中心的小型语言模型训练;人类动画新框架。

02 Mar 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:39] TOP1(🔥196) | 🤖 SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model(SmolLM2:...

【周末特辑】2月第4周最火AI论文 | 标点符号影响LLM记忆,SurveyX提升问卷质量。

01 Mar 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:50] TOP1(🔥152) | 🔍 LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers...

2025.02.28 | 自我校正提升数学推理,强化学习优化医疗推理。

28 Feb 2025

Contributed by Lukas

本期的 19 篇论文如下:[00:23] 🧠 Self-rewarding correction for mathematical reasoning(自我奖励的数学推理校正)[01:03] 🧠 Me...

2025.02.27 | Kanana提升韩英双语效率,GHOST 2.0实现高保真头部转移。

27 Feb 2025

Contributed by Lukas

本期的 18 篇论文如下:[00:23] 🌐 Kanana: Compute-efficient Bilingual Language Models(Kanana:计算高效的双语语言模型)[00:54]...

2025.02.26 | OmniAlign-V提升多模态模型对齐,SpargeAttn加速注意力计算

26 Feb 2025

Contributed by Lukas

本期的 14 篇论文如下:[00:23] 🤖 OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference(OmniAlign-V:迈向多模态大语...

2025.02.25 | 长上下文优化创新,视觉扩散高效通用。

25 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:27] 📖 Thus Spake Long-Context Large Language Model(长上下文大语言模型如是说)[01:09] 🌈 DICEPTI...

2025.02.24 | 高效学术调查生成,标点符号关键作用

24 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:23] 📚 SurveyX: Academic Survey Automation via Large Language Models(基于大型语言模型的学术调查自...

【周末特辑】2月第3周最火AI论文 | MLGym推动AI代理评估,Qwen2.5-VL提升多模态表现。

22 Feb 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:42] TOP1(🔥138) | 🧠 MLGym: A New Framework and Benchmark for Advancing AI Research Agents(MLGym:推进AI研...

2025.02.21 | AI代理评估新框架,LLM学科表现差异显著。

21 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:26] 🧠 MLGym: A New Framework and Benchmark for Advancing AI Research Agents(MLGym:推进AI研究代理的新...

2025.02.20 | 提升视觉感知,强化自动驾驶安全。

20 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:24] 🌐 Qwen2.5-VL Technical Report(Qwen2.5-VL 技术报告)[01:10] 🚗 RAD: Training an End-to-End Driving P...

2025.02.19 | 数据高效语音处理,嵌入空间压缩创新。

19 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:25] 🎙 Soundwave: Less is More for Speech-Text Alignment in LLMs(声波:减少数据需求,优化语音与文...

2025.02.18 | 稀疏注意力提升效率,机器人起身策略优化。

18 Feb 2025

Contributed by Lukas

本期的 29 篇论文如下:[00:23] ⚡ Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention(原生稀疏注意力:...

2025.02.17 | RAS加速扩散变换器,视频生成提升质量

17 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下:[00:22] 🌐 Region-Adaptive Sampling for Diffusion Transformers(区域自适应采样扩散变换器)[01:05] 🎥 ...

【周末特辑】2月第2周最火AI论文 | 1B LLM如何超越405B LLM;金融领域长上下文QA基准测试

15 Feb 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:54] TOP1(🔥121) | 🤔 Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling(10亿参数LLM能...

2025.02.14 | GPU扩展至300万tokens,文本编码器内存高效策略。

14 Feb 2025

Contributed by Lukas

本期的 18 篇论文如下:[00:21] 🚀 InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU(InfiniteHiP:在单...

2025.02.13 | 多语言评估工具填补空白,密集文本图像数据集挑战生成模型。

13 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:23] 🌍 BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models(BenchMAX:大型语言...

2025.02.12 | 强化学习提升编程竞赛,代码输入输出优化推理模型。

12 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下:[00:25] 🧠 Competitive Programming with Large Reasoning Models(使用大型推理模型进行编程竞赛)[01:03]...

2025.02.11 | LLMs生成多语言去毒数据,强化学习提升数学推理效率。

11 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下:[00:25] 🤖 SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators(SynthDetoxM:现代大语...

2025.02.10 | 视频处理性能提升,视频生成速度显著加快。

10 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下:[00:22] 🎥 VideoRoPE: What Makes for Good Video Rotary Position Embedding?(视频旋转位置嵌入:什么使得视...

【周末特辑】2月第1周最火AI论文 | OmniHuman提升动画模型性能,SmolLM2优化小型语言模型训练。

08 Feb 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:39] TOP1(🔥162) | 🤖 OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models(Om...

2025.02.07 | 特征流提升模型可解释性,超IF增强指令跟随能力。

07 Feb 2025

Contributed by Lukas

本期的 21 篇论文如下:[00:24] 🔄 Analyze Feature Flow to Enhance Interpretation and Steering in Language Models(分析特征流以增强语...

2025.02.06 | 数据优化提升模型性能,模拟市场再现复杂行为。

06 Feb 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:26] 🤖 SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model(SmolLM2:当小型模型...

2025.02.05 | 逆桥匹配蒸馏提速,视频JAM提升运动连贯。

05 Feb 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:25] ⚡ Inverse Bridge Matching Distillation(逆桥匹配蒸馏)[01:02] 🎥 VideoJAM: Joint Appearance-Motion R...

2025.02.04 | DAAs性能提升,OmniHuman动画优化。

04 Feb 2025

Contributed by Lukas

本期的 20 篇论文如下:[00:26] 🤔 The Differences Between Direct Alignment Algorithms are a Blur(直接对齐算法的差异逐渐模糊)...

2025.02.03 | 测试时缩放提升推理,奖励引导解码减少计算。

03 Feb 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:26] 🧠 s1: Simple test-time scaling(简单的测试时缩放)[01:18] ⚡ Reward-Guided Speculative Decoding fo...

【月末特辑】1月最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力;长文本处理突破

02 Feb 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:40] TOP1(🔥281) | 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(DeepS...

【周末特辑】1月第4周最火AI论文 | 强化学习优于监督微调,HLE挑战LLMs能力。

01 Feb 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:35] TOP1(🔥53) | 🧠 SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training(监督...

2025.01.31 | GuardReasoner提升LLM安全,MedXpertQA挑战医疗AI推理。

31 Jan 2025

Contributed by Lukas

本期的 8 篇论文如下:[00:25] 🛡 GuardReasoner: Towards Reasoning-based LLM Safeguards(GuardReasoner:面向基于推理的LLM安全防护...

2025.01.30 | 批评提升推理,AI能耗引关注

30 Jan 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:25] 🧠 Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate(批评微调:学习...

2025.01.29 | RL泛化优,SFT稳定输出;FP4量化降成本,精度保持。

29 Jan 2025

Contributed by Lukas

本期的 8 篇论文如下:[00:26] 🧠 SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training(监督微调记忆,...

2025.01.28 | Baichuan多模态模型表现优异,长上下文处理成本降低。

28 Jan 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:26] 🎙 Baichuan-Omni-1.5 Technical Report(百川全能1.5技术报告)[01:03] 📚 Qwen2.5-1M Technical Report...

2025.01.27 | 测试复杂性提升,冗余问题待解决

27 Jan 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:25] 🧠 Humanity's Last Exam(人类最后的考试)[01:06] 📊 Redundancy Principles for MLLMs Benchmarks(多...

【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力,进化搜索优化复杂任务解决。

25 Jan 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:37] TOP1(🔥167) | 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(DeepSe...

2025.01.24 | SRMT提升多智能体协作能力,VideoReward优化视频生成质量。

24 Jan 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:26] 🧠 SRMT: Shared Memory for Multi-agent Lifelong Pathfinding(SRMT:多智能体终身路径规划中的共享...

2025.01.23 | DeepSeek-R1强化学习提升推理能力,多智能体框架实现虚拟电影自动化

23 Jan 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:24] 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(DeepSeek-R1:通过强...

2025.01.22 | Agent-R提升语言模型实时纠错能力,MMVU评估多学科视频理解专家级表现。

22 Jan 2025

Contributed by Lukas

本期的 16 篇论文如下:[00:24] 🤔 Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training(Agent-R:通过迭代自...

2025.01.21 | GameFactory实现多样化游戏生成,VideoWorld通过视频学习复杂知识。

21 Jan 2025

Contributed by Lukas

本期的 2 篇论文如下:[00:27] 🎮 GameFactory: Creating New Games with Generative Interactive Videos(GameFactory:利用生成式交互视...

2025.01.20 | 思维进化提升LLM推理能力,PaSa优化学术搜索效率。

20 Jan 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:28] 🧠 Evolving Deeper LLM Thinking(演化更深层次的LLM思维)[01:04] 🔍 PaSa: An LLM Agent for Compreh...

【周末特辑】1月第2周最火AI论文 | MiniMax-01扩展长上下文处理,数学推理PRM提升过程监督。

18 Jan 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:35] TOP1(🔥258) | ⚡ MiniMax-01: Scaling Foundation Models with Lightning Attention(MiniMax-01:基于闪电注...

2025.01.17 | OmniThink提升机器写作深度与新颖性,扩散模型推理扩展提升生成质量。

18 Jan 2025

Contributed by Lukas

本期的 12 篇论文如下:[00:26] 🧠 OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking(OmniThink:通过思考扩...

2025.01.16 | MMDocIR推动多模态检索标准化,CityDreamer4D创新4D城市生成模型。

16 Jan 2025

Contributed by Lukas

本期的 9 篇论文如下:[00:25] 📊 MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents(MMDocIR:长文档多模态检索的基准...

2025.01.15 | MiniMax-01扩展基础模型处理长上下文,填充符在T2I模型中影响图像生成。

15 Jan 2025

Contributed by Lukas

本期的 15 篇论文如下:[00:23] ⚡ MiniMax-01: Scaling Foundation Models with Lightning Attention(MiniMax-01:基于闪电注意力机制扩...

2025.01.14 | 数学推理提升,内存开销减少

14 Jan 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:24] 📊 The Lessons of Developing Process Reward Models in Mathematical Reasoning(数学推理中过程奖励模...

2025.01.13 | OmniManip实现通用机器人操作,VideoRAG提升视频检索生成性能。

13 Jan 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:24] 🤖 OmniManip: Towards General Robotic Manipulation via Object-Centric Interaction Primitives as Spatial Const...

【周末特辑】1月第1周最火AI论文 | 小型模型超越大型模型,REINFORCE++简化对齐方法

11 Jan 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:39] TOP1(🔥173) | 🧠 rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking(rStar-Ma...

2025.01.10 每日AI论文 | GAN训练简化性能提升,视频自回归预训练竞争力显著。

10 Jan 2025

Contributed by Lukas

本期的 7 篇论文如下:[00:23] 🧠 The GAN is dead; long live the GAN! A Modern GAN Baseline(GAN已死;GAN万岁!一个现代的GAN基线...

2025.01.09 每日AI论文 | 小型模型自我进化超越GPT-3,多模态模型提升数学推理能力。

09 Jan 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:25] 🧠 rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking(rStar-Math:小型语言...

2025.01.08 每日AI论文 | REINFORCE++提升大模型对齐效率,MotionBench优化视频运动理解

08 Jan 2025

Contributed by Lukas

本期的 11 篇论文如下:[00:24] 🚀 REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models(REINFORCE++:一种简单...

2025.01.07 每日AI论文 | STAR提升视频超分辨率时空一致性,BoostStep增强大模型数学推理能力。

07 Jan 2025

Contributed by Lukas

本期的 16 篇论文如下:[00:24] 🎥 STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution(STAR...

2025.01.06 每日AI论文 | EnerVerse提升机器人操作规划能力,VITA-1.5优化实时视觉语音交互。

06 Jan 2025

Contributed by Lukas

本期的 8 篇论文如下:[00:24] 🤖 EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation(EnerVerse:面向机器人操作的...

【月末特辑】12月最火AI论文 | Qwen2.5提升大语言模型性能,阿波罗优化视频理解效率。

05 Jan 2025

Contributed by Lukas

本期的 10 篇论文如下:[00:31] TOP1(🔥335) | 🤖 Qwen2.5 Technical Report(Qwen2.5技术报告)[02:44] TOP2(🔥136) | 🎥 Apollo: An E...

【周末特辑】12月第5周最火AI论文 | 提升医学推理能力,自动化GUI轨迹构建。

04 Jan 2025

Contributed by Lukas

本期的 5 篇论文如下:[00:35] TOP1(🔥83) | 🧠 HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs(华佗GPT-o1:迈向医学复杂...

2025.01.03 每日AI论文 | 多模态教科书提升视觉语言模型性能,VideoAnydoor实现高保真视频对象插入

03 Jan 2025

Contributed by Lukas

本期的 17 篇论文如下:[00:24] 📚 2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining(2.5年课堂:用于视觉-语...

2025.01.02 每日AI论文 | 自动化GUI代理轨迹构建,优化推理任务语言模型。

02 Jan 2025

Contributed by Lukas

本期的 2 篇论文如下:[00:26] 🤖 OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis(OS-Genesis:通过逆...

2024.12.31 每日AI论文 | 解释性指令提升视觉任务泛化,多模态模型优化医学影像泛化。

31 Dec 2024

Contributed by Lukas

本期的 10 篇论文如下:[00:25] 🔍 Explanatory Instructions: Towards Unified Vision Tasks Understanding and Zero-shot Generalization(解释...

2024.12.30 每日AI论文 | 华佗GPT-o1提升医学推理,Orient Anything精准估计物体方向。

30 Dec 2024

Contributed by Lukas

本期的 8 篇论文如下:[00:30] 🧠 HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs(华佗GPT-o1:迈向医学复杂推理的大语...

【周末特辑】12月第4周最火AI论文 | 鲁棒微调提升大模型抗噪能力,并行生成加速视觉模型效率。

28 Dec 2024

Contributed by Lukas

本期的 5 篇论文如下:[00:37] TOP1(🔥78) | 🛡 RobustFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response(Rob...

2024.12.27 每日AI论文 | YuLan-Mini提升数据效率,Gist Token优化上下文压缩。

27 Dec 2024

Contributed by Lukas

本期的 4 篇论文如下:[00:26] 🧠 YuLan-Mini: An Open Data-efficient Language Model(YuLan-Mini:一个开放的数据高效语言模型)...

2024.12.26 每日AI论文 | Token预算优化推理,Video-Panda提升视频处理效率。

26 Dec 2024

Contributed by Lukas

本期的 4 篇论文如下:[00:27] 💡 Token-Budget-Aware LLM Reasoning(基于Token预算的大语言模型推理)[01:07] 🎥 Video-Panda: Pa...

2024.12.25 每日AI论文 | 提升三维场景理解,填补深度信息缺失。

25 Dec 2024

Contributed by Lukas

本期的 9 篇论文如下:[00:26] 🧠 3DGraphLLM: Combining Semantic Graphs and Large Language Models for 3D Scene Understanding(3DGraphLLM:结...

2024.12.24 每日AI论文 | 探索与利用平衡,噪声数据处理提升。

24 Dec 2024

Contributed by Lukas

本期的 16 篇论文如下:[00:24] 🔄 B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners(B-STaR:监控和...

2024.12.23 每日AI论文 | 加速视觉生成,优化多步推理

23 Dec 2024

Contributed by Lukas

本期的 10 篇论文如下:[00:22] ⚡ Parallelized Autoregressive Visual Generation(并行自回归视觉生成)[01:05] 🧠 Offline Reinforc...

【周末特辑】12月第3周最火AI论文 | Qwen2.5提升LLMs性能,阿波罗优化视频理解。

21 Dec 2024

Contributed by Lukas

本期的 5 篇论文如下:[00:40] TOP1(🔥252) | 🤖 Qwen2.5 Technical Report(Qwen2.5技术报告)[02:31] TOP2(🔥127) | 🎥 Apollo: An Ex...

2024.12.20 每日AI论文 | 数据扩增提升LLMs性能,多模态推理框架创新突破

20 Dec 2024

Contributed by Lukas

本期的 14 篇论文如下:[00:22] 🤖 Qwen2.5 Technical Report(Qwen2.5技术报告)[01:00] 🧠 Progressive Multimodal Reasoning via Active ...

2024.12.19 每日AI论文 | AI代理任务表现有限,动画制作效率提升。

19 Dec 2024

Contributed by Lukas

本期的 18 篇论文如下:[00:24] 🤖 TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks(TheAgentCompany:在具有重...

2024.12.18 每日AI论文 | 推理能力待提升,多模态模型需优化。

18 Dec 2024

Contributed by Lukas

本期的 8 篇论文如下:[00:24] 🧠 Are Your LLMs Capable of Stable Reasoning?(你的LLM是否具备稳定推理能力?)[01:06] 📊 Mult...

2024.12.17 每日AI论文 | 提升检索生成效率,优化视觉生成评估。

17 Dec 2024

Contributed by Lukas

本期的 18 篇论文如下:[00:23] 🧠 RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation(RetroLLM:...

2024.12.16 每日AI论文 | 视频理解新突破,AI探索3D环境。

16 Dec 2024

Contributed by Lukas

本期的 14 篇论文如下:[00:23] 🎥 Apollo: An Exploration of Video Understanding in Large Multimodal Models(阿波罗:大型多模态模型...

【周末特辑】12月第2周最火AI论文 | 扩展策略提升模型性能,多模态系统优化长期交互。

14 Dec 2024

Contributed by Lukas

本期的 5 篇论文如下:[00:43] TOP1(🔥95) | 🌐 Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test...

2024.12.13 每日AI论文 | 多模态系统提升长期交互,phi-4优化STEM问答表现。

13 Dec 2024

Contributed by Lukas

本期的 23 篇论文如下:[00:23] 🎥 InternLM-XComposer2.5-OmniLive: A Comprehensive Multimodal System for Long-term Streaming Video and Audio ...

2024.12.12 每日AI论文 | 多视角视频生成突破,复杂场景模型提升

12 Dec 2024

Contributed by Lukas

本期的 14 篇论文如下:[00:23] 🎥 SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints(SynCamMaster:同步多...

2024.12.11 每日AI论文 | 代码模型评估改进,视频生成技术突破

11 Dec 2024

Contributed by Lukas

本期的 23 篇论文如下:[00:25] 🧑 Evaluating and Aligning CodeLLMs on Human Preference(评估与对齐代码大语言模型的人类偏好...

2024.12.10 每日AI论文 | 识别数学推理错误,评估强化学习记忆。

10 Dec 2024

Contributed by Lukas

本期的 9 篇论文如下:[00:23] 🧮 ProcessBench: Identifying Process Errors in Mathematical Reasoning(ProcessBench:识别数学推理中的...

2024.12.09 每日AI论文 | 提升多模态模型性能,优化文本到视频生成质量。

09 Dec 2024

Contributed by Lukas

本期的 11 篇论文如下:[00:27] 🌐 Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling(...

【周末特辑】12月第1周最火AI论文 | SNOOPI提升文生图模型效率,PaliGemma 2优化视觉语言模型迁移性能

07 Dec 2024

Contributed by Lukas

本期的 5 篇论文如下:[00:40] TOP1(🔥102) | 🚀 SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance(SNOOPI:超强...

2024.12.06 每日AI论文 | 视觉压缩提升效率,代码监控增强机器人可靠性。

06 Dec 2024

Contributed by Lukas

本期的 23 篇论文如下:[00:23] 🔍 VisionZip: Longer is Better but Not Necessary in Vision Language Models(视觉压缩:视觉语言模型...

2024.12.05 每日AI论文 | 提升文本到图像扩散模型,生成沉浸式360度视频。

05 Dec 2024

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🚀 SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance(SNOOPI:超强一步扩散蒸...

2024.12.04 每日AI论文 | 多镜头视频生成框架提升叙事连贯性,关键令牌识别增强LLM推理能力。

04 Dec 2024

Contributed by Lukas

本期的 15 篇论文如下:[00:24] 🎥 VideoGen-of-Thought: A Collaborative Framework for Multi-Shot Video Generation(视频思维生成:多镜...

2024.12.03 每日AI论文 | X-Prompt提升图像生成,GATE OpenING评估图文生成。

03 Dec 2024

Contributed by Lukas

本期的 24 篇论文如下:[00:23] 🖼 X-Prompt: Towards Universal In-Context Image Generation in Auto-Regressive Vision Language Foundation Mode...

【月末特辑】11月最火AI论文 | OpenCoder性能媲美专有模型,SDXL Turbo增强图像模型可解释性。

03 Dec 2024

Contributed by Lukas

本期的 10 篇论文如下:[00:41] TOP1(🔥109) | 🔓 OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models(开放编码器:顶...

«« ← Prev Page 5 of 7 Next → »»