HuggingFace 每日AI论文速递
Episodes
【周末特辑】2月第1周最火AI论文 | OmniHuman提升动画模型性能,SmolLM2优化小型语言模型训练。
08 Feb 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:39] TOP1(🔥162) | 🤖 OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models(Om...
2025.02.07 | 特征流提升模型可解释性,超IF增强指令跟随能力。
07 Feb 2025
Contributed by Lukas
本期的 21 篇论文如下:[00:24] 🔄 Analyze Feature Flow to Enhance Interpretation and Steering in Language Models(分析特征流以增强语...
2025.02.06 | 数据优化提升模型性能,模拟市场再现复杂行为。
06 Feb 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:26] 🤖 SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model(SmolLM2:当小型模型...
2025.02.05 | 逆桥匹配蒸馏提速,视频JAM提升运动连贯。
05 Feb 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:25] ⚡ Inverse Bridge Matching Distillation(逆桥匹配蒸馏)[01:02] 🎥 VideoJAM: Joint Appearance-Motion R...
2025.02.04 | DAAs性能提升,OmniHuman动画优化。
04 Feb 2025
Contributed by Lukas
本期的 20 篇论文如下:[00:26] 🤔 The Differences Between Direct Alignment Algorithms are a Blur(直接对齐算法的差异逐渐模糊)...
2025.02.03 | 测试时缩放提升推理,奖励引导解码减少计算。
03 Feb 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:26] 🧠 s1: Simple test-time scaling(简单的测试时缩放)[01:18] ⚡ Reward-Guided Speculative Decoding fo...
【月末特辑】1月最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力;长文本处理突破
02 Feb 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:40] TOP1(🔥281) | 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(DeepS...
【周末特辑】1月第4周最火AI论文 | 强化学习优于监督微调,HLE挑战LLMs能力。
01 Feb 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:35] TOP1(🔥53) | 🧠 SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training(监督...
2025.01.31 | GuardReasoner提升LLM安全,MedXpertQA挑战医疗AI推理。
31 Jan 2025
Contributed by Lukas
本期的 8 篇论文如下:[00:25] 🛡 GuardReasoner: Towards Reasoning-based LLM Safeguards(GuardReasoner:面向基于推理的LLM安全防护...
2025.01.30 | 批评提升推理,AI能耗引关注
30 Jan 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:25] 🧠 Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate(批评微调:学习...
2025.01.29 | RL泛化优,SFT稳定输出;FP4量化降成本,精度保持。
29 Jan 2025
Contributed by Lukas
本期的 8 篇论文如下:[00:26] 🧠 SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training(监督微调记忆,...
2025.01.28 | Baichuan多模态模型表现优异,长上下文处理成本降低。
28 Jan 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:26] 🎙 Baichuan-Omni-1.5 Technical Report(百川全能1.5技术报告)[01:03] 📚 Qwen2.5-1M Technical Report...
2025.01.27 | 测试复杂性提升,冗余问题待解决
27 Jan 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:25] 🧠 Humanity's Last Exam(人类最后的考试)[01:06] 📊 Redundancy Principles for MLLMs Benchmarks(多...
【周末特辑】1月第3周最火AI论文 | DeepSeek-R1强化学习提升LLM推理能力,进化搜索优化复杂任务解决。
25 Jan 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:37] TOP1(🔥167) | 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(DeepSe...
2025.01.24 | SRMT提升多智能体协作能力,VideoReward优化视频生成质量。
24 Jan 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:26] 🧠 SRMT: Shared Memory for Multi-agent Lifelong Pathfinding(SRMT:多智能体终身路径规划中的共享...
2025.01.23 | DeepSeek-R1强化学习提升推理能力,多智能体框架实现虚拟电影自动化
23 Jan 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:24] 🧠 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(DeepSeek-R1:通过强...
2025.01.22 | Agent-R提升语言模型实时纠错能力,MMVU评估多学科视频理解专家级表现。
22 Jan 2025
Contributed by Lukas
本期的 16 篇论文如下:[00:24] 🤔 Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training(Agent-R:通过迭代自...
2025.01.21 | GameFactory实现多样化游戏生成,VideoWorld通过视频学习复杂知识。
21 Jan 2025
Contributed by Lukas
本期的 2 篇论文如下:[00:27] 🎮 GameFactory: Creating New Games with Generative Interactive Videos(GameFactory:利用生成式交互视...
2025.01.20 | 思维进化提升LLM推理能力,PaSa优化学术搜索效率。
20 Jan 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:28] 🧠 Evolving Deeper LLM Thinking(演化更深层次的LLM思维)[01:04] 🔍 PaSa: An LLM Agent for Compreh...
【周末特辑】1月第2周最火AI论文 | MiniMax-01扩展长上下文处理,数学推理PRM提升过程监督。
18 Jan 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:35] TOP1(🔥258) | ⚡ MiniMax-01: Scaling Foundation Models with Lightning Attention(MiniMax-01:基于闪电注...
2025.01.17 | OmniThink提升机器写作深度与新颖性,扩散模型推理扩展提升生成质量。
18 Jan 2025
Contributed by Lukas
本期的 12 篇论文如下:[00:26] 🧠 OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking(OmniThink:通过思考扩...
2025.01.16 | MMDocIR推动多模态检索标准化,CityDreamer4D创新4D城市生成模型。
16 Jan 2025
Contributed by Lukas
本期的 9 篇论文如下:[00:25] 📊 MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents(MMDocIR:长文档多模态检索的基准...
2025.01.15 | MiniMax-01扩展基础模型处理长上下文,填充符在T2I模型中影响图像生成。
15 Jan 2025
Contributed by Lukas
本期的 15 篇论文如下:[00:23] ⚡ MiniMax-01: Scaling Foundation Models with Lightning Attention(MiniMax-01:基于闪电注意力机制扩...
2025.01.14 | 数学推理提升,内存开销减少
14 Jan 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:24] 📊 The Lessons of Developing Process Reward Models in Mathematical Reasoning(数学推理中过程奖励模...
2025.01.13 | OmniManip实现通用机器人操作,VideoRAG提升视频检索生成性能。
13 Jan 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:24] 🤖 OmniManip: Towards General Robotic Manipulation via Object-Centric Interaction Primitives as Spatial Const...
【周末特辑】1月第1周最火AI论文 | 小型模型超越大型模型,REINFORCE++简化对齐方法
11 Jan 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:39] TOP1(🔥173) | 🧠 rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking(rStar-Ma...
2025.01.10 每日AI论文 | GAN训练简化性能提升,视频自回归预训练竞争力显著。
10 Jan 2025
Contributed by Lukas
本期的 7 篇论文如下:[00:23] 🧠 The GAN is dead; long live the GAN! A Modern GAN Baseline(GAN已死;GAN万岁!一个现代的GAN基线...
2025.01.09 每日AI论文 | 小型模型自我进化超越GPT-3,多模态模型提升数学推理能力。
09 Jan 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:25] 🧠 rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking(rStar-Math:小型语言...
2025.01.08 每日AI论文 | REINFORCE++提升大模型对齐效率,MotionBench优化视频运动理解
08 Jan 2025
Contributed by Lukas
本期的 11 篇论文如下:[00:24] 🚀 REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models(REINFORCE++:一种简单...
2025.01.07 每日AI论文 | STAR提升视频超分辨率时空一致性,BoostStep增强大模型数学推理能力。
07 Jan 2025
Contributed by Lukas
本期的 16 篇论文如下:[00:24] 🎥 STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution(STAR...
2025.01.06 每日AI论文 | EnerVerse提升机器人操作规划能力,VITA-1.5优化实时视觉语音交互。
06 Jan 2025
Contributed by Lukas
本期的 8 篇论文如下:[00:24] 🤖 EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation(EnerVerse:面向机器人操作的...
【月末特辑】12月最火AI论文 | Qwen2.5提升大语言模型性能,阿波罗优化视频理解效率。
05 Jan 2025
Contributed by Lukas
本期的 10 篇论文如下:[00:31] TOP1(🔥335) | 🤖 Qwen2.5 Technical Report(Qwen2.5技术报告)[02:44] TOP2(🔥136) | 🎥 Apollo: An E...
【周末特辑】12月第5周最火AI论文 | 提升医学推理能力,自动化GUI轨迹构建。
04 Jan 2025
Contributed by Lukas
本期的 5 篇论文如下:[00:35] TOP1(🔥83) | 🧠 HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs(华佗GPT-o1:迈向医学复杂...
2025.01.03 每日AI论文 | 多模态教科书提升视觉语言模型性能,VideoAnydoor实现高保真视频对象插入
03 Jan 2025
Contributed by Lukas
本期的 17 篇论文如下:[00:24] 📚 2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining(2.5年课堂:用于视觉-语...
2025.01.02 每日AI论文 | 自动化GUI代理轨迹构建,优化推理任务语言模型。
02 Jan 2025
Contributed by Lukas
本期的 2 篇论文如下:[00:26] 🤖 OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis(OS-Genesis:通过逆...
2024.12.31 每日AI论文 | 解释性指令提升视觉任务泛化,多模态模型优化医学影像泛化。
31 Dec 2024
Contributed by Lukas
本期的 10 篇论文如下:[00:25] 🔍 Explanatory Instructions: Towards Unified Vision Tasks Understanding and Zero-shot Generalization(解释...
2024.12.30 每日AI论文 | 华佗GPT-o1提升医学推理,Orient Anything精准估计物体方向。
30 Dec 2024
Contributed by Lukas
本期的 8 篇论文如下:[00:30] 🧠 HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs(华佗GPT-o1:迈向医学复杂推理的大语...
【周末特辑】12月第4周最火AI论文 | 鲁棒微调提升大模型抗噪能力,并行生成加速视觉模型效率。
28 Dec 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:37] TOP1(🔥78) | 🛡 RobustFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response(Rob...
2024.12.27 每日AI论文 | YuLan-Mini提升数据效率,Gist Token优化上下文压缩。
27 Dec 2024
Contributed by Lukas
本期的 4 篇论文如下:[00:26] 🧠 YuLan-Mini: An Open Data-efficient Language Model(YuLan-Mini:一个开放的数据高效语言模型)...
2024.12.26 每日AI论文 | Token预算优化推理,Video-Panda提升视频处理效率。
26 Dec 2024
Contributed by Lukas
本期的 4 篇论文如下:[00:27] 💡 Token-Budget-Aware LLM Reasoning(基于Token预算的大语言模型推理)[01:07] 🎥 Video-Panda: Pa...
2024.12.25 每日AI论文 | 提升三维场景理解,填补深度信息缺失。
25 Dec 2024
Contributed by Lukas
本期的 9 篇论文如下:[00:26] 🧠 3DGraphLLM: Combining Semantic Graphs and Large Language Models for 3D Scene Understanding(3DGraphLLM:结...
2024.12.24 每日AI论文 | 探索与利用平衡,噪声数据处理提升。
24 Dec 2024
Contributed by Lukas
本期的 16 篇论文如下:[00:24] 🔄 B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners(B-STaR:监控和...
2024.12.23 每日AI论文 | 加速视觉生成,优化多步推理
23 Dec 2024
Contributed by Lukas
本期的 10 篇论文如下:[00:22] ⚡ Parallelized Autoregressive Visual Generation(并行自回归视觉生成)[01:05] 🧠 Offline Reinforc...
【周末特辑】12月第3周最火AI论文 | Qwen2.5提升LLMs性能,阿波罗优化视频理解。
21 Dec 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:40] TOP1(🔥252) | 🤖 Qwen2.5 Technical Report(Qwen2.5技术报告)[02:31] TOP2(🔥127) | 🎥 Apollo: An Ex...
2024.12.20 每日AI论文 | 数据扩增提升LLMs性能,多模态推理框架创新突破
20 Dec 2024
Contributed by Lukas
本期的 14 篇论文如下:[00:22] 🤖 Qwen2.5 Technical Report(Qwen2.5技术报告)[01:00] 🧠 Progressive Multimodal Reasoning via Active ...
2024.12.19 每日AI论文 | AI代理任务表现有限,动画制作效率提升。
19 Dec 2024
Contributed by Lukas
本期的 18 篇论文如下:[00:24] 🤖 TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks(TheAgentCompany:在具有重...
2024.12.18 每日AI论文 | 推理能力待提升,多模态模型需优化。
18 Dec 2024
Contributed by Lukas
本期的 8 篇论文如下:[00:24] 🧠 Are Your LLMs Capable of Stable Reasoning?(你的LLM是否具备稳定推理能力?)[01:06] 📊 Mult...
2024.12.17 每日AI论文 | 提升检索生成效率,优化视觉生成评估。
17 Dec 2024
Contributed by Lukas
本期的 18 篇论文如下:[00:23] 🧠 RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation(RetroLLM:...
2024.12.16 每日AI论文 | 视频理解新突破,AI探索3D环境。
16 Dec 2024
Contributed by Lukas
本期的 14 篇论文如下:[00:23] 🎥 Apollo: An Exploration of Video Understanding in Large Multimodal Models(阿波罗:大型多模态模型...
【周末特辑】12月第2周最火AI论文 | 扩展策略提升模型性能,多模态系统优化长期交互。
14 Dec 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:43] TOP1(🔥95) | 🌐 Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test...
2024.12.13 每日AI论文 | 多模态系统提升长期交互,phi-4优化STEM问答表现。
13 Dec 2024
Contributed by Lukas
本期的 23 篇论文如下:[00:23] 🎥 InternLM-XComposer2.5-OmniLive: A Comprehensive Multimodal System for Long-term Streaming Video and Audio ...
2024.12.12 每日AI论文 | 多视角视频生成突破,复杂场景模型提升
12 Dec 2024
Contributed by Lukas
本期的 14 篇论文如下:[00:23] 🎥 SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints(SynCamMaster:同步多...
2024.12.11 每日AI论文 | 代码模型评估改进,视频生成技术突破
11 Dec 2024
Contributed by Lukas
本期的 23 篇论文如下:[00:25] 🧑 Evaluating and Aligning CodeLLMs on Human Preference(评估与对齐代码大语言模型的人类偏好...
2024.12.10 每日AI论文 | 识别数学推理错误,评估强化学习记忆。
10 Dec 2024
Contributed by Lukas
本期的 9 篇论文如下:[00:23] 🧮 ProcessBench: Identifying Process Errors in Mathematical Reasoning(ProcessBench:识别数学推理中的...
2024.12.09 每日AI论文 | 提升多模态模型性能,优化文本到视频生成质量。
09 Dec 2024
Contributed by Lukas
本期的 11 篇论文如下:[00:27] 🌐 Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling(...
【周末特辑】12月第1周最火AI论文 | SNOOPI提升文生图模型效率,PaliGemma 2优化视觉语言模型迁移性能
07 Dec 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:40] TOP1(🔥102) | 🚀 SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance(SNOOPI:超强...
2024.12.06 每日AI论文 | 视觉压缩提升效率,代码监控增强机器人可靠性。
06 Dec 2024
Contributed by Lukas
本期的 23 篇论文如下:[00:23] 🔍 VisionZip: Longer is Better but Not Necessary in Vision Language Models(视觉压缩:视觉语言模型...
2024.12.05 每日AI论文 | 提升文本到图像扩散模型,生成沉浸式360度视频。
05 Dec 2024
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🚀 SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance(SNOOPI:超强一步扩散蒸...
2024.12.04 每日AI论文 | 多镜头视频生成框架提升叙事连贯性,关键令牌识别增强LLM推理能力。
04 Dec 2024
Contributed by Lukas
本期的 15 篇论文如下:[00:24] 🎥 VideoGen-of-Thought: A Collaborative Framework for Multi-Shot Video Generation(视频思维生成:多镜...
2024.12.03 每日AI论文 | X-Prompt提升图像生成,GATE OpenING评估图文生成。
03 Dec 2024
Contributed by Lukas
本期的 24 篇论文如下:[00:23] 🖼 X-Prompt: Towards Universal In-Context Image Generation in Auto-Regressive Vision Language Foundation Mode...
【月末特辑】11月最火AI论文 | OpenCoder性能媲美专有模型,SDXL Turbo增强图像模型可解释性。
03 Dec 2024
Contributed by Lukas
本期的 10 篇论文如下:[00:41] TOP1(🔥109) | 🔓 OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models(开放编码器:顶...
2024.12.02 每日AI论文 | HiAR-ICL提升复杂任务表现,多模态模型领域适应增强。
02 Dec 2024
Contributed by Lukas
本期的 14 篇论文如下:[00:25] 🧠 Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS(超越示例:...
【周末特辑】11月第5周最火AI论文 | 提升视觉生成实例控制,增强UI视觉代理交互能力。
30 Nov 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:40] TOP1(🔥71) | 🖼 ROICtrl: Boosting Instance Control for Visual Generation(ROICtrl:提升视觉生成的实...
2024.11.29 每日AI论文 | 视觉语言模型提升,图像生成自动化
29 Nov 2024
Contributed by Lukas
本期的 6 篇论文如下:[00:26] 🧠 Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning(批评者-V:视觉语言模型批评...
2024.11.28 每日AI论文 | 实例控制增强,4D场景生成突破
29 Nov 2024
Contributed by Lukas
本期的 21 篇论文如下:[00:24] 🖼 ROICtrl: Boosting Instance Control for Visual Generation(ROICtrl:提升视觉生成的实例控制)[...
2024.11.27 每日AI论文 | ShowUI提升GUI效率,F2F改进图像编辑。
27 Nov 2024
Contributed by Lukas
本期的 18 篇论文如下:[00:28] 🖥 ShowUI: One Vision-Language-Action Model for GUI Visual Agent(ShowUI:一种用于GUI视觉代理的视...
2024.11.26 每日AI论文 | 3D材料生成自动化,零样本图像生成创新。
26 Nov 2024
Contributed by Lukas
本期的 21 篇论文如下:[00:26] 🌐 Material Anything: Generating Materials for Any 3D Object via Diffusion(材料生成:通过扩散生成...
2024.11.25 每日AI论文 | 风格友好SNR采样器提升图像生成,TÜLU 3开源模型性能超越。
25 Nov 2024
Contributed by Lukas
本期的 14 篇论文如下:[00:26] 🎨 Style-Friendly SNR Sampler for Style-Driven Generation(风格友好SNR采样器用于风格驱动生成)...
【周末特辑】11月第4周最火AI论文 | LLaVA-o1提升多模态推理,Genex优化具身AI规划。
23 Nov 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:41] TOP1(🔥93) | 🧠 LLaVA-o1: Let Vision Language Models Reason Step-by-Step(LLaVA-o1:让视觉语言模型逐...
2024.11.22 每日AI论文 | 混合偏好优化提升推理,多模态自回归预训练创新。
22 Nov 2024
Contributed by Lukas
本期的 14 篇论文如下:[00:26] 🧠 Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization(通...
2024.11.21 每日AI论文 | 4比特注意力加速显著,视频生成基准全面评估。
21 Nov 2024
Contributed by Lukas
本期的 8 篇论文如下:[00:28] ⚡ SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration(SageAtt...
2024.11.20 每日AI论文 | 图像生成加速,语言模型数据集创新
20 Nov 2024
Contributed by Lukas
本期的 7 篇论文如下:[00:33] ⚡ Continuous Speculative Decoding for Autoregressive Image Generation(自回归图像生成的连续推测解...
2024.11.19 每日AI论文 | 移动设备高效部署,具身AI虚拟探索
19 Nov 2024
Contributed by Lukas
本期的 16 篇论文如下:[00:25] 📱 BlueLM-V-3B: Algorithm and System Co-Design for Multimodal Large Language Models on Mobile Devices(BlueL...
2024.11.18 每日AI论文 | 视觉语言模型推理提升,图像生成精细控制优化
18 Nov 2024
Contributed by Lukas
本期的 6 篇论文如下:[00:28] 🧠 LLaVA-o1: Let Vision Language Models Reason Step-by-Step(LLaVA-o1:让视觉语言模型逐步推理)[...
【周末特辑】11月第3周最火AI论文 | Add-it提升图像插入性能,LLMs实现长上下文自我改进。
16 Nov 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:44] TOP1(🔥54) | 🖼 Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models(Add-it:...
2024.11.15 每日AI论文 | 高效图像编辑,3D网格生成
15 Nov 2024
Contributed by Lukas
本期的 7 篇论文如下:[00:27] ✨ MagicQuill: An Intelligent Interactive Image Editing System(魔法羽毛笔:智能交互式图像编辑系...
2024.11.14 每日AI论文 | LLMs自我改进显著,EgoVid-5M数据集创新。
14 Nov 2024
Contributed by Lukas
本期的 7 篇论文如下:[00:26] 🤖 Large Language Models Can Self-Improve in Long-context Reasoning(大型语言模型在长上下文推理中...
2024.11.13 每日AI论文 | 三维物体分割新框架,多模态理解生成模型
13 Nov 2024
Contributed by Lukas
本期的 6 篇论文如下:[00:28] 🔍 SAMPart3D: Segment Any Part in 3D Objects(SAMPart3D:三维物体任意部分分割)[01:06] 🌐 Janus...
2024.11.12 每日AI论文 | 对象无缝插入,通用编辑模型提升精度
12 Nov 2024
Contributed by Lukas
本期的 14 篇论文如下:[00:23] 🖼 Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models(Add-it:基于预训练...
2024.11.11 每日AI论文 | 提升训练吞吐量,减少内存使用
11 Nov 2024
Contributed by Lukas
本期的 6 篇论文如下:[00:30] ⚖ Balancing Pipeline Parallelism with Vocabulary Parallelism(平衡流水线并行与词汇并行)[01:15] ...
【周末特辑】11月第2周最火AI论文 | 开放编码器加速代码AI研究,ReCapture提升视频生成质量。
09 Nov 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:38] TOP1(🔥73) | 🔧 OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models(开放编码器:顶...
2024.11.08 每日AI论文 | 开放编码器提升代码生成,ReCapture优化视频轨迹
08 Nov 2024
Contributed by Lukas
本期的 14 篇论文如下:[00:25] 🔧 OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models(开放编码器:顶级代码大语...
2024.11.07 每日AI论文 | 数据污染影响模型评估,结构化推理提升LLMs性能
07 Nov 2024
Contributed by Lukas
本期的 4 篇论文如下:[00:28] 🔍 Both Text and Images Leaked! A Systematic Analysis of Multimodal LLM Data Contamination(文本与图像均...
2024.11.06 每日AI论文 | HTML提升RAG性能,分子图助手优化多模态任务
06 Nov 2024
Contributed by Lukas
本期的 11 篇论文如下:[00:30] 📄 HtmlRAG: HTML is Better Than Plain Text for Modeling Retrieved Knowledge in RAG Systems(HtmlRAG:在RAG...
2024.11.05 每日AI论文 | AndroidLab提升代理性能,WebRL优化网络任务表现。
05 Nov 2024
Contributed by Lukas
本期的 17 篇论文如下:[00:26] 🤖 AndroidLab: Training and Systematic Benchmarking of Android Autonomous Agents(AndroidLab:Android自主...
2024.11.04 每日AI论文 | OS-ATLAS提升GUI代理性能,CAF优化生成模型效率。
04 Nov 2024
Contributed by Lukas
本期的 17 篇论文如下:[00:25] 🤖 OS-ATLAS: A Foundation Action Model for Generalist GUI Agents(OS-ATLAS:通用GUI代理的基础动作模...
【周末特辑】11月第1周最火AI论文 | 多模态遗忘新基准CLEAR,GPT-4o系统卡片详解。
02 Nov 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:41] TOP1(🔥191) | 🧠 CLEAR: Character Unlearning in Textual and Visual Modalities(CLEAR:文本与视觉模态...
2024.11.01 每日AI论文 | 稀疏自编码器提升图像模型可解释性,梯度视角揭示LLMs层级差异。
01 Nov 2024
Contributed by Lukas
本期的 11 篇论文如下:[00:27] 🔍 Unpacking SDXL Turbo: Interpreting Text-to-Image Models with Sparse Autoencoders(解构SDXL Turbo:使用...
2024.10.31 每日AI论文 | 多轮对话评估新基准,机器人任务高效推理模型。
31 Oct 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:29] 🗣 CORAL: Benchmarking Multi-turn Conversational Retrieval-Augmentation Generation(CORAL:多轮对话增强...
2024.10.30 每日AI论文 | 多模态遗忘挑战大,AutoKaggle提升效率。
30 Oct 2024
Contributed by Lukas
本期的 8 篇论文如下:[00:33] 🧠 CLEAR: Character Unlearning in Textual and Visual Modalities(CLEAR:文本与视觉模态中的字符遗...
2024.10.29 每日AI论文 | 波兰语模型性能提升,异构代理系统创新。
29 Oct 2024
Contributed by Lukas
本期的 17 篇论文如下:[00:24] 🇵 Bielik 7B v0.1: A Polish Language Model -- Development, Insights, and Evaluation(Bielik 7B v0.1:波兰...
2024.10.28 每日AI论文 | 视觉-时间提示提升交互,连续扩散模型优化语音合成
28 Oct 2024
Contributed by Lukas
本期的 13 篇论文如下:[00:25] 🚀 ROCKET-1: Master Open-World Interaction with Visual-Temporal Context Prompting(ROCKET-1:利用视觉-时...
【周末特辑】10月第4周最火AI论文 | 少样本NeRF高效收敛,长视频分割精度提升。
26 Oct 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:44] TOP1(🔥79) | ⚡ FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors(节俭...
2024.10.25 每日AI论文 | 内存效率显著提升,长上下文对齐能力增强。
25 Oct 2024
Contributed by Lukas
本期的 21 篇论文如下:[00:26] 🚀 Breaking the Memory Barrier: Near Infinite Batch Size Scaling for Contrastive Loss(打破内存壁垒:...
2024.10.24 每日AI论文 | 多图像任务优化,视频生成模型评估
24 Oct 2024
Contributed by Lukas
本期的 10 篇论文如下:[00:25] 🖼 MIA-DPO: Multi-Image Augmented Direct Preference Optimization For Large Vision-Language Models(多图像...
2024.10.23 每日AI论文 | 视觉冗余减少提升效率,动态三维重建优化镜面场景。
23 Oct 2024
Contributed by Lukas
本期的 8 篇论文如下:[00:27] 🔍 PyramidDrop: Accelerating Your Large Vision-Language Models via Pyramid Visual Redundancy Reduction(金字...
2024.10.22 每日AI论文 | 指南针评判者加速模型评估,SAM2Long提升长视频分割精度。
22 Oct 2024
Contributed by Lukas
本期的 21 篇论文如下:[00:24] 🤖 CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution(指南针评判者-1:一体...
2024.10.21 每日AI论文 | 提升网页导航成功率,增强图像生成精细度。
21 Oct 2024
Contributed by Lukas
本期的 12 篇论文如下:[00:27] 🌐 Web Agents with World Models: Learning and Leveraging Environment Dynamics in Web Navigation(拥有世界...
【周末特辑】10月第3周最火AI论文 | 多模态大语言模型创新,评估标准统一化。
19 Oct 2024
Contributed by Lukas
本期的 5 篇论文如下:[00:45] TOP1(🔥80) | 🌐 Baichuan-Omni Technical Report(百川-Omni 技术报告)[02:20] TOP2(🔥58) | 📊 MixE...
2024.10.18 每日AI论文 | AI评估标准化,电影生成模型领先。
18 Oct 2024
Contributed by Lukas
本期的 31 篇论文如下:[00:23] 📊 MixEval-X: Any-to-Any Evaluations from Real-World Data Mixtures(MixEval-X:从现实世界数据混合中...