AI Series' Articles

Cover image for Agent Learning via Early Experience

Paperium

Oct 20

Agent Learning via Early Experience

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for MM-HELIX: Boosting Multimodal Long-Chain Reflective Reasoning with HolisticPlatform and Adaptive Hybrid Policy Optimization

Paperium

Oct 20

MM-HELIX: Boosting Multimodal Long-Chain Reflective Reasoning with HolisticPlatform and Adaptive Hybrid Policy Optimization

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for MemMamba: Rethinking Memory Patterns in State Space Model

Paperium

Oct 20

MemMamba: Rethinking Memory Patterns in State Space Model

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for UniVideo: Unified Understanding, Generation, and Editing for Videos

Paperium

Oct 21

UniVideo: Unified Understanding, Generation, and Editing for Videos

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for VideoCanvas: Unified Video Completion from Arbitrary Spatiotemporal Patches viaIn-Context Conditioning

Paperium

Oct 21

VideoCanvas: Unified Video Completion from Arbitrary Spatiotemporal Patches viaIn-Context Conditioning

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for DreamOmni2: Multimodal Instruction-based Editing and Generation

Paperium

Oct 22

DreamOmni2: Multimodal Instruction-based Editing and Generation

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for From What to Why: A Multi-Agent System for Evidence-based Chemical ReactionCondition Reasoning

Paperium

Oct 22

From What to Why: A Multi-Agent System for Evidence-based Chemical ReactionCondition Reasoning

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Meta-Awareness Enhances Reasoning Models: Self-Alignment Reinforcement Learning

Paperium

Oct 22

Meta-Awareness Enhances Reasoning Models: Self-Alignment Reinforcement Learning

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for When Thoughts Meet Facts: Reusable Reasoning for Long-Context LMs

Paperium

Oct 22

When Thoughts Meet Facts: Reusable Reasoning for Long-Context LMs

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Low-probability Tokens Sustain Exploration in Reinforcement Learning withVerifiable Reward

Paperium

Oct 22

Low-probability Tokens Sustain Exploration in Reinforcement Learning withVerifiable Reward

#ai #deeplearning #computerscience #machinelearning

3 min read

Cover image for The Alignment Waltz: Jointly Training Agents to Collaborate for Safety

Paperium

Oct 23

The Alignment Waltz: Jointly Training Agents to Collaborate for Safety

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Training-Free Group Relative Policy Optimization

Paperium

Oct 23

Training-Free Group Relative Policy Optimization

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Hybrid Reinforcement: When Reward Is Sparse, It's Better to Be Dense

Paperium

Oct 23

Hybrid Reinforcement: When Reward Is Sparse, It's Better to Be Dense

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for NewtonBench: Benchmarking Generalizable Scientific Law Discovery in LLM Agents

Paperium

Oct 23

NewtonBench: Benchmarking Generalizable Scientific Law Discovery in LLM Agents

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for ARTDECO: Towards Efficient and High-Fidelity On-the-Fly 3D Reconstruction withStructured Scene Representation

Paperium

Oct 23

ARTDECO: Towards Efficient and High-Fidelity On-the-Fly 3D Reconstruction withStructured Scene Representation

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for DeepPrune: Parallel Scaling without Inter-trace Redundancy

Paperium

Oct 23

DeepPrune: Parallel Scaling without Inter-trace Redundancy

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for First Try Matters: Revisiting the Role of Reflection in Reasoning Models

Paperium

Oct 23

First Try Matters: Revisiting the Role of Reflection in Reasoning Models

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for LLMs Learn to Deceive Unintentionally: Emergent Misalignment in Dishonesty fromMisaligned Samples to Biased Human-AI Interaction

Paperium

Oct 26

LLMs Learn to Deceive Unintentionally: Emergent Misalignment in Dishonesty fromMisaligned Samples to Biased Human-AI Interaction

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for UniMMVSR: A Unified Multi-Modal Framework for Cascaded Video Super-Resolution

Paperium

Oct 26

UniMMVSR: A Unified Multi-Modal Framework for Cascaded Video Super-Resolution

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for NaViL: Rethinking Scaling Properties of Native Multimodal Large Language Modelsunder Data Constraints

Paperium

Oct 26

NaViL: Rethinking Scaling Properties of Native Multimodal Large Language Modelsunder Data Constraints

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for CoMAS: Co-Evolving Multi-Agent Systems via Interaction Rewards

Paperium

Oct 26

CoMAS: Co-Evolving Multi-Agent Systems via Interaction Rewards

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for PickStyle: Video-to-Video Style Transfer with Context-Style Adapters

Paperium

Oct 26

PickStyle: Video-to-Video Style Transfer with Context-Style Adapters

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for UNIDOC-BENCH: A Unified Benchmark for Document-Centric Multimodal RAG

Paperium

Oct 26

UNIDOC-BENCH: A Unified Benchmark for Document-Centric Multimodal RAG

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for InstructX: Towards Unified Visual Editing with MLLM Guidance

Paperium

Oct 26

InstructX: Towards Unified Visual Editing with MLLM Guidance

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LongRM: Revealing and Unlocking the Context Boundary of Reward Modeling

Paperium

Oct 26

LongRM: Revealing and Unlocking the Context Boundary of Reward Modeling

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Learning on the Job: An Experience-Driven Self-Evolving Agent for Long-HorizonTasks

Paperium

Oct 27

Learning on the Job: An Experience-Driven Self-Evolving Agent for Long-HorizonTasks

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Reinforcing Diffusion Models by Direct Group Preference Optimization

Paperium

Oct 27

Reinforcing Diffusion Models by Direct Group Preference Optimization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Taming Text-to-Sounding Video Generation via Advanced Modality Condition andInteraction

Paperium

Oct 27

Taming Text-to-Sounding Video Generation via Advanced Modality Condition andInteraction

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Entropy Regularizing Activation: Boosting Continuous Control, Large LanguageModels, and Image Classification with Activation as

Paperium

Oct 27

Entropy Regularizing Activation: Boosting Continuous Control, Large LanguageModels, and Image Classification with Activation as

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Memory Retrieval and Consolidation in Large Language Models through FunctionTokens

Paperium

Oct 27

Memory Retrieval and Consolidation in Large Language Models through FunctionTokens

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Recycling Pretrained Checkpoints: Orthogonal Growth of Mixture-of-Experts forEfficient Large Language Model Pre-Training

Paperium

Oct 27

Recycling Pretrained Checkpoints: Orthogonal Growth of Mixture-of-Experts forEfficient Large Language Model Pre-Training

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for GCPO: When Contrast Fails, Go Gold

Paperium

Oct 27

GCPO: When Contrast Fails, Go Gold

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for UP2You: Fast Reconstruction of Yourself from Unconstrained Photo Collections

Paperium

Oct 27

UP2You: Fast Reconstruction of Yourself from Unconstrained Photo Collections

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for OmniRetarget: Interaction-Preserving Data Generation for Humanoid Whole-BodyLoco-Manipulation and Scene Interaction

Paperium

Oct 27

OmniRetarget: Interaction-Preserving Data Generation for Humanoid Whole-BodyLoco-Manipulation and Scene Interaction

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DexNDM: Closing the Reality Gap for Dexterous In-Hand Rotation via Joint-WiseNeural Dynamics Model

Paperium

Oct 27

DexNDM: Closing the Reality Gap for Dexterous In-Hand Rotation via Joint-WiseNeural Dynamics Model

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for A^2Search: Ambiguity-Aware Question Answering with Reinforcement Learning

Paperium

Oct 27

A^2Search: Ambiguity-Aware Question Answering with Reinforcement Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Learning to Route LLMs from Bandit Feedback: One Policy, Many Trade-offs

Paperium

Oct 27

Learning to Route LLMs from Bandit Feedback: One Policy, Many Trade-offs

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Search-R3: Unifying Reasoning and Embedding Generation in Large Language Models

Paperium

Oct 27

Search-R3: Unifying Reasoning and Embedding Generation in Large Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for R2RGEN: Real-to-Real 3D Data Generation for Spatially Generalized Manipulation

Paperium

Oct 27

R2RGEN: Real-to-Real 3D Data Generation for Spatially Generalized Manipulation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Drive&Gen: Co-Evaluating End-to-End Driving and Video Generation Models

Paperium

Oct 27

Drive&Gen: Co-Evaluating End-to-End Driving and Video Generation Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Beyond Outliers: A Study of Optimizers Under Quantization

Paperium

Oct 27

Beyond Outliers: A Study of Optimizers Under Quantization

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for SViM3D: Stable Video Material Diffusion for Single Image 3D Generation

Paperium

Oct 27

SViM3D: Stable Video Material Diffusion for Single Image 3D Generation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for GyroSwin: 5D Surrogates for Gyrokinetic Plasma Turbulence Simulations

Paperium

Oct 27

GyroSwin: 5D Surrogates for Gyrokinetic Plasma Turbulence Simulations

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Towards Scalable and Consistent 3D Editing

Paperium

Oct 27

Towards Scalable and Consistent 3D Editing

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Use the Online Network If You Can: Towards Fast and Stable ReinforcementLearning

Paperium

Oct 27

Use the Online Network If You Can: Towards Fast and Stable ReinforcementLearning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Fidelity-Aware Data Composition for Robust Robot Generalization

Paperium

Oct 28

Fidelity-Aware Data Composition for Robust Robot Generalization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for SciVideoBench: Benchmarking Scientific Video Reasoning in Large MultimodalModels

Paperium

Oct 28

SciVideoBench: Benchmarking Scientific Video Reasoning in Large MultimodalModels

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Large Scale Diffusion Distillation via Score-Regularized Continuous-TimeConsistency

Paperium

Oct 28

Large Scale Diffusion Distillation via Score-Regularized Continuous-TimeConsistency

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Beyond Turn Limits: Training Deep Search Agents with Dynamic Context Window

Paperium

Oct 28

Beyond Turn Limits: Training Deep Search Agents with Dynamic Context Window

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for OpenRubrics: Towards Scalable Synthetic Rubric Generation for Reward Modelingand LLM Alignment

Paperium

Oct 28

OpenRubrics: Towards Scalable Synthetic Rubric Generation for Reward Modelingand LLM Alignment

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Thinking with Camera: A Unified Multimodal Model for Camera-CentricUnderstanding and Generation

Paperium

Oct 28

Thinking with Camera: A Unified Multimodal Model for Camera-CentricUnderstanding and Generation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for D2E: Scaling Vision-Action Pretraining on Desktop Data for Transfer to EmbodiedAI

Paperium

Oct 28

D2E: Scaling Vision-Action Pretraining on Desktop Data for Transfer to EmbodiedAI

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for TAG:Tangential Amplifying Guidance for Hallucination-Resistant DiffusionSampling

Paperium

Oct 28

TAG:Tangential Amplifying Guidance for Hallucination-Resistant DiffusionSampling

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Multimodal Prompt Optimization: Why Not Leverage Multiple Modalities for MLLMs

Paperium

Oct 28

Multimodal Prompt Optimization: Why Not Leverage Multiple Modalities for MLLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for AutoPR: Let's Automate Your Academic Promotion!

Paperium

Oct 28

AutoPR: Let's Automate Your Academic Promotion!

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for R-Horizon: How Far Can Your Large Reasoning Model Really Go in Breadth andDepth?

Paperium

Oct 28

R-Horizon: How Far Can Your Large Reasoning Model Really Go in Breadth andDepth?

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Webscale-RL: Automated Data Pipeline for Scaling RL Data to Pretraining Levels

Paperium

Oct 28

Webscale-RL: Automated Data Pipeline for Scaling RL Data to Pretraining Levels

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for SpaceVista: All-Scale Visual Spatial Reasoning from mm to km

Paperium

Oct 28

SpaceVista: All-Scale Visual Spatial Reasoning from mm to km

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for StreamingVLM: Real-Time Understanding for Infinite Video Streams

Paperium

Oct 28

StreamingVLM: Real-Time Understanding for Infinite Video Streams

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Don't Waste Mistakes: Leveraging Negative RL-Groups via Confidence Reweighting

Paperium

Oct 28

Don't Waste Mistakes: Leveraging Negative RL-Groups via Confidence Reweighting

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ARES: Multimodal Adaptive Reasoning via Difficulty-Aware Token-Level EntropyShaping

Paperium

Oct 28

ARES: Multimodal Adaptive Reasoning via Difficulty-Aware Token-Level EntropyShaping

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for KORMo: Korean Open Reasoning Model for Everyone

Paperium

Oct 28

KORMo: Korean Open Reasoning Model for Everyone

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DISCO: Diversifying Sample Condensation for Efficient Model Evaluation

Paperium

Oct 28

DISCO: Diversifying Sample Condensation for Efficient Model Evaluation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Bridging Reasoning to Learning: Unmasking Illusions using Complexity Out ofDistribution Generalization

Paperium

Oct 28

Bridging Reasoning to Learning: Unmasking Illusions using Complexity Out ofDistribution Generalization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Progressive Gaussian Transformer with Anisotropy-aware Sampling for OpenVocabulary Occupancy Prediction

Paperium

Oct 28

Progressive Gaussian Transformer with Anisotropy-aware Sampling for OpenVocabulary Occupancy Prediction

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for StatEval: A Comprehensive Benchmark for Large Language Models in Statistics

Paperium

Oct 28

StatEval: A Comprehensive Benchmark for Large Language Models in Statistics

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MRMR: A Realistic and Expert-Level Multidisciplinary Benchmark forReasoning-Intensive Multimodal Retrieval

Paperium

Oct 29

MRMR: A Realistic and Expert-Level Multidisciplinary Benchmark forReasoning-Intensive Multimodal Retrieval

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for PhysToolBench: Benchmarking Physical Tool Understanding for MLLMs

Paperium

Oct 29

PhysToolBench: Benchmarking Physical Tool Understanding for MLLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for BigCodeArena: Unveiling More Reliable Human Preferences in Code Generation viaExecution

Paperium

Oct 29

BigCodeArena: Unveiling More Reliable Human Preferences in Code Generation viaExecution

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Which Heads Matter for Reasoning? RL-Guided KV Cache Compression

Paperium

Oct 29

Which Heads Matter for Reasoning? RL-Guided KV Cache Compression

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Dyna-Mind: Learning to Simulate from Experience for Better AI Agents

Paperium

Oct 29

Dyna-Mind: Learning to Simulate from Experience for Better AI Agents

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for ReviewerToo: Should AI Join The Program Committee? A Look At The Future of PeerReview

Paperium

Oct 29

ReviewerToo: Should AI Join The Program Committee? A Look At The Future of PeerReview

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Pseudo2Real: Task Arithmetic for Pseudo-Label Correction in Automatic SpeechRecognition

Paperium

Oct 29

Pseudo2Real: Task Arithmetic for Pseudo-Label Correction in Automatic SpeechRecognition

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Parallel Test-Time Scaling for Latent Reasoning Models

Paperium

Oct 29

Parallel Test-Time Scaling for Latent Reasoning Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Mind-Paced Speaking: A Dual-Brain Approach to Real-Time Reasoning in SpokenLanguage Models

Paperium

Oct 29

Mind-Paced Speaking: A Dual-Brain Approach to Real-Time Reasoning in SpokenLanguage Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A Goal Without a Plan Is Just a Wish: Efficient and Effective Global PlannerTraining for Long-Horizon Agent Tasks

Paperium

Oct 29

A Goal Without a Plan Is Just a Wish: Efficient and Effective Global PlannerTraining for Long-Horizon Agent Tasks

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for TC-LoRA: Temporally Modulated Conditional LoRA for Adaptive Diffusion Control

Paperium

Oct 29

TC-LoRA: Temporally Modulated Conditional LoRA for Adaptive Diffusion Control

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Mitigating Overthinking through Reasoning Shaping

Paperium

Oct 29

Mitigating Overthinking through Reasoning Shaping

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Adaptive Attacks on Trusted Monitors Subvert AI Control Protocols

Paperium

Oct 29

Adaptive Attacks on Trusted Monitors Subvert AI Control Protocols

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for GTAlign: Game-Theoretic Alignment of LLM Assistants for Mutual Welfare

Paperium

Oct 29

GTAlign: Game-Theoretic Alignment of LLM Assistants for Mutual Welfare

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Understanding DeepResearch via Reports

Paperium

Oct 29

Understanding DeepResearch via Reports

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for One Patch to Caption Them All: A Unified Zero-Shot Captioning Framework

Paperium

Oct 30

One Patch to Caption Them All: A Unified Zero-Shot Captioning Framework

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Hybrid-grained Feature Aggregation with Coarse-to-fine Language Guidance forSelf-supervised Monocular Depth Estimation

Paperium

Oct 30

Hybrid-grained Feature Aggregation with Coarse-to-fine Language Guidance forSelf-supervised Monocular Depth Estimation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Speculative Jacobi-Denoising Decoding for Accelerating AutoregressiveText-to-image Generation

Paperium

Oct 30

Speculative Jacobi-Denoising Decoding for Accelerating AutoregressiveText-to-image Generation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Better Together: Leveraging Unpaired Multimodal Data for Stronger UnimodalModels

Paperium

Oct 30

Better Together: Leveraging Unpaired Multimodal Data for Stronger UnimodalModels

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for LightReasoner: Can Small Language Models Teach Large Language Models Reasoning?

Paperium

Oct 30

LightReasoner: Can Small Language Models Teach Large Language Models Reasoning?

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall

Paperium

Oct 30

ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Formalizing Style in Personal Narratives

Paperium

Oct 30

Formalizing Style in Personal Narratives

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LLM4Cell: A Survey of Large Language and Agentic Models for Single-Cell Biology

Paperium

Oct 30

LLM4Cell: A Survey of Large Language and Agentic Models for Single-Cell Biology

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Temporal Prompting Matters: Rethinking Referring Video Object Segmentation

Paperium

Oct 30

Temporal Prompting Matters: Rethinking Referring Video Object Segmentation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL

Paperium

Oct 30

ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Instant4D: 4D Gaussian Splatting in Minutes

Paperium

Oct 30

Instant4D: 4D Gaussian Splatting in Minutes

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

Paperium

Oct 30

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Diffusion Transformers with Representation Autoencoders

Paperium

Oct 30

Diffusion Transformers with Representation Autoencoders

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for OmniVideoBench: Towards Audio-Visual Understanding Evaluation for Omni MLLMs

Paperium

Oct 30

OmniVideoBench: Towards Audio-Visual Understanding Evaluation for Omni MLLMs

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Latent Refinement Decoding: Enhancing Diffusion-Based Language Models byRefining Belief States

Paperium

Oct 31

Latent Refinement Decoding: Enhancing Diffusion-Based Language Models byRefining Belief States

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for RLFR: Extending Reinforcement Learning for LLMs with Flow Environment

Paperium

Oct 31

RLFR: Extending Reinforcement Learning for LLMs with Flow Environment

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Spotlight on Token Perception for Multimodal Reinforcement Learning

Paperium

Oct 31

Spotlight on Token Perception for Multimodal Reinforcement Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for AVoCaDO: An Audiovisual Video Captioner Driven by Temporal Orchestration

Paperium

Oct 31

AVoCaDO: An Audiovisual Video Captioner Driven by Temporal Orchestration

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training

Paperium

Oct 31

DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Making Mathematical Reasoning Adaptive

Paperium

Oct 31

Making Mathematical Reasoning Adaptive

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Demystifying Reinforcement Learning in Agentic Reasoning

Paperium

Oct 31

Demystifying Reinforcement Learning in Agentic Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for InternSVG: Towards Unified SVG Tasks with Multimodal Large Language Models

Paperium

Oct 31

InternSVG: Towards Unified SVG Tasks with Multimodal Large Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Building a Foundational Guardrail for General Agentic Systems via Synthetic Data

Paperium

Oct 31

Building a Foundational Guardrail for General Agentic Systems via Synthetic Data

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ACADREASON: Exploring the Limits of Reasoning Models with Academic ResearchProblems

Paperium

Oct 31

ACADREASON: Exploring the Limits of Reasoning Models with Academic ResearchProblems

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions

Paperium

Oct 31

BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for FinAuditing: A Financial Taxonomy-Structured Multi-Document Benchmark forEvaluating LLMs

Paperium

Oct 31

FinAuditing: A Financial Taxonomy-Structured Multi-Document Benchmark forEvaluating LLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DocReward: A Document Reward Model for Structuring and Stylizing

Paperium

Oct 31

DocReward: A Document Reward Model for Structuring and Stylizing

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Don't Just Fine-tune the Agent, Tune the Environment

Paperium

Oct 31

Don't Just Fine-tune the Agent, Tune the Environment

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for GIR-Bench: Versatile Benchmark for Generating Images with Reasoning

Paperium

Oct 31

GIR-Bench: Versatile Benchmark for Generating Images with Reasoning

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for AdaViewPlanner: Adapting Video Diffusion Models for Viewpoint Planning in 4DScenes

Paperium

Oct 31

AdaViewPlanner: Adapting Video Diffusion Models for Viewpoint Planning in 4DScenes

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning

Paperium

Oct 31

Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models

Paperium

Oct 31

SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for CodePlot-CoT: Mathematical Visual Reasoning by Thinking with Code-Driven Images

Paperium

Oct 31

CodePlot-CoT: Mathematical Visual Reasoning by Thinking with Code-Driven Images

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for On Epistemic Uncertainty of Visual Tokens for Object Hallucinations in LargeVision-Language Models

Paperium

Oct 31

On Epistemic Uncertainty of Visual Tokens for Object Hallucinations in LargeVision-Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for High-Fidelity Simulated Data Generation for Real-World Zero-Shot RoboticManipulation Learning with Gaussian Splatting

Paperium

Oct 31

High-Fidelity Simulated Data Generation for Real-World Zero-Shot RoboticManipulation Learning with Gaussian Splatting

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Skill-Targeted Adaptive Training

Paperium

Nov 1

Skill-Targeted Adaptive Training

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ReLook: Vision-Grounded RL with a Multimodal LLM Critic for Agentic Web Coding

Paperium

Nov 1

ReLook: Vision-Grounded RL with a Multimodal LLM Critic for Agentic Web Coding

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for PEAR: Phase Entropy Aware Reward for Efficient Reasoning

Paperium

Nov 1

PEAR: Phase Entropy Aware Reward for Efficient Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Self-Improving LLM Agents at Test-Time

Paperium

Nov 1

Self-Improving LLM Agents at Test-Time

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for FastHMR: Accelerating Human Mesh Recovery via Token and Layer Merging withDiffusion Decoding

Paperium

Nov 1

FastHMR: Accelerating Human Mesh Recovery via Token and Layer Merging withDiffusion Decoding

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The Personalization Trap: How User Memory Alters Emotional Reasoning in LLMs

Paperium

Nov 1

The Personalization Trap: How User Memory Alters Emotional Reasoning in LLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Stable Video Infinity: Infinite-Length Video Generation with Error Recycling

Paperium

Nov 1

Stable Video Infinity: Infinite-Length Video Generation with Error Recycling

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LikePhys: Evaluating Intuitive Physics Understanding in Video Diffusion Modelsvia Likelihood Preference

Paperium

Nov 1

LikePhys: Evaluating Intuitive Physics Understanding in Video Diffusion Modelsvia Likelihood Preference

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for HUME: Measuring the Human-Model Performance Gap in Text Embedding Task

Paperium

Nov 1

HUME: Measuring the Human-Model Performance Gap in Text Embedding Task

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for SwarmSys: Decentralized Swarm-Inspired Agents for Scalable and AdaptiveReasoning

Paperium

Nov 1

SwarmSys: Decentralized Swarm-Inspired Agents for Scalable and AdaptiveReasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for From Data to Rewards: a Bilevel Optimization Perspective on Maximum LikelihoodEstimation

Paperium

Nov 1

From Data to Rewards: a Bilevel Optimization Perspective on Maximum LikelihoodEstimation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for InfiniHuman: Infinite 3D Human Creation with Precise Control

Paperium

Nov 1

InfiniHuman: Infinite 3D Human Creation with Precise Control

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LLaMAX2: Your Translation-Enhanced Model also Performs Well in Reasoning

Paperium

Nov 1

LLaMAX2: Your Translation-Enhanced Model also Performs Well in Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for World-To-Image: Grounding Text-to-Image Generation with Agent-Driven WorldKnowledge

Paperium

Nov 1

World-To-Image: Grounding Text-to-Image Generation with Agent-Driven WorldKnowledge

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for RePro: Training Language Models to Faithfully Recycle the Web for Pretraining

Paperium

Nov 1

RePro: Training Language Models to Faithfully Recycle the Web for Pretraining

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Multimodal Policy Internalization for Conversational Agents

Paperium

Nov 1

Multimodal Policy Internalization for Conversational Agents

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Graph Diffusion Transformers are In-Context Molecular Designers

Paperium

Nov 1

Graph Diffusion Transformers are In-Context Molecular Designers

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for VER: Vision Expert Transformer for Robot Learning via Foundation Distillationand Dynamic Routing

Paperium

Nov 1

VER: Vision Expert Transformer for Robot Learning via Foundation Distillationand Dynamic Routing

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for A Tale of LLMs and Induced Small Proxies: Scalable Agents for Knowledge Mining

Paperium

Nov 1

A Tale of LLMs and Induced Small Proxies: Scalable Agents for Knowledge Mining

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Are Large Reasoning Models Interruptible?

Paperium

Nov 1

Are Large Reasoning Models Interruptible?

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for IVEBench: Modern Benchmark Suite for Instruction-Guided Video Editing Assessment

Paperium

Nov 1

IVEBench: Modern Benchmark Suite for Instruction-Guided Video Editing Assessment

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for AndesVL Technical Report: An Efficient Mobile-side Multimodal Large LanguageModel

Paperium

Nov 2

AndesVL Technical Report: An Efficient Mobile-side Multimodal Large LanguageModel

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ViSurf: Visual Supervised-and-Reinforcement Fine-Tuning for LargeVision-and-Language Models

Paperium

Nov 2

ViSurf: Visual Supervised-and-Reinforcement Fine-Tuning for LargeVision-and-Language Models

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for The Hidden DNA of LLM-Generated JavaScript: Structural Patterns EnableHigh-Accuracy Authorship Attribution

Paperium

Nov 2

The Hidden DNA of LLM-Generated JavaScript: Structural Patterns EnableHigh-Accuracy Authorship Attribution

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for CoBia: Constructed Conversations Can Trigger Otherwise Concealed Societal Biasesin LLMs

Paperium

Nov 2

CoBia: Constructed Conversations Can Trigger Otherwise Concealed Societal Biasesin LLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The Attacker Moves Second: Stronger Adaptive Attacks Bypass Defenses Against LlmJailbreaks and Prompt Injections

Paperium

Nov 2

The Attacker Moves Second: Stronger Adaptive Attacks Bypass Defenses Against LlmJailbreaks and Prompt Injections

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-AwareAnnotation Pipeline for Terrestrial Point Cloud Segmen

Paperium

Nov 2

Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-AwareAnnotation Pipeline for Terrestrial Point Cloud Segmen

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The Curious Case of Factual (Mis)Alignment between LLMs' Short- and Long-FormAnswers

Paperium

Nov 2

The Curious Case of Factual (Mis)Alignment between LLMs' Short- and Long-FormAnswers

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for MultiCOIN: Multi-Modal COntrollable Video INbetweening

Paperium

Nov 2

MultiCOIN: Multi-Modal COntrollable Video INbetweening

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Pathology-CoT: Learning Visual Chain-of-Thought Agent from Expert Whole SlideImage Diagnosis Behavior

Paperium

Nov 2

Pathology-CoT: Learning Visual Chain-of-Thought Agent from Expert Whole SlideImage Diagnosis Behavior

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Attention Illuminates LLM Reasoning: The Preplan-and-Anchor Rhythm EnablesFine-Grained Policy Optimization

Paperium

Nov 2

Attention Illuminates LLM Reasoning: The Preplan-and-Anchor Rhythm EnablesFine-Grained Policy Optimization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for FlashWorld: High-quality 3D Scene Generation within Seconds

Paperium

Nov 2

FlashWorld: High-quality 3D Scene Generation within Seconds

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for CVD-STORM: Cross-View Video Diffusion with Spatial-Temporal Reconstruction Modelfor Autonomous Driving

Paperium

Nov 2

CVD-STORM: Cross-View Video Diffusion with Spatial-Temporal Reconstruction Modelfor Autonomous Driving

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for InteractiveOmni: A Unified Omni-modal Model for Audio-Visual Multi-turn Dialogue

Paperium

Nov 2

InteractiveOmni: A Unified Omni-modal Model for Audio-Visual Multi-turn Dialogue

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Generative Universal Verifier as Multimodal Meta-Reasoner

Paperium

Nov 2

Generative Universal Verifier as Multimodal Meta-Reasoner

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Bee: A High-Quality Corpus and Full-Stack Suite to Unlock Advanced Fully OpenMLLMs

Paperium

Nov 2

Bee: A High-Quality Corpus and Full-Stack Suite to Unlock Advanced Fully OpenMLLMs

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Trace Anything: Representing Any Video in 4D via Trajectory Fields

Paperium

Nov 2

Trace Anything: Representing Any Video in 4D via Trajectory Fields

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for ParallelBench: Understanding the Trade-offs of Parallel Decoding in DiffusionLLMs

Paperium

Nov 2

ParallelBench: Understanding the Trade-offs of Parallel Decoding in DiffusionLLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LIBERO-Plus: In-depth Robustness Analysis of Vision-Language-Action Models

Paperium

Nov 2

LIBERO-Plus: In-depth Robustness Analysis of Vision-Language-Action Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The Role of Computing Resources in Publishing Foundation Model Research

Paperium

Nov 2

The Role of Computing Resources in Publishing Foundation Model Research

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for UniME-V2: MLLM-as-a-Judge for Universal Multimodal Embedding Learning

Paperium

Nov 2

UniME-V2: MLLM-as-a-Judge for Universal Multimodal Embedding Learning

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Uni-MMMU: A Massive Multi-discipline Multimodal Unified Benchmark

Paperium

Nov 2

Uni-MMMU: A Massive Multi-discipline Multimodal Unified Benchmark

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for FG-CLIP 2: A Bilingual Fine-grained Vision-Language Alignment Model

Paperium

Nov 3

FG-CLIP 2: A Bilingual Fine-grained Vision-Language Alignment Model

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for PhysMaster: Mastering Physical Representation for Video Generation viaReinforcement Learning

Paperium

Nov 3

PhysMaster: Mastering Physical Representation for Video Generation viaReinforcement Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Revisiting Model Interpolation for Efficient Reasoning

Paperium

Nov 3

Revisiting Model Interpolation for Efficient Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for UniMoE-Audio: Unified Speech and Music Generation with Dynamic-Capacity MoE

Paperium

Nov 3

UniMoE-Audio: Unified Speech and Music Generation with Dynamic-Capacity MoE

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Direct Multi-Token Decoding

Paperium

Nov 3

Direct Multi-Token Decoding

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for NOSA: Native and Offloadable Sparse Attention

Paperium

Nov 3

NOSA: Native and Offloadable Sparse Attention

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for CoIRL-AD: Collaborative-Competitive Imitation-Reinforcement Learning in LatentWorld Models for Autonomous Driving

Paperium

Nov 3

CoIRL-AD: Collaborative-Competitive Imitation-Reinforcement Learning in LatentWorld Models for Autonomous Driving

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Hard2Verify: A Step-Level Verification Benchmark for Open-Ended Frontier Math

Paperium

Nov 3

Hard2Verify: A Step-Level Verification Benchmark for Open-Ended Frontier Math

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MTSQL-R1: Towards Long-Horizon Multi-Turn Text-to-SQL via Agentic Training

Paperium

Nov 3

MTSQL-R1: Towards Long-Horizon Multi-Turn Text-to-SQL via Agentic Training

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for HyperAgent: Leveraging Hypergraphs for Topology Optimization in Multi-AgentCommunication

Paperium

Nov 3

HyperAgent: Leveraging Hypergraphs for Topology Optimization in Multi-AgentCommunication

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for GraphTracer: Graph-Guided Failure Tracing in LLM Agents for Robust Multi-TurnDeep Search

Paperium

Nov 3

GraphTracer: Graph-Guided Failure Tracing in LLM Agents for Robust Multi-TurnDeep Search

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for InternVLA-M1: A Spatially Guided Vision-Language-Action Framework for GeneralistRobot Policy

Paperium

Nov 3

InternVLA-M1: A Spatially Guided Vision-Language-Action Framework for GeneralistRobot Policy

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Deflanderization for Game Dialogue: Balancing Character Authenticity with TaskExecution in LLM-based NPCs

Paperium

Nov 3

Deflanderization for Game Dialogue: Balancing Character Authenticity with TaskExecution in LLM-based NPCs

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Universal Image Restoration Pre-training via Masked Degradation Classification

Paperium

Nov 3

Universal Image Restoration Pre-training via Masked Degradation Classification

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for X-VLA: Soft-Prompted Transformer as Scalable Cross-EmbodimentVision-Language-Action Model

Paperium

Nov 3

X-VLA: Soft-Prompted Transformer as Scalable Cross-EmbodimentVision-Language-Action Model

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for WithAnyone: Towards Controllable and ID Consistent Image Generation

Paperium

Nov 3

WithAnyone: Towards Controllable and ID Consistent Image Generation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for From Pixels to Words -- Towards Native Vision-Language Primitives at Scale

Paperium

Nov 3

From Pixels to Words -- Towards Native Vision-Language Primitives at Scale

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Agentic Entropy-Balanced Policy Optimization

Paperium

Nov 3

Agentic Entropy-Balanced Policy Optimization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for AI for Service: Proactive Assistance with AI Glasses

Paperium

Nov 4

AI for Service: Proactive Assistance with AI Glasses

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Information Gain-based Policy Optimization: A Simple and Effective Approach forMulti-Turn LLM Agents

Paperium

Nov 4

Information Gain-based Policy Optimization: A Simple and Effective Approach forMulti-Turn LLM Agents

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-CompactVision-Language Model

Paperium

Nov 4

PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-CompactVision-Language Model

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Attention Is All You Need for KV Cache in Diffusion LLMs

Paperium

Nov 4

Attention Is All You Need for KV Cache in Diffusion LLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Nov 4

BitNet Distillation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for TokDrift: When LLM Speaks in Subwords but Code Speaks in Grammar

Paperium

Nov 6

TokDrift: When LLM Speaks in Subwords but Code Speaks in Grammar

#ai #deeplearning #computerscience #machinelearning

1

2 min read

Cover image for LLM-guided Hierarchical Retrieval

Paperium

Nov 6

LLM-guided Hierarchical Retrieval

#ai #deeplearning #computerscience #machinelearning

1

1 min read

Cover image for Qwen3Guard Technical Report

Paperium

Nov 6

Qwen3Guard Technical Report

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Large Language Models Do NOT Really Know What They Don't Know

Paperium

Nov 6

Large Language Models Do NOT Really Know What They Don't Know

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Learning an Image Editing Model without Image Editing Pairs

Paperium

Nov 6

Learning an Image Editing Model without Image Editing Pairs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for VIST3A: Text-to-3D by Stitching a Multi-view Reconstruction Network to a VideoGenerator

Paperium

Nov 6

VIST3A: Text-to-3D by Stitching a Multi-view Reconstruction Network to a VideoGenerator

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for pi-Flow: Policy-Based Few-Step Generation via Imitation Distillation

Paperium

Nov 6

pi-Flow: Policy-Based Few-Step Generation via Imitation Distillation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MathCanvas: Intrinsic Visual Chain-of-Thought for Multimodal MathematicalReasoning

Paperium

Nov 7

MathCanvas: Intrinsic Visual Chain-of-Thought for Multimodal MathematicalReasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Fantastic (small) Retrievers and How to Train Them: mxbai-edge-colbert-v0 TechReport

Paperium

Nov 7

Fantastic (small) Retrievers and How to Train Them: mxbai-edge-colbert-v0 TechReport

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Expertise need not monopolize: Action-Specialized Mixture of Experts forVision-Language-Action Learning

Paperium

Nov 7

Expertise need not monopolize: Action-Specialized Mixture of Experts forVision-Language-Action Learning

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for MoM: Mixtures of Scenario-Aware Document Memories for Retrieval-AugmentedGeneration Systems

Paperium

Nov 7

MoM: Mixtures of Scenario-Aware Document Memories for Retrieval-AugmentedGeneration Systems

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for RefusalBench: Generative Evaluation of Selective Refusal in Grounded LanguageModels

Paperium

Nov 7

RefusalBench: Generative Evaluation of Selective Refusal in Grounded LanguageModels

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Ponimator: Unfolding Interactive Pose for Versatile Human-human InteractionAnimation

Paperium

Nov 7

Ponimator: Unfolding Interactive Pose for Versatile Human-human InteractionAnimation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Beyond One World: Benchmarking Super Heros in Role-Playing Across MultiversalContexts

Paperium

Nov 7

Beyond One World: Benchmarking Super Heros in Role-Playing Across MultiversalContexts

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for When Models Lie, We Learn: Multilingual Span-Level Hallucination Detection withPsiloQA

Paperium

Nov 7

When Models Lie, We Learn: Multilingual Span-Level Hallucination Detection withPsiloQA

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond SemanticDependency Constraints

Paperium

Nov 7

ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond SemanticDependency Constraints

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for COIG-Writer: A High-Quality Dataset for Chinese Creative Writing with ThoughtProcesses

Paperium

Nov 7

COIG-Writer: A High-Quality Dataset for Chinese Creative Writing with ThoughtProcesses

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for VLA^2: Empowering Vision-Language-Action Models with an Agentic Framework forUnseen Concept Manipulation

Paperium

Nov 7

VLA^2: Empowering Vision-Language-Action Models with an Agentic Framework forUnseen Concept Manipulation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Beyond Correctness: Evaluating Subjective Writing Preferences Across Cultures

Paperium

Nov 7

Beyond Correctness: Evaluating Subjective Writing Preferences Across Cultures

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Nov 7

LLMs Can Get Brain Rot!

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LiveResearchBench: A Live Benchmark for User-Centric Deep Research in the Wild

Paperium

Nov 7

LiveResearchBench: A Live Benchmark for User-Centric Deep Research in the Wild

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Agentic Design of Compositional Machines

Paperium

Nov 7

Agentic Design of Compositional Machines

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for VLA-0: Building State-of-the-Art VLAs with Zero Modification

Paperium

Nov 7

VLA-0: Building State-of-the-Art VLAs with Zero Modification

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for SimKO: Simple Pass@K Policy Optimization

Paperium

Nov 7

SimKO: Simple Pass@K Policy Optimization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LLMs as Scalable, General-Purpose Simulators For Evolving Digital Agent Training

Paperium

Nov 7

LLMs as Scalable, General-Purpose Simulators For Evolving Digital Agent Training

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DialectGen: Benchmarking and Improving Dialect Robustness in MultimodalGeneration

Paperium

Nov 8

DialectGen: Benchmarking and Improving Dialect Robustness in MultimodalGeneration

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for LiteStage: Latency-aware Layer Skipping for Multi-stage Reasoning

Paperium

Nov 8

LiteStage: Latency-aware Layer Skipping for Multi-stage Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Efficient Parallel Samplers for Recurrent-Depth Models and Their Connection toDiffusion Language Models

Paperium

Nov 8

Efficient Parallel Samplers for Recurrent-Depth Models and Their Connection toDiffusion Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for RealDPO: Real or Not Real, that is the Preference

Paperium

Nov 8

RealDPO: Real or Not Real, that is the Preference

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The German Commons - 154 Billion Tokens of Openly Licensed Text for GermanLanguage Models

Paperium

Nov 8

The German Commons - 154 Billion Tokens of Openly Licensed Text for GermanLanguage Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for On Pretraining for Project-Level Code Completion

Paperium

Nov 8

On Pretraining for Project-Level Code Completion

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Budget-aware Test-time Scaling via Discriminative Verification

Paperium

Nov 8

Budget-aware Test-time Scaling via Discriminative Verification

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for FML-bench: A Benchmark for Automatic ML Research Agents Highlighting theImportance of Exploration Breadth

Paperium

Nov 8

FML-bench: A Benchmark for Automatic ML Research Agents Highlighting theImportance of Exploration Breadth

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Predicting Task Performance with Context-aware Scaling Laws

Paperium

Nov 8

Predicting Task Performance with Context-aware Scaling Laws

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Synthesizing Agentic Data for Web Agents with Progressive Difficulty EnhancementMechanisms

Paperium

Nov 8

Synthesizing Agentic Data for Web Agents with Progressive Difficulty EnhancementMechanisms

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for AnyUp: Universal Feature Upsampling

Paperium

Nov 8

AnyUp: Universal Feature Upsampling

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for SCas4D: Structural Cascaded Optimization for Boosting Persistent 4D Novel ViewSynthesis

Paperium

Nov 8

SCas4D: Structural Cascaded Optimization for Boosting Persistent 4D Novel ViewSynthesis

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for GroundedPRM: Tree-Guided and Fidelity-Aware Process Reward Modeling forStep-Level Reasoning

Paperium

Nov 8

GroundedPRM: Tree-Guided and Fidelity-Aware Process Reward Modeling forStep-Level Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Unlocking Out-of-Distribution Generalization in Transformers via RecursiveLatent Space Reasoning

Paperium

Nov 8

Unlocking Out-of-Distribution Generalization in Transformers via RecursiveLatent Space Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for RAGCap-Bench: Benchmarking Capabilities of LLMs in Agentic Retrieval AugmentedGeneration Systems

Paperium

Nov 8

RAGCap-Bench: Benchmarking Capabilities of LLMs in Agentic Retrieval AugmentedGeneration Systems

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Mirror Speculative Decoding: Breaking the Serial Barrier in LLM Inference

Paperium

Nov 8

Mirror Speculative Decoding: Breaking the Serial Barrier in LLM Inference

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LaSeR: Reinforcement Learning with Last-Token Self-Rewarding

Paperium

Nov 8

LaSeR: Reinforcement Learning with Last-Token Self-Rewarding

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLM

Paperium

Nov 8

OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLM

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks

Paperium

Nov 8

NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Scaling Instruction-Based Video Editing with a High-Quality Synthetic Dataset

Paperium

Nov 8

Scaling Instruction-Based Video Editing with a High-Quality Synthetic Dataset

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery

Paperium

Nov 8

Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Latent Diffusion Model without Variational Autoencoder

Paperium

Nov 9

Latent Diffusion Model without Variational Autoencoder

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LightsOut: Diffusion-based Outpainting for Enhanced Lens Flare Removal

Paperium

Nov 9

LightsOut: Diffusion-based Outpainting for Enhanced Lens Flare Removal

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MorphoBench: A Benchmark with Difficulty Adaptive to Model Reasoning

Paperium

Nov 9

MorphoBench: A Benchmark with Difficulty Adaptive to Model Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A^2FM: An Adaptive Agent Foundation Model for Tool-Aware Hybrid Reasoning

Paperium

Nov 9

A^2FM: An Adaptive Agent Foundation Model for Tool-Aware Hybrid Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for BLIP3o-NEXT: Next Frontier of Native Image Generation

Paperium

Nov 9

BLIP3o-NEXT: Next Frontier of Native Image Generation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Language Models Model Language

Paperium

Nov 9

Language Models Model Language

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for InfiMed-ORBIT: Aligning LLMs on Open-Ended Complex Tasks via Rubric-BasedIncremental Training

Paperium

Nov 9

InfiMed-ORBIT: Aligning LLMs on Open-Ended Complex Tasks via Rubric-BasedIncremental Training

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Imaginarium: Vision-guided High-Quality 3D Scene Layout Generation

Paperium

Nov 9

Imaginarium: Vision-guided High-Quality 3D Scene Layout Generation

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Explore to Evolve: Scaling Evolved Aggregation Logic via Proactive OnlineExploration for Deep Research Agents

Paperium

Nov 9

Explore to Evolve: Scaling Evolved Aggregation Logic via Proactive OnlineExploration for Deep Research Agents

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Foundation Models for Scientific Discovery: From Paradigm Enhancement toParadigm Transition

Paperium

Nov 9

Foundation Models for Scientific Discovery: From Paradigm Enhancement toParadigm Transition

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for VISTA: A Test-Time Self-Improving Video Generation Agent

Paperium

Nov 9

VISTA: A Test-Time Self-Improving Video Generation Agent

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DLER: Doing Length pEnalty Right - Incentivizing More Intelligence per Token viaReinforcement Learning

Paperium

Nov 9

DLER: Doing Length pEnalty Right - Incentivizing More Intelligence per Token viaReinforcement Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Emergent Misalignment via In-Context Learning: Narrow in-context examples canproduce broadly misaligned LLMs

Paperium

Nov 9

Emergent Misalignment via In-Context Learning: Narrow in-context examples canproduce broadly misaligned LLMs

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Build Your Personalized Research Group: A Multiagent Framework for Continual andInteractive Science Automation

Paperium

Nov 9

Build Your Personalized Research Group: A Multiagent Framework for Continual andInteractive Science Automation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for FinTrust: A Comprehensive Benchmark of Trustworthiness Evaluation in FinanceDomain

Paperium

Nov 9

FinTrust: A Comprehensive Benchmark of Trustworthiness Evaluation in FinanceDomain

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Robust Layerwise Scaling Rules by Proper Weight Decay Tuning

Paperium

Nov 9

Robust Layerwise Scaling Rules by Proper Weight Decay Tuning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Rewiring Experts on the Fly:Continuous Rerouting for Better Online Adaptation inMixture-of-Expert models

Paperium

Nov 9

Rewiring Experts on the Fly:Continuous Rerouting for Better Online Adaptation inMixture-of-Expert models

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Paper2Web: Let's Make Your Paper Alive!

Paperium

Nov 9

Paper2Web: Let's Make Your Paper Alive!

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Train a Unified Multimodal Data Quality Classifier with Synthetic Data

Paperium

Nov 9

Train a Unified Multimodal Data Quality Classifier with Synthetic Data

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for PICABench: How Far Are We from Physically Realistic Image Editing?

Paperium

Nov 9

PICABench: How Far Are We from Physically Realistic Image Editing?

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DeepAnalyze: Agentic Large Language Models for Autonomous Data Science

Paperium

Nov 9

DeepAnalyze: Agentic Large Language Models for Autonomous Data Science

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Glyph: Scaling Context Windows via Visual-Text Compression

Paperium

Nov 10

Glyph: Scaling Context Windows via Visual-Text Compression

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Towards Mixed-Modal Retrieval for Universal Retrieval-Augmented Generation

Paperium

Nov 10

Towards Mixed-Modal Retrieval for Universal Retrieval-Augmented Generation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for When to Ensemble: Identifying Token-Level Points for Stable and Fast LLMEnsembling

Paperium

Nov 10

When to Ensemble: Identifying Token-Level Points for Stable and Fast LLMEnsembling

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for FineVision: Open Data Is All You Need

Paperium

Nov 10

FineVision: Open Data Is All You Need

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for QueST: Incentivizing LLMs to Generate Difficult Problems

Paperium

Nov 10

QueST: Incentivizing LLMs to Generate Difficult Problems

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Visual Autoregressive Models Beat Diffusion Models on Inference Time Scaling

Paperium

Nov 10

Visual Autoregressive Models Beat Diffusion Models on Inference Time Scaling

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for RL makes MLLMs see better than SFT

Paperium

Nov 10

RL makes MLLMs see better than SFT

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Annotation-Efficient Universal Honesty Alignment

Paperium

Nov 10

Annotation-Efficient Universal Honesty Alignment

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Uniworld-V2: Reinforce Image Editing with Diffusion Negative-aware Finetuningand MLLM Implicit Feedback

Paperium

Nov 10

Uniworld-V2: Reinforce Image Editing with Diffusion Negative-aware Finetuningand MLLM Implicit Feedback

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ConsistEdit: Highly Consistent and Precise Training-free Visual Editing

Paperium

Nov 10

ConsistEdit: Highly Consistent and Precise Training-free Visual Editing

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Executable Knowledge Graphs for Replicating AI Research

Paperium

Nov 10

Executable Knowledge Graphs for Replicating AI Research

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Deep Self-Evolving Reasoning

Paperium

Nov 10

Deep Self-Evolving Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Chronos-2: From Univariate to Universal Forecasting

Paperium

Nov 10

Chronos-2: From Univariate to Universal Forecasting

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Beyond Pipelines: A Survey of the Paradigm Shift toward Model-Native Agentic AI

Paperium

Nov 10

Beyond Pipelines: A Survey of the Paradigm Shift toward Model-Native Agentic AI

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Constantly Improving Image Models Need Constantly Improving Benchmarks

Paperium

Nov 10

Constantly Improving Image Models Need Constantly Improving Benchmarks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Enterprise Deep Research: Steerable Multi-Agent Deep Research for EnterpriseAnalytics

Paperium

Nov 10

Enterprise Deep Research: Steerable Multi-Agent Deep Research for EnterpriseAnalytics

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for UltraCUA: A Foundation Model for Computer Use Agents with Hybrid Action

Paperium

Nov 10

UltraCUA: A Foundation Model for Computer Use Agents with Hybrid Action

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Agentic Reinforcement Learning for Search is Unsafe

Paperium

Nov 10

Agentic Reinforcement Learning for Search is Unsafe

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Distractor Injection Attacks on Large Reasoning Models: Characterization andDefense

Paperium

Nov 10

Distractor Injection Attacks on Large Reasoning Models: Characterization andDefense

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Embody 3D: A Large-scale Multimodal Motion and Behavior Dataset

Paperium

Nov 10

Embody 3D: A Large-scale Multimodal Motion and Behavior Dataset

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Knowledge-based Visual Question Answer with Multimodal Processing, Retrieval andFiltering

Paperium

Nov 11

Knowledge-based Visual Question Answer with Multimodal Processing, Retrieval andFiltering

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Foundational Automatic Evaluators: Scaling Multi-Task Generative EvaluatorTraining for Reasoning-Centric Domains

Paperium

Nov 11

Foundational Automatic Evaluators: Scaling Multi-Task Generative EvaluatorTraining for Reasoning-Centric Domains

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MultiVerse: A Multi-Turn Conversation Benchmark for Evaluating Large Vision andLanguage Models

Paperium

Nov 11

MultiVerse: A Multi-Turn Conversation Benchmark for Evaluating Large Vision andLanguage Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Balanced Multi-Task Attention for Satellite Image Classification: A SystematicApproach to Achieving 97.23% Accuracy on EuroSAT W

Paperium

Nov 11

Balanced Multi-Task Attention for Satellite Image Classification: A SystematicApproach to Achieving 97.23% Accuracy on EuroSAT W

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Beacon: Single-Turn Diagnosis and Mitigation of Latent Sycophancy in LargeLanguage Models

Paperium

Nov 11

Beacon: Single-Turn Diagnosis and Mitigation of Latent Sycophancy in LargeLanguage Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Automated Composition of Agents: A Knapsack Approach for Agentic ComponentSelection

Paperium

Nov 11

Automated Composition of Agents: A Knapsack Approach for Agentic ComponentSelection

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for AsyncVoice Agent: Real-Time Explanation for LLM Planning and Reasoning

Paperium

Nov 11

AsyncVoice Agent: Real-Time Explanation for LLM Planning and Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for On Non-interactive Evaluation of Animal Communication Translators

Paperium

Nov 11

On Non-interactive Evaluation of Animal Communication Translators

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for GuideFlow3D: Optimization-Guided Rectified Flow For Appearance Transfer

Paperium

Nov 11

GuideFlow3D: Optimization-Guided Rectified Flow For Appearance Transfer

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Test-Time Scaling of Reasoning Models for Machine Translation

Paperium

Nov 11

Test-Time Scaling of Reasoning Models for Machine Translation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for What Limits Agentic Systems Efficiency?

Paperium

Nov 11

What Limits Agentic Systems Efficiency?

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LightMem: Lightweight and Efficient Memory-Augmented Generation

Paperium

Nov 11

LightMem: Lightweight and Efficient Memory-Augmented Generation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for World-in-World: World Models in a Closed-Loop World

Paperium

Nov 11

World-in-World: World Models in a Closed-Loop World

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for UniGenBench++: A Unified Semantic Evaluation Benchmark for Text-to-ImageGeneration

Paperium

Nov 11

UniGenBench++: A Unified Semantic Evaluation Benchmark for Text-to-ImageGeneration

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Chem-R: Learning to Reason as a Chemist

Paperium

Nov 11

Chem-R: Learning to Reason as a Chemist

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MoGA: Mixture-of-Groups Attention for End-to-End Long Video Generation

Paperium

Nov 11

MoGA: Mixture-of-Groups Attention for End-to-End Long Video Generation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Grasp Any Region: Towards Precise, Contextual Pixel Understanding for MultimodalLLMs

Paperium

Nov 11

Grasp Any Region: Towards Precise, Contextual Pixel Understanding for MultimodalLLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for IF-VidCap: Can Video Caption Models Follow Instructions?

Paperium

Nov 11

IF-VidCap: Can Video Caption Models Follow Instructions?

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for MT-Video-Bench: A Holistic Video Understanding Benchmark for EvaluatingMultimodal LLMs in Multi-Turn Dialogues

Paperium

Nov 11

MT-Video-Bench: A Holistic Video Understanding Benchmark for EvaluatingMultimodal LLMs in Multi-Turn Dialogues

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning

Paperium

Nov 11

ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ProCLIP: Progressive Vision-Language Alignment via LLM-based Embedder

Paperium

Nov 11

ProCLIP: Progressive Vision-Language Alignment via LLM-based Embedder

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MUG-V 10B: High-efficiency Training Pipeline for Large Video Generation Models

Paperium

Nov 12

MUG-V 10B: High-efficiency Training Pipeline for Large Video Generation Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DSI-Bench: A Benchmark for Dynamic Spatial Intelligence

Paperium

Nov 12

DSI-Bench: A Benchmark for Dynamic Spatial Intelligence

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for UltraGen: High-Resolution Video Generation with Hierarchical Attention

Paperium

Nov 12

UltraGen: High-Resolution Video Generation with Hierarchical Attention

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Video Reasoning without Training

Paperium

Nov 12

Video Reasoning without Training

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Mono4DGS-HDR: High Dynamic Range 4D Gaussian Splatting from Alternating-exposureMonocular Videos

Paperium

Nov 12

Mono4DGS-HDR: High Dynamic Range 4D Gaussian Splatting from Alternating-exposureMonocular Videos

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for PRISMM-Bench: A Benchmark of Peer-Review Grounded Multimodal Inconsistencies

Paperium

Nov 12

PRISMM-Bench: A Benchmark of Peer-Review Grounded Multimodal Inconsistencies

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for AlphaQuanter: An End-to-End Tool-Orchestrated Agentic Reinforcement LearningFramework for Stock Trading

Paperium

Nov 12

AlphaQuanter: An End-to-End Tool-Orchestrated Agentic Reinforcement LearningFramework for Stock Trading

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Extracting alignment data in open models

Paperium

Nov 12

Extracting alignment data in open models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for EvoSyn: Generalizable Evolutionary Data Synthesis for Verifiable Learning

Paperium

Nov 12

EvoSyn: Generalizable Evolutionary Data Synthesis for Verifiable Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Efficient Long-context Language Model Training by Core Attention Disaggregation

Paperium

Nov 12

Efficient Long-context Language Model Training by Core Attention Disaggregation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for GAS: Improving Discretization of Diffusion ODEs via Generalized AdversarialSolver

Paperium

Nov 12

GAS: Improving Discretization of Diffusion ODEs via Generalized AdversarialSolver

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Is Multilingual LLM Watermarking Truly Multilingual? A Simple Back-TranslationSolution

Paperium

Nov 12

Is Multilingual LLM Watermarking Truly Multilingual? A Simple Back-TranslationSolution

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DeepSeek-OCR: Contexts Optical Compression

Paperium

Nov 12

DeepSeek-OCR: Contexts Optical Compression

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Think with 3D: Geometric Imagination Grounded Spatial Reasoning from LimitedViews

Paperium

Nov 12

Think with 3D: Geometric Imagination Grounded Spatial Reasoning from LimitedViews

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Any-Depth Alignment: Unlocking Innate Safety Alignment of LLMs to Any-Depth

Paperium

Nov 12

Any-Depth Alignment: Unlocking Innate Safety Alignment of LLMs to Any-Depth

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Expanding the Action Space of LLMs to Reason Beyond Language

Paperium

Nov 12

Expanding the Action Space of LLMs to Reason Beyond Language

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Nov 12

Planned Diffusion

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Unimedvl: Unifying Medical Multimodal Understanding And Generation ThroughObservation-Knowledge-Analysis

Paperium

Nov 12

Unimedvl: Unifying Medical Multimodal Understanding And Generation ThroughObservation-Knowledge-Analysis

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Predicting the Unpredictable: Reproducible BiLSTM Forecasting of Incident Countsin the Global Terrorism Database (GTD)

Paperium

Nov 12

Predicting the Unpredictable: Reproducible BiLSTM Forecasting of Incident Countsin the Global Terrorism Database (GTD)

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Static Sandboxes Are Inadequate: Modeling Societal Complexity RequiresOpen-Ended Co-Evolution in LLM-Based Multi-Agent Simulatio

Paperium

Nov 12

Static Sandboxes Are Inadequate: Modeling Societal Complexity RequiresOpen-Ended Co-Evolution in LLM-Based Multi-Agent Simulatio

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for PokeeResearch: Effective Deep Research via Reinforcement Learning from AIFeedback and Robust Reasoning Scaffold

Paperium

Nov 12

PokeeResearch: Effective Deep Research via Reinforcement Learning from AIFeedback and Robust Reasoning Scaffold

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Pruning Overparameterized Multi-Task Networks for Degraded Web Image Restoration

Paperium

Nov 13

Pruning Overparameterized Multi-Task Networks for Degraded Web Image Restoration

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for When Correct Is Not Safe: Can We Trust Functionally Correct Patches Generatedby Code Agents?

Paperium

Nov 13

When Correct Is Not Safe: Can We Trust Functionally Correct Patches Generatedby Code Agents?

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LoongRL:Reinforcement Learning for Advanced Reasoning over Long Contexts

Paperium

Nov 13

LoongRL:Reinforcement Learning for Advanced Reasoning over Long Contexts

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Every Attention Matters: An Efficient Hybrid Architecture for Long-ContextReasoning

Paperium

Nov 13

Every Attention Matters: An Efficient Hybrid Architecture for Long-ContextReasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced PolicyOptimization with Adaptive Clipping

Paperium

Nov 13

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced PolicyOptimization with Adaptive Clipping

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DaMo: Data Mixing Optimizer in Fine-tuning Multimodal LLMs for Mobile PhoneAgents

Paperium

Nov 13

DaMo: Data Mixing Optimizer in Fine-tuning Multimodal LLMs for Mobile PhoneAgents

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for GigaBrain-0: A World Model-Powered Vision-Language-Action Model

Paperium

Nov 13

GigaBrain-0: A World Model-Powered Vision-Language-Action Model

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ImpossibleBench: Measuring LLMs' Propensity of Exploiting Test Cases

Paperium

Nov 13

ImpossibleBench: Measuring LLMs' Propensity of Exploiting Test Cases

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Human-Agent Collaborative Paper-to-Page Crafting for Under $0.1

Paperium

Nov 13

Human-Agent Collaborative Paper-to-Page Crafting for Under $0.1

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Towards Faithful and Controllable Personalization via Critique-Post-EditReinforcement Learning

Paperium

Nov 13

Towards Faithful and Controllable Personalization via Critique-Post-EditReinforcement Learning

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for VideoAgentTrek: Computer Use Pretraining from Unlabeled Videos

Paperium

Nov 13

VideoAgentTrek: Computer Use Pretraining from Unlabeled Videos

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing

Paperium

Nov 13

Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Language Models are Injective and Hence Invertible

Paperium

Nov 13

Language Models are Injective and Hence Invertible

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Attention Sinks in Diffusion Language Models

Paperium

Nov 13

Attention Sinks in Diffusion Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Unified Reinforcement and Imitation Learning for Vision-Language Models

Paperium

Nov 13

Unified Reinforcement and Imitation Learning for Vision-Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for olmOCR 2: Unit Test Rewards for Document OCR

Paperium

Nov 13

olmOCR 2: Unit Test Rewards for Document OCR

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Decomposed Attention Fusion in MLLMs for Training-Free Video ReasoningSegmentation

Paperium

Nov 13

Decomposed Attention Fusion in MLLMs for Training-Free Video ReasoningSegmentation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for FinSight: Towards Real-World Financial Deep Research

Paperium

Nov 13

FinSight: Towards Real-World Financial Deep Research

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Directional Reasoning Injection for Fine-Tuning MLLMs

Paperium

Nov 13

Directional Reasoning Injection for Fine-Tuning MLLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for KORE: Enhancing Knowledge Injection for Large Multimodal Models viaKnowledge-Oriented Augmentations and Constraints

Paperium

Nov 13

KORE: Enhancing Knowledge Injection for Large Multimodal Models viaKnowledge-Oriented Augmentations and Constraints

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Are they lovers or friends? Evaluating LLMs' Social Reasoning in English andKorean Dialogues

Paperium

Nov 13

Are they lovers or friends? Evaluating LLMs' Social Reasoning in English andKorean Dialogues

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for OmniNWM: Omniscient Driving Navigation World Models

Paperium

Nov 14

OmniNWM: Omniscient Driving Navigation World Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ColorAgent: Building A Robust, Personalized, and Interactive OS Agent

Paperium

Nov 14

ColorAgent: Building A Robust, Personalized, and Interactive OS Agent

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for TheMCPCompany: Creating General-purpose Agents with Task-specific Tools

Paperium

Nov 14

TheMCPCompany: Creating General-purpose Agents with Task-specific Tools

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for NeuroAda: Activating Each Neuron's Potential for Parameter-Efficient Fine-Tuning

Paperium

Nov 14

NeuroAda: Activating Each Neuron's Potential for Parameter-Efficient Fine-Tuning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for From Charts to Code: A Hierarchical Benchmark for Multimodal Models

Paperium

Nov 14

From Charts to Code: A Hierarchical Benchmark for Multimodal Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MINED: Probing and Updating with Multimodal Time-Sensitive Knowledge for LargeMultimodal Models

Paperium

Nov 14

MINED: Probing and Updating with Multimodal Time-Sensitive Knowledge for LargeMultimodal Models

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Steering Autoregressive Music Generation with Recursive Feature Machines

Paperium

Nov 14

Steering Autoregressive Music Generation with Recursive Feature Machines

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ProfBench: Multi-Domain Rubrics requiring Professional Knowledge to Answer andJudge

Paperium

Nov 14

ProfBench: Multi-Domain Rubrics requiring Professional Knowledge to Answer andJudge

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Learning from the Best, Differently: A Diversity-Driven Rethinking on DataSelection

Paperium

Nov 14

Learning from the Best, Differently: A Diversity-Driven Rethinking on DataSelection

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for When Do Transformers Learn Heuristics for Graph Connectivity?

Paperium

Nov 14

When Do Transformers Learn Heuristics for Graph Connectivity?

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for See the Text: From Tokenization to Visual Reading

Paperium

Nov 14

See the Text: From Tokenization to Visual Reading

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for RIR-Mega: a large-scale simulated room impulse response dataset for machinelearning and room acoustics modeling

Paperium

Nov 14

RIR-Mega: a large-scale simulated room impulse response dataset for machinelearning and room acoustics modeling

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for What Questions Should Robots Be Able to Answer? A Dataset of User Questions forExplainable Robotics

Paperium

Nov 14

What Questions Should Robots Be Able to Answer? A Dataset of User Questions forExplainable Robotics

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for DeLeaker: Dynamic Inference-Time Reweighting For Semantic Leakage Mitigation inText-to-Image Models

Paperium

Nov 14

DeLeaker: Dynamic Inference-Time Reweighting For Semantic Leakage Mitigation inText-to-Image Models

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Machine Text Detectors are Membership Inference Attacks

Paperium

Nov 14

Machine Text Detectors are Membership Inference Attacks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for SAVANT: Semantic Analysis with Vision-Augmented Anomaly deTection

Paperium

Nov 14

SAVANT: Semantic Analysis with Vision-Augmented Anomaly deTection

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Accelerating Vision Transformers with Adaptive Patch Sizes

Paperium

Nov 14

Accelerating Vision Transformers with Adaptive Patch Sizes

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Text or Pixels? It Takes Half: On the Token Efficiency of Visual Text Inputs inMultimodal LLMs

Paperium

Nov 14

Text or Pixels? It Takes Half: On the Token Efficiency of Visual Text Inputs inMultimodal LLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DeepWideSearch: Benchmarking Depth and Width in Agentic Information Seeking

Paperium

Nov 14

DeepWideSearch: Benchmarking Depth and Width in Agentic Information Seeking

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for HSCodeComp: A Realistic and Expert-level Benchmark for Deep Search Agents inHierarchical Rule Application

Paperium

Nov 15

HSCodeComp: A Realistic and Expert-level Benchmark for Deep Search Agents inHierarchical Rule Application

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Loopholing Discrete Diffusion: Deterministic Bypass of the Sampling Wall

Paperium

Dec 15

Loopholing Discrete Diffusion: Deterministic Bypass of the Sampling Wall

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

Paperium

Dec 15

Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Every Question Has Its Own Value: Reinforcement Learning with Explicit HumanValues

Paperium

Dec 15

Every Question Has Its Own Value: Reinforcement Learning with Explicit HumanValues

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for HoloCine: Holistic Generation of Cinematic Multi-Shot Long Video Narratives

Paperium

Dec 15

HoloCine: Holistic Generation of Cinematic Multi-Shot Long Video Narratives

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LayerComposer: Interactive Personalized T2I via Spatially-Aware Layered Canvas

Paperium

Dec 15

LayerComposer: Interactive Personalized T2I via Spatially-Aware Layered Canvas

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for AlphaFlow: Understanding and Improving MeanFlow Models

Paperium

Dec 15

AlphaFlow: Understanding and Improving MeanFlow Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ARGenSeg: Image Segmentation with Autoregressive Image Generation Model

Paperium

Dec 15

ARGenSeg: Image Segmentation with Autoregressive Image Generation Model

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Conan: Progressive Learning to Reason Like a Detective over Multi-Scale VisualEvidence

Paperium

Dec 15

Conan: Progressive Learning to Reason Like a Detective over Multi-Scale VisualEvidence

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The Massive Legal Embedding Benchmark (MLEB)

Paperium

Dec 15

The Massive Legal Embedding Benchmark (MLEB)

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for AdaSPEC: Selective Knowledge Distillation for Efficient Speculative Decoders

Paperium

Dec 16

AdaSPEC: Selective Knowledge Distillation for Efficient Speculative Decoders

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion

Paperium

Dec 16

DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Search Self-play: Pushing the Frontier of Agent Capability without Supervision

Paperium

Dec 16

Search Self-play: Pushing the Frontier of Agent Capability without Supervision

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Emergence of Linear Truth Encodings in Language Models

Paperium

Dec 16

Emergence of Linear Truth Encodings in Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for From Masks to Worlds: A Hitchhiker's Guide to World Models

Paperium

Dec 16

From Masks to Worlds: A Hitchhiker's Guide to World Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Seed3D 1.0: From Images to High-Fidelity Simulation-Ready 3D Assets

Paperium

Dec 16

Seed3D 1.0: From Images to High-Fidelity Simulation-Ready 3D Assets

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Thought Communication in Multiagent Collaboration

Paperium

Dec 16

Thought Communication in Multiagent Collaboration

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for AlphaOPT: Formulating Optimization Programs with Self-Improving LLM ExperienceLibrary

Paperium

Dec 16

AlphaOPT: Formulating Optimization Programs with Self-Improving LLM ExperienceLibrary

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for SAKE: Towards Editing Auditory Attribute Knowledge of Large Audio-LanguageModels

Paperium

Dec 16

SAKE: Towards Editing Auditory Attribute Knowledge of Large Audio-LanguageModels

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Investigating Safety Vulnerabilities of Large Audio-Language Models UnderSpeaker Emotional Variations

Paperium

Dec 16

Investigating Safety Vulnerabilities of Large Audio-Language Models UnderSpeaker Emotional Variations

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Diff-XYZ: A Benchmark for Evaluating Diff Understanding

Paperium

Dec 16

Diff-XYZ: A Benchmark for Evaluating Diff Understanding

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for CiteGuard: Faithful Citation Attribution for LLMs via Retrieval-AugmentedValidation

Paperium

Dec 16

CiteGuard: Faithful Citation Attribution for LLMs via Retrieval-AugmentedValidation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Scaling Laws Meet Model Architecture: Toward Inference-Efficient LLMs

Paperium

Dec 16

Scaling Laws Meet Model Architecture: Toward Inference-Efficient LLMs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Communication to Completion: Modeling Collaborative Workflows with IntelligentMulti-Agent Communication

Paperium

Dec 16

Communication to Completion: Modeling Collaborative Workflows with IntelligentMulti-Agent Communication

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Adamas: Hadamard Sparse Attention for Efficient Long-Context Inference

Paperium

Dec 16

Adamas: Hadamard Sparse Attention for Efficient Long-Context Inference

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Long-Context Attention Benchmark: From Kernel Efficiency to Distributed ContextParallelism

Paperium

Dec 16

Long-Context Attention Benchmark: From Kernel Efficiency to Distributed ContextParallelism

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ComProScanner: A multi-agent based framework for composition-property structureddata extraction from scientific literature

Paperium

Dec 17

ComProScanner: A multi-agent based framework for composition-property structureddata extraction from scientific literature

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MSC-Bench: A Rigorous Benchmark for Multi-Server Tool Orchestration

Paperium

Dec 17

MSC-Bench: A Rigorous Benchmark for Multi-Server Tool Orchestration

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DeepAgent: A General Reasoning Agent with Scalable Toolsets

Paperium

Dec 17

DeepAgent: A General Reasoning Agent with Scalable Toolsets

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Video-As-Prompt: Unified Semantic Control for Video Generation

Paperium

Dec 17

Video-As-Prompt: Unified Semantic Control for Video Generation

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for UI-Ins: Enhancing GUI Grounding with Multi-Perspective Instruction-as-Reasoning

Paperium

Dec 17

UI-Ins: Enhancing GUI Grounding with Multi-Perspective Instruction-as-Reasoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Sample By Step, Optimize By Chunk: Chunk-Level GRPO For Text-to-Image Generation

Paperium

Dec 17

Sample By Step, Optimize By Chunk: Chunk-Level GRPO For Text-to-Image Generation

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 17

A Definition of AGI

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for From Denoising to Refining: A Corrective Framework for Vision-Language DiffusionModel

Paperium

Dec 17

From Denoising to Refining: A Corrective Framework for Vision-Language DiffusionModel

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Sparser Block-Sparse Attention via Token Permutation

Paperium

Dec 17

Sparser Block-Sparse Attention via Token Permutation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for RECALL: REpresentation-aligned Catastrophic-forgetting ALLeviation viaHierarchical Model Merging

Paperium

Dec 17

RECALL: REpresentation-aligned Catastrophic-forgetting ALLeviation viaHierarchical Model Merging

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Reasoning with Sampling: Your Base Model is Smarter Than You Think

Paperium

Dec 17

Reasoning with Sampling: Your Base Model is Smarter Than You Think

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Model Merging with Functional Dual Anchors

Paperium

Dec 17

Model Merging with Functional Dual Anchors

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Attention Is All You Need

Paperium

Dec 17

Attention Is All You Need

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for RoBERTa: A Robustly Optimized BERT Pretraining Approach

Paperium

Dec 17

RoBERTa: A Robustly Optimized BERT Pretraining Approach

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for YOLOv3: An Incremental Improvement

Paperium

Dec 17

YOLOv3: An Incremental Improvement

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MobileNets: Efficient Convolutional Neural Networks for Mobile VisionApplications

Paperium

Dec 17

MobileNets: Efficient Convolutional Neural Networks for Mobile VisionApplications

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Proximal Policy Optimization Algorithms

Paperium

Dec 17

Proximal Policy Optimization Algorithms

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Distilling the Knowledge in a Neural Network

Paperium

Dec 17

Distilling the Knowledge in a Neural Network

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LLaMA: Open and Efficient Foundation Language Models

Paperium

Dec 17

LLaMA: Open and Efficient Foundation Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for YOLOv4: Optimal Speed and Accuracy of Object Detection

Paperium

Dec 17

YOLOv4: Optimal Speed and Accuracy of Object Detection

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling

Paperium

Dec 17

Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Playing Atari with Deep Reinforcement Learning

Paperium

Dec 18

Playing Atari with Deep Reinforcement Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Representation Learning with Contrastive Predictive Coding

Paperium

Dec 18

Representation Learning with Contrastive Predictive Coding

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 18

Layer Normalization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems

Paperium

Dec 18

TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Community detection in graphs

Paperium

Dec 18

Community detection in graphs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Conditional Generative Adversarial Nets

Paperium

Dec 18

Conditional Generative Adversarial Nets

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction

Paperium

Dec 18

UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine LearningAlgorithms

Paperium

Dec 18

Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine LearningAlgorithms

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Rethinking Atrous Convolution for Semantic Image Segmentation

Paperium

Dec 18

Rethinking Atrous Convolution for Semantic Image Segmentation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter

Paperium

Dec 18

DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB modelsize

Paperium

Dec 18

SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB modelsize

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Hierarchical Text-Conditional Image Generation with CLIP Latents

Paperium

Dec 18

Hierarchical Text-Conditional Image Generation with CLIP Latents

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Improving neural networks by preventing co-adaptation of feature detectors

Paperium

Dec 18

Improving neural networks by preventing co-adaptation of feature detectors

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Evaluating Large Language Models Trained on Code

Paperium

Dec 18

Evaluating Large Language Models Trained on Code

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Google's Neural Machine Translation System: Bridging the Gap between Human andMachine Translation

Paperium

Dec 18

Google's Neural Machine Translation System: Bridging the Gap between Human andMachine Translation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ADADELTA: An Adaptive Learning Rate Method

Paperium

Dec 18

ADADELTA: An Adaptive Learning Rate Method

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for UCF101: A Dataset of 101 Human Actions Classes From Videos in The Wild

Paperium

Dec 18

UCF101: A Dataset of 101 Human Actions Classes From Videos in The Wild

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Training Verifiers to Solve Math Word Problems

Paperium

Dec 18

Training Verifiers to Solve Math Word Problems

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Scaling Laws for Neural Language Models

Paperium

Dec 18

Scaling Laws for Neural Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Attention U-Net: Learning Where to Look for the Pancreas

Paperium

Dec 18

Attention U-Net: Learning Where to Look for the Pancreas

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ShapeNet: An Information-Rich 3D Model Repository

Paperium

Dec 18

ShapeNet: An Information-Rich 3D Model Repository

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Evaluation: from precision, recall and F-measure to ROC, informedness,markedness and correlation

Paperium

Dec 19

Evaluation: from precision, recall and F-measure to ROC, informedness,markedness and correlation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for An Empirical Evaluation of Generic Convolutional and Recurrent Networks forSequence Modeling

Paperium

Dec 19

An Empirical Evaluation of Generic Convolutional and Recurrent Networks forSequence Modeling

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for On the Opportunities and Risks of Foundation Models

Paperium

Dec 19

On the Opportunities and Risks of Foundation Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 19

OpenAI Gym

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Variational Inference: A Review for Statisticians

Paperium

Dec 19

Variational Inference: A Review for Statisticians

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A Quantitative Measure Of Fairness And Discrimination For Resource Allocation InShared Computer Systems

Paperium

Dec 19

A Quantitative Measure Of Fairness And Discrimination For Resource Allocation InShared Computer Systems

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for YOLOX: Exceeding YOLO Series in 2021

Paperium

Dec 19

YOLOX: Exceeding YOLO Series in 2021

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Federated Learning: Strategies for Improving Communication Efficiency

Paperium

Dec 19

Federated Learning: Strategies for Improving Communication Efficiency

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 19

Wasserstein GAN

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Classifier-Free Diffusion Guidance

Paperium

Dec 19

Classifier-Free Diffusion Guidance

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Fast Graph Representation Learning with PyTorch Geometric

Paperium

Dec 19

Fast Graph Representation Learning with PyTorch Geometric

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for CoSaMP: Iterative signal recovery from incomplete and inaccurate samples

Paperium

Dec 19

CoSaMP: Iterative signal recovery from incomplete and inaccurate samples

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via ReinforcementLearning

Paperium

Dec 19

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via ReinforcementLearning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Longformer: The Long-Document Transformer

Paperium

Dec 19

Longformer: The Long-Document Transformer

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for TransUNet: Transformers Make Strong Encoders for Medical Image Segmentation

Paperium

Dec 19

TransUNet: Transformers Make Strong Encoders for Medical Image Segmentation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for End to End Learning for Self-Driving Cars

Paperium

Dec 19

End to End Learning for Self-Driving Cars

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Bidirectional LSTM-CRF Models for Sequence Tagging

Paperium

Dec 19

Bidirectional LSTM-CRF Models for Sequence Tagging

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for OPT: Open Pre-trained Transformer Language Models

Paperium

Dec 19

OPT: Open Pre-trained Transformer Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Generating Sequences With Recurrent Neural Networks

Paperium

Dec 19

Generating Sequences With Recurrent Neural Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The Kinetics Human Action Video Dataset

Paperium

Dec 19

The Kinetics Human Action Video Dataset

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Improved Regularization of Convolutional Neural Networks with Cutout

Paperium

Dec 19

Improved Regularization of Convolutional Neural Networks with Cutout

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Variational Graph Auto-Encoders

Paperium

Dec 20

Variational Graph Auto-Encoders

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Instance Normalization: The Missing Ingredient for Fast Stylization

Paperium

Dec 20

Instance Normalization: The Missing Ingredient for Fast Stylization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The information bottleneck method

Paperium

Dec 20

The information bottleneck method

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour

Paperium

Dec 20

Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Improved Baselines with Momentum Contrastive Learning

Paperium

Dec 20

Improved Baselines with Momentum Contrastive Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Sparks of Artificial General Intelligence: Early experiments with GPT-4

Paperium

Dec 20

Sparks of Artificial General Intelligence: Early experiments with GPT-4

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A Survey of Large Language Models

Paperium

Dec 20

A Survey of Large Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Deep Learning using Rectified Linear Units (ReLU)

Paperium

Dec 20

Deep Learning using Rectified Linear Units (ReLU)

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 20

Objects as Points

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge

Paperium

Dec 20

Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Estimating or Propagating Gradients Through Stochastic Neurons for ConditionalComputation

Paperium

Dec 20

Estimating or Propagating Gradients Through Stochastic Neurons for ConditionalComputation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for In Defense of the Triplet Loss for Person Re-Identification

Paperium

Dec 20

In Defense of the Triplet Loss for Person Re-Identification

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Relational inductive biases, deep learning, and graph networks

Paperium

Dec 20

Relational inductive biases, deep learning, and graph networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Training a Helpful and Harmless Assistant with Reinforcement Learning from HumanFeedback

Paperium

Dec 20

Training a Helpful and Harmless Assistant with Reinforcement Learning from HumanFeedback

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MMDetection: Open MMLab Detection Toolbox and Benchmark

Paperium

Dec 20

MMDetection: Open MMLab Detection Toolbox and Benchmark

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open LanguageModels

Paperium

Dec 20

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open LanguageModels

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Empirical Evaluation of Rectified Activations in Convolutional Network

Paperium

Dec 20

Empirical Evaluation of Rectified Activations in Convolutional Network

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Past, Present, and Future of Simultaneous Localization And Mapping: Towards theRobust-Perception Age

Paperium

Dec 20

Past, Present, and Future of Simultaneous Localization And Mapping: Towards theRobust-Perception Age

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for An Overview of Multi-Task Learning in Deep Neural Networks

Paperium

Dec 20

An Overview of Multi-Task Learning in Deep Neural Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for On discrete cosine transform

Paperium

Dec 20

On discrete cosine transform

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A Neural Algorithm of Artistic Style

Paperium

Dec 20

A Neural Algorithm of Artistic Style

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The Effectiveness of Data Augmentation in Image Classification using DeepLearning

Paperium

Dec 21

The Effectiveness of Data Augmentation in Image Classification using DeepLearning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with DeepLearning

Paperium

Dec 21

CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with DeepLearning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for HuggingFace's Transformers: State-of-the-art Natural Language Processing

Paperium

Dec 21

HuggingFace's Transformers: State-of-the-art Natural Language Processing

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Recurrent Neural Network Regularization

Paperium

Dec 21

Recurrent Neural Network Regularization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Federated Learning with Non-IID Data

Paperium

Dec 21

Federated Learning with Non-IID Data

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 21

Mistral 7B

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Gemini 1.5: Unlocking multimodal understanding across millions of tokens ofcontext

Paperium

Dec 21

Gemini 1.5: Unlocking multimodal understanding across millions of tokens ofcontext

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Link Prediction in Complex Networks: A Survey

Paperium

Dec 21

Link Prediction in Complex Networks: A Survey

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Soft Actor-Critic Algorithms and Applications

Paperium

Dec 21

Soft Actor-Critic Algorithms and Applications

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Microsoft COCO Captions: Data Collection and Evaluation Server

Paperium

Dec 21

Microsoft COCO Captions: Data Collection and Evaluation Server

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Paperium

Dec 21

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Concrete Problems in AI Safety

Paperium

Dec 21

Concrete Problems in AI Safety

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Program Synthesis with Large Language Models

Paperium

Dec 21

Program Synthesis with Large Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Progressive Neural Networks

Paperium

Dec 21

Progressive Neural Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A Tutorial on Principal Component Analysis

Paperium

Dec 21

A Tutorial on Principal Component Analysis

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Counterfactual Explanations without Opening the Black Box: Automated Decisionsand the GDPR

Paperium

Dec 21

Counterfactual Explanations without Opening the Black Box: Automated Decisionsand the GDPR

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Code Llama: Open Foundation Models for Code

Paperium

Dec 21

Code Llama: Open Foundation Models for Code

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Fine-Grained Visual Classification of Aircraft

Paperium

Dec 21

Fine-Grained Visual Classification of Aircraft

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at AnyResolution

Paperium

Dec 21

Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at AnyResolution

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Qwen2.5 Technical Report

Paperium

Dec 22

Qwen2.5 Technical Report

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Retrieval-Augmented Generation for Large Language Models: A Survey

Paperium

Dec 22

Retrieval-Augmented Generation for Large Language Models: A Survey

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A Tutorial on Bayesian Optimization of Expensive Cost Functions, withApplication to Active User Modeling and Hierarchical Reinfo

Paperium

Dec 22

A Tutorial on Bayesian Optimization of Expensive Cost Functions, withApplication to Active User Modeling and Hierarchical Reinfo

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications

Paperium

Dec 22

YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A Critical Review of Recurrent Neural Networks for Sequence Learning

Paperium

Dec 22

A Critical Review of Recurrent Neural Networks for Sequence Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LSUN: Construction of a Large-scale Image Dataset using Deep Learning withHumans in the Loop

Paperium

Dec 22

LSUN: Construction of a Large-scale Image Dataset using Deep Learning withHumans in the Loop

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Training Compute-Optimal Large Language Models

Paperium

Dec 22

Training Compute-Optimal Large Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Invariant Risk Minimization

Paperium

Dec 22

Invariant Risk Minimization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The Pile: An 800GB Dataset of Diverse Text for Language Modeling

Paperium

Dec 22

The Pile: An 800GB Dataset of Diverse Text for Language Modeling

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Iterative Hard Thresholding for Compressed Sensing

Paperium

Dec 22

Iterative Hard Thresholding for Compressed Sensing

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 22

Neural Turing Machines

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Decoupled Weight Decay Regularization

Paperium

Dec 22

Decoupled Weight Decay Regularization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for On First-Order Meta-Learning Algorithms

Paperium

Dec 22

On First-Order Meta-Learning Algorithms

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for SmoothGrad: removing noise by adding noise

Paperium

Dec 22

SmoothGrad: removing noise by adding noise

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Theano: A Python framework for fast computation of mathematical expressions

Paperium

Dec 23

Theano: A Python framework for fast computation of mathematical expressions

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Adversarial Autoencoders

Paperium

Dec 23

Adversarial Autoencoders

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 23

GPT-4o System Card

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Deep Learning for Medical Image Analysis

Paperium

Dec 23

Deep Learning for Medical Image Analysis

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MXNet: A Flexible and Efficient Machine Learning Library for HeterogeneousDistributed Systems

Paperium

Dec 23

MXNet: A Flexible and Efficient Machine Learning Library for HeterogeneousDistributed Systems

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Megatron-LM: Training Multi-Billion Parameter Language Models Using ModelParallelism

Paperium

Dec 23

Megatron-LM: Training Multi-Billion Parameter Language Models Using ModelParallelism

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Offline Reinforcement Learning: Tutorial, Review, and Perspectives on OpenProblems

Paperium

Dec 23

Offline Reinforcement Learning: Tutorial, Review, and Perspectives on OpenProblems

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation

Paperium

Dec 23

ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Deep Speech: Scaling up end-to-end speech recognition

Paperium

Dec 23

Deep Speech: Scaling up end-to-end speech recognition

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with LowBitwidth Gradients

Paperium

Dec 23

DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with LowBitwidth Gradients

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Generating Long Sequences with Sparse Transformers

Paperium

Dec 23

Generating Long Sequences with Sparse Transformers

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for VisualBERT: A Simple and Performant Baseline for Vision and Language

Paperium

Dec 23

VisualBERT: A Simple and Performant Baseline for Vision and Language

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Constitutional AI: Harmlessness from AI Feedback

Paperium

Dec 23

Constitutional AI: Harmlessness from AI Feedback

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Learning Face Representation from Scratch

Paperium

Dec 23

Learning Face Representation from Scratch

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Fine-Tuning Language Models from Human Preferences

Paperium

Dec 24

Fine-Tuning Language Models from Human Preferences

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Universal and Transferable Adversarial Attacks on Aligned Language Models

Paperium

Dec 24

Universal and Transferable Adversarial Attacks on Aligned Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Qwen2.5-VL Technical Report

Paperium

Dec 24

Qwen2.5-VL Technical Report

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Federated Optimization: Distributed Machine Learning for On-Device Intelligence

Paperium

Dec 24

Federated Optimization: Distributed Machine Learning for On-Device Intelligence

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Beyond the Imitation Game: Quantifying and extrapolating the capabilities oflanguage models

Paperium

Dec 24

Beyond the Imitation Game: Quantifying and extrapolating the capabilities oflanguage models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A Tutorial on Bayesian Optimization

Paperium

Dec 24

A Tutorial on Bayesian Optimization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Binarized Neural Networks

Paperium

Dec 24

Binarized Neural Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Targeted Backdoor Attacks on Deep Learning Systems Using Data Poisoning

Paperium

Dec 24

Targeted Backdoor Attacks on Deep Learning Systems Using Data Poisoning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Smart Radio Environments Empowered by Reconfigurable Intelligent Surfaces: Howit Works, State of Research, and Road Ahead

Paperium

Dec 24

Smart Radio Environments Empowered by Reconfigurable Intelligent Surfaces: Howit Works, State of Research, and Road Ahead

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DSSD : Deconvolutional Single Shot Detector

Paperium

Dec 24

DSSD : Deconvolutional Single Shot Detector

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Weight Uncertainty in Neural Networks

Paperium

Dec 24

Weight Uncertainty in Neural Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Sequence Transduction with Recurrent Neural Networks

Paperium

Dec 24

Sequence Transduction with Recurrent Neural Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for BERTopic: Neural topic modeling with a class-based TF-IDF procedure

Paperium

Dec 24

BERTopic: Neural topic modeling with a class-based TF-IDF procedure

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Linformer: Self-Attention with Linear Complexity

Paperium

Dec 24

Linformer: Self-Attention with Linear Complexity

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Dota 2 with Large Scale Deep Reinforcement Learning

Paperium

Dec 24

Dota 2 with Large Scale Deep Reinforcement Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Artificial Intelligence: the global landscape of ethics guidelines

Paperium

Dec 24

Artificial Intelligence: the global landscape of ethics guidelines

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for BadNets: Identifying Vulnerabilities in the Machine Learning Model Supply Chain

Paperium

Dec 24

BadNets: Identifying Vulnerabilities in the Machine Learning Model Supply Chain

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MOT16: A Benchmark for Multi-Object Tracking

Paperium

Dec 24

MOT16: A Benchmark for Multi-Object Tracking

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for IPFS - Content Addressed, Versioned, P2P File System

Paperium

Dec 24

IPFS - Content Addressed, Versioned, P2P File System

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Community detection in networks: A user guide

Paperium

Dec 24

Community detection in networks: A user guide

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Mastering Chess and Shogi by Self-Play with a General Reinforcement LearningAlgorithm

Paperium

Dec 24

Mastering Chess and Shogi by Self-Play with a General Reinforcement LearningAlgorithm

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Understanding Neural Networks Through Deep Visualization

Paperium

Dec 25

Understanding Neural Networks Through Deep Visualization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for cuDNN: Efficient Primitives for Deep Learning

Paperium

Dec 25

cuDNN: Efficient Primitives for Deep Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Tutorial on Variational Autoencoders

Paperium

Dec 25

Tutorial on Variational Autoencoders

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for AutoAugment: Learning Augmentation Policies from Data

Paperium

Dec 25

AutoAugment: Learning Augmentation Policies from Data

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Multitask Prompted Training Enables Zero-Shot Task Generalization

Paperium

Dec 25

Multitask Prompted Training Enables Zero-Shot Task Generalization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Open3D: A Modern Library for 3D Data Processing

Paperium

Dec 25

Open3D: A Modern Library for 3D Data Processing

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 25

Highway Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Transferability in Machine Learning: from Phenomena to Black-Box Attacks usingAdversarial Samples

Paperium

Dec 25

Transferability in Machine Learning: from Phenomena to Black-Box Attacks usingAdversarial Samples

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Identifying the Best Machine Learning Algorithms for Brain Tumor Segmentation,Progression Assessment, and Overall Survival Predi

Paperium

Dec 25

Identifying the Best Machine Learning Algorithms for Brain Tumor Segmentation,Progression Assessment, and Overall Survival Predi

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for A Neural Conversational Model

Paperium

Dec 25

A Neural Conversational Model

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for NIPS 2016 Tutorial: Generative Adversarial Networks

Paperium

Dec 25

NIPS 2016 Tutorial: Generative Adversarial Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Imagen Video: High Definition Video Generation with Diffusion Models

Paperium

Dec 25

Imagen Video: High Definition Video Generation with Diffusion Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LaMDA: Language Models for Dialog Applications

Paperium

Dec 25

LaMDA: Language Models for Dialog Applications

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paperium

Dec 25

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets

Paperium

Dec 25

Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Deep Reinforcement Learning: An Overview

Paperium

Dec 25

Deep Reinforcement Learning: An Overview

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Deep learning in remote sensing: a review

Paperium

Dec 25

Deep learning in remote sensing: a review

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for word2vec Explained: deriving Mikolov et al.'s negative-sampling word-embeddingmethod

Paperium

Dec 25

word2vec Explained: deriving Mikolov et al.'s negative-sampling word-embeddingmethod

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Federated Learning for Mobile Keyboard Prediction

Paperium

Dec 25

Federated Learning for Mobile Keyboard Prediction

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LAION-400M: Open Dataset of CLIP-Filtered 400 Million Image-Text Pairs

Paperium

Dec 25

LAION-400M: Open Dataset of CLIP-Filtered 400 Million Image-Text Pairs

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Deep Convolutional Networks on Graph-Structured Data

Paperium

Dec 25

Deep Convolutional Networks on Graph-Structured Data

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Deep Learning for Anomaly Detection: A Survey

Paperium

Dec 26

Deep Learning for Anomaly Detection: A Survey

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Evolution Strategies as a Scalable Alternative to Reinforcement Learning

Paperium

Dec 26

Evolution Strategies as a Scalable Alternative to Reinforcement Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Exploiting Similarities among Languages for Machine Translation

Paperium

Dec 26

Exploiting Similarities among Languages for Machine Translation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MediaPipe: A Framework for Building Perception Pipelines

Paperium

Dec 26

MediaPipe: A Framework for Building Perception Pipelines

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A guide to convolution arithmetic for deep learning

Paperium

Dec 26

A guide to convolution arithmetic for deep learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Coase's Penguin, or Linux and the Nature of the Firm

Paperium

Dec 26

Coase's Penguin, or Linux and the Nature of the Firm

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for CatBoost: gradient boosting with categorical features support

Paperium

Dec 26

CatBoost: gradient boosting with categorical features support

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Consistent Individualized Feature Attribution for Tree Ensembles

Paperium

Dec 26

Consistent Individualized Feature Attribution for Tree Ensembles

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for LEAF: A Benchmark for Federated Settings

Paperium

Dec 26

LEAF: A Benchmark for Federated Settings

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 26

Qwen3 Technical Report

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Pitfalls of Graph Neural Network Evaluation

Paperium

Dec 26

Pitfalls of Graph Neural Network Evaluation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for D4RL: Datasets for Deep Data-Driven Reinforcement Learning

Paperium

Dec 26

D4RL: Datasets for Deep Data-Driven Reinforcement Learning

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for WebGPT: Browser-assisted question-answering with human feedback

Paperium

Dec 26

WebGPT: Browser-assisted question-answering with human feedback

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 26

Qwen2 Technical Report

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Opening the Black Box of Deep Neural Networks via Information

Paperium

Dec 26

Opening the Black Box of Deep Neural Networks via Information

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for No Language Left Behind: Scaling Human-Centered Machine Translation

Paperium

Dec 26

No Language Left Behind: Scaling Human-Centered Machine Translation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The CMA Evolution Strategy: A Tutorial

Paperium

Dec 26

The CMA Evolution Strategy: A Tutorial

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for MUSAN: A Music, Speech, and Noise Corpus

Paperium

Dec 26

MUSAN: A Music, Speech, and Noise Corpus

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Scaling Language Models: Methods, Analysis & Insights from Training Gopher

Paperium

Dec 26

Scaling Language Models: Methods, Analysis & Insights from Training Gopher

#ai #deeplearning #computerscience #machinelearning

1 min read

Paperium

Dec 26

Mixtral of Experts

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Differentially Private Federated Learning: A Client Level Perspective

Paperium

Dec 26

Differentially Private Federated Learning: A Client Level Perspective

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The Roadmap to 6G -- AI Empowered Wireless Networks

Paperium

Dec 27

The Roadmap to 6G -- AI Empowered Wireless Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Skin Lesion Analysis Toward Melanoma Detection 2018: A Challenge Hosted by theInternational Skin Imaging Collaboration (ISIC)

Paperium

Dec 27

Skin Lesion Analysis Toward Melanoma Detection 2018: A Challenge Hosted by theInternational Skin Imaging Collaboration (ISIC)

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Unifying Visual-Semantic Embeddings with Multimodal Neural Language Models

Paperium

Dec 27

Unifying Visual-Semantic Embeddings with Multimodal Neural Language Models

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT

Paperium

Dec 27

A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Theano: new features and speed improvements

Paperium

Dec 27

Theano: new features and speed improvements

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Distributionally Robust Neural Networks for Group Shifts: On the Importance ofRegularization for Worst-Case Generalization

Paperium

Dec 27

Distributionally Robust Neural Networks for Group Shifts: On the Importance ofRegularization for Worst-Case Generalization

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Improved Simulation of Stabilizer Circuits

Paperium

Dec 27

Improved Simulation of Stabilizer Circuits

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Gemma 2: Improving Open Language Models at a Practical Size

Paperium

Dec 27

Gemma 2: Improving Open Language Models at a Practical Size

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The 2017 DAVIS Challenge on Video Object Segmentation

Paperium

Dec 27

The 2017 DAVIS Challenge on Video Object Segmentation

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Blockchain Technology Overview

Paperium

Dec 27

Blockchain Technology Overview

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Synthetic Data and Artificial Neural Networks for Natural Scene Text Recognition

Paperium

Dec 27

Synthetic Data and Artificial Neural Networks for Natural Scene Text Recognition

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for DeepID3: Face Recognition with Very Deep Neural Networks

Paperium

Dec 27

DeepID3: Face Recognition with Very Deep Neural Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for ERNIE: Enhanced Representation through Knowledge Integration

Paperium

Dec 27

ERNIE: Enhanced Representation through Knowledge Integration

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Expanding Performance Boundaries of Open-Source Multimodal Models with Model,Data, and Test-Time Scaling

Paperium

Dec 27

Expanding Performance Boundaries of Open-Source Multimodal Models with Model,Data, and Test-Time Scaling

#ai #deeplearning #computerscience #machinelearning

2 min read

Cover image for Resnet in Resnet: Generalizing Residual Architectures

Paperium

Dec 27

Resnet in Resnet: Generalizing Residual Architectures

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Towards Accurate Generative Models of Video: A New Metric & Challenges

Paperium

Dec 27

Towards Accurate Generative Models of Video: A New Metric & Challenges

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for The History Began from AlexNet: A Comprehensive Survey on Deep LearningApproaches

Paperium

Dec 27

The History Began from AlexNet: A Comprehensive Survey on Deep LearningApproaches

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for Joint 2D-3D-Semantic Data for Indoor Scene Understanding

Paperium

Dec 27

Joint 2D-3D-Semantic Data for Indoor Scene Understanding

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for An O(m) Algorithm for Cores Decomposition of Networks

Paperium

Dec 27

An O(m) Algorithm for Cores Decomposition of Networks

#ai #deeplearning #computerscience #machinelearning

1 min read

Cover image for eDiff-I: Text-to-Image Diffusion Models with an Ensemble of Expert Denoisers

Paperium

Dec 27

eDiff-I: Text-to-Image Diffusion Models with an Ensemble of Expert Denoisers

#ai #deeplearning #computerscience #machinelearning

1 min read