mengruwang's picture

1 17 1

mengruwang

mengru

·

mengrusun

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

Deep Research: A Systematic Survey

upvoted a paper 6 days ago

InnoGym: Benchmarking the Innovation Potential of AI Agents

upvoted a paper 29 days ago

Too Good to be Bad: On the Failure of LLMs to Role-Play Villains

View all activity

Organizations

upvoted 2 papers 6 days ago

Deep Research: A Systematic Survey

Paper • 2512.02038 • Published 15 days ago • 61

InnoGym: Benchmarking the Innovation Potential of AI Agents

Paper • 2512.01822 • Published 8 days ago • 33

upvoted a paper 29 days ago

Too Good to be Bad: On the Failure of LLMs to Role-Play Villains

Paper • 2511.04962 • Published Nov 7 • 52

upvoted a paper about 1 month ago

The End of Manual Decoding: Towards Truly End-to-End Language Models

Paper • 2510.26697 • Published Oct 30 • 115

upvoted 2 papers about 2 months ago

LightMem: Lightweight and Efficient Memory-Augmented Generation

Paper • 2510.18866 • Published Oct 21 • 110

Executable Knowledge Graphs for Replicating AI Research

Paper • 2510.17795 • Published Oct 20 • 14

upvoted 4 papers 2 months ago

OceanGym: A Benchmark Environment for Underwater Embodied Agents

Paper • 2509.26536 • Published Sep 30 • 34

Towards Personalized Deep Research: Benchmarks and Evaluations

Paper • 2509.25106 • Published Sep 29 • 29

Scaling Generalist Data-Analytic Agents

Paper • 2509.25084 • Published Sep 29 • 18

EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning

Paper • 2509.22576 • Published Sep 26 • 134

upvoted a paper 4 months ago

Memp: Exploring Agent Procedural Memory

Paper • 2508.06433 • Published Aug 8 • 35

updated a dataset 6 months ago

mengru/data_for_STA

Viewer • Updated Jun 4 • 99.8k • 100

published a dataset 6 months ago

mengru/data_for_STA

Viewer • Updated Jun 4 • 99.8k • 100

upvoted a paper 7 months ago

Sentient Agent as a Judge: Evaluating Higher-Order Social Cognition in Large Language Models

Paper • 2505.02847 • Published May 1 • 28