langfengQ

Lang Feng langfengQ

PhD student @ NTU Singapore | My research focuses on reinforcement learning (RL), large language models (LLMs), LLM post-training, and LLM-based agents.

29 followers · 9 following

Singapore
08:21 (UTC +08:00)
https://langfengq.github.io/

Achievements

x3 x2

Achievements

x3 x2

Highlights

Pinned Loading

verl-agent verl-agent Public

verl-agent is an extension of veRL, designed for training LLM/VLM agents via RL. verl-agent is also the official code for paper "Group-in-Group Policy Optimization for LLM Agent Training"

Python 526 33
TimeMaster TimeMaster Public

Official code for paper "TimeMaster: Training Time-Series Multimodal LLMs to Reason via Reinforcement Learning"

Python 39 2
CoSo CoSo Public

Official code for paper "Towards Efficient Online Tuning of VLM Agents via Counterfactual Soft Reinforcement Learning"

Python 6

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Lang Feng langfengQ

Achievements

Achievements

Highlights

Block or report langfengQ

Pinned Loading

Uh oh!