feat: verifiers / environments hub integration by cmunley1 · Pull Request #573 · NVIDIA-NeMo/Gym

cmunley1 · 2026-01-10T19:55:24Z

enables using environments hub envs in NeMo Gym with NeMo RL for training.

#446

Signed-off-by: Christian Munley <cmunley@nvidia.com>

Signed-off-by: cmunley1 <cmunley@nvidia.com>

copy-pr-bot · 2026-01-10T19:55:27Z

This pull request requires additional validation before any workflows can run on NVIDIA's runners.

Pull request vetters can view their responsibilities here.

Contributors can view more details about this message here.

Signed-off-by: cmunley1 <cmunley@nvidia.com>

cmunley1 · 2026-01-11T19:56:53Z

ascii-tree

cmunley1 · 2026-01-11T20:00:58Z

acereason-math

cmunley1 · 2026-01-11T20:01:37Z

i3-math

cmunley1 · 2026-01-12T16:56:34Z

multi turn seems to work, if we disable monotonicity checks and ensure consistent logprob dtype in nemo rl

ahmadki

tests would also be appreciated

pyproject.toml

resources_servers/verifiers/__init__.py

resources_servers/verifiers/app.py

responses_api_agents/verifiers_agent/__init__.py

responses_api_agents/verifiers_agent/app.py

resources_servers/verifiers/app.py

responses_api_agents/verifiers_agent/app.py

resources_servers/verifiers/app.py

responses_api_agents/verifiers_agent/app.py

Signed-off-by: cmunley1 <cmunley@nvidia.com>

Signed-off-by: Christian Munley <cmunley@nvidia.com>

cmunley1 · 2026-01-22T21:20:06Z

would like for someone from prime intellect to take a look, and also test more environments to provide a longer list of what is working today (seems to be various version mismatches or other issues with some envs).

however, I think this is good to merge. Can always open another PR for more verified environments, or based on PI feedback

@bxyu-nvidia @cwing-nvidia

Signed-off-by: Christian Munley <cmunley@nvidia.com>

cmunley1 · 2026-01-30T22:04:32Z

note that multi-turn does not support on-policy token-id correction with these envs, so training requires disabling this assert. In tests on alphabet-sort with it disabled training seems okay but we need to ensure the token ids look fine without this assert, or add support to use replace_prefix_tokens in nemo rl

https://docs.nvidia.com/nemo/gym/latest/contribute/rl-framework-integration/openai-compatible-http-server-on-policy-correction.html#on-policy-token-id-fix

maybe I am missing something in verifiers, e.g. PrimeIntellect-ai/verifiers#626

Signed-off-by: Christian Munley <cmunley@nvidia.com>

cmunley1 added 7 commits January 8, 2026 22:48

verifiers draft

2926282

Signed-off-by: Christian Munley <cmunley@nvidia.com>

get tokenids and logps

b84abab

Signed-off-by: Christian Munley <cmunley@nvidia.com>

testing more envs

1f6154b

Signed-off-by: Christian Munley <cmunley@nvidia.com>

readme

f71a2b1

Signed-off-by: Christian Munley <cmunley@nvidia.com>

remove stuff

6057187

Signed-off-by: Christian Munley <cmunley@nvidia.com>

prompt from datset not idx

28d273c

Signed-off-by: Christian Munley <cmunley@nvidia.com>

training

b559bb7

Signed-off-by: cmunley1 <cmunley@nvidia.com>

cmunley1 changed the title ~~feat: verifiers integration supporting environments hub~~ feat: verifiers / environments hub integration Jan 10, 2026

simplify

efbed85

Signed-off-by: cmunley1 <cmunley@nvidia.com>

cmunley1 force-pushed the cmunley1/verifiers branch from 5197f48 to efbed85 Compare January 10, 2026 22:38

cmunley1 requested review from ahmadki and bxyu-nvidia January 10, 2026 22:53

cmunley1 added the env-integration label Jan 10, 2026

cmunley1 marked this pull request as ready for review January 11, 2026 20:02

cmunley1 requested a review from a team as a code owner January 11, 2026 20:02

ahmadki requested changes Jan 12, 2026

View reviewed changes

cmunley1 added 9 commits January 12, 2026 17:18

copyright; request params; pydantic; local cache; dedup create dataset

08329cf

Signed-off-by: cmunley1 <cmunley@nvidia.com>

lint!

6ed3af8

Signed-off-by: cmunley1 <cmunley@nvidia.com>

tests

03a6745

Signed-off-by: cmunley1 <cmunley@nvidia.com>

remove resources server

d32ba0c

Signed-off-by: cmunley1 <cmunley@nvidia.com>

restore pyproject

b7e991e

Signed-off-by: cmunley1 <cmunley@nvidia.com>

remove transitions, simplify openai client

845b8a9

Signed-off-by: cmunley1 <cmunley@nvidia.com>

ruff

f9c8578

Signed-off-by: cmunley1 <cmunley@nvidia.com>

abs import

ef01a64

Signed-off-by: cmunley1 <cmunley@nvidia.com>

readme

61fdbe8

Signed-off-by: cmunley1 <cmunley@nvidia.com>

cmunley1 requested a review from ahmadki January 13, 2026 19:50

ahmadki previously approved these changes Jan 22, 2026

View reviewed changes

add readme

a96c14e

Signed-off-by: Christian Munley <cmunley@nvidia.com>

cmunley1 dismissed ahmadki’s stale review via a96c14e January 22, 2026 07:35

cmunley1 added 2 commits January 22, 2026 12:43

readme

3598057

Signed-off-by: Christian Munley <cmunley@nvidia.com>

cfg rename, readme

e077371

Signed-off-by: Christian Munley <cmunley@nvidia.com>

add docs

61acb8f

Signed-off-by: Christian Munley <cmunley@nvidia.com>

cmunley1 requested review from cwing-nvidia and lbliii January 28, 2026 02:56

cmunley1 added 3 commits January 27, 2026 22:11

docs fixes

58b8402

Signed-off-by: Christian Munley <cmunley@nvidia.com>

remove docs in favor of docs on pr 617

008d5a3

Signed-off-by: Christian Munley <cmunley@nvidia.com>

readme

aa2300d

Signed-off-by: Christian Munley <cmunley@nvidia.com>

cmunley1 added 2 commits February 2, 2026 17:57

shorten readme

c0efda7

Signed-off-by: Christian Munley <cmunley@nvidia.com>

readme

28f2112

Signed-off-by: Christian Munley <cmunley@nvidia.com>

Conversation

cmunley1 commented Jan 10, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

copy-pr-bot bot commented Jan 10, 2026

Uh oh!

cmunley1 commented Jan 11, 2026

Uh oh!

cmunley1 commented Jan 11, 2026

Uh oh!

cmunley1 commented Jan 11, 2026

Uh oh!

cmunley1 commented Jan 12, 2026

Uh oh!

ahmadki left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

cmunley1 commented Jan 22, 2026

Uh oh!

cmunley1 commented Jan 30, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

cmunley1 commented Jan 10, 2026 •

edited

Loading

cmunley1 commented Jan 30, 2026 •

edited

Loading