BadRequestError: temperature=0.0 breaks evaluation with reasoning models (gpt-5.2, etc.)

# `temperature=0.0` default breaks evaluation with reasoning models (gpt-5.2, etc.)                                                          
                                         
  ## Summary                                                                                                                                                    
                                                            
  Running `tau2 run` with any reasoning model fails immediately with a `400 BadRequestError`                                                                    
  because `temperature=0.0` is hardcoded into the default LLM args. 

  ## Steps to Reproduce

  ```bash
  tau2 run --domain airline \
    --agent-llm o4-mini \
    --user-llm o4-mini \
    --num-trials 1 --num-tasks 1
```
```  
Error

  litellm.BadRequestError: AzureException BadRequestError -
  Unsupported value: 'temperature' does not support 0.0 with this model.
  Only the default (1) value is supported.
```
 

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

BadRequestError: temperature=0.0 breaks evaluation with reasoning models (gpt-5.2, etc.) #166

`temperature=0.0` default breaks evaluation with reasoning models (gpt-5.2, etc.)

Summary

Steps to Reproduce

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

BadRequestError: temperature=0.0 breaks evaluation with reasoning models (gpt-5.2, etc.) #166

Description

temperature=0.0 default breaks evaluation with reasoning models (gpt-5.2, etc.)

Summary

Steps to Reproduce

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions

`temperature=0.0` default breaks evaluation with reasoning models (gpt-5.2, etc.)