fix: selectively drop unsigned Gemini tool calls

Mateusz · Mateusz · commit 9106c6e5e44b · 2026-01-28T18:27:36.000+01:00
When preparing Code Assist requests, keep only tool calls that have thought_signature and downgrade only orphaned tool results to bounded plain text; avoid injecting internal downgrade transcript into the prompt.
diff --git a/src/connectors/gemini_base/chat_request_preparer.py b/src/connectors/gemini_base/chat_request_preparer.py
@@ -503,24 +503,59 @@ def _downgrade_tool_calls_to_text(self, canonical_request: Any) -> Any:
 
         downgraded: list[ChatMessage] = []
 
+        # Track which tool calls are safe to keep for signature-required backends.
+        # Any tool call without a thought_signature must be removed, and its tool
+        # result messages must be downgraded to plain text (otherwise Gemini may
+        # see orphaned functionResponse parts).
+        kept_tool_call_ids: set[str] = set()
+
+        for raw in messages:
+            role = (
+                raw.get("role") if isinstance(raw, dict) else getattr(raw, "role", None)
+            )
+            tool_calls = (
+                raw.get("tool_calls")
+                if isinstance(raw, dict)
+                else getattr(raw, "tool_calls", None)
+            )
+            if role != "assistant" or not isinstance(tool_calls, list):
+                continue
+            for tc in tool_calls:
+                if not self._extract_thought_signature(tc):
+                    continue
+                tc_id = (
+                    tc.get("id") if isinstance(tc, dict) else getattr(tc, "id", None)
+                )
+                if isinstance(tc_id, str) and tc_id:
+                    kept_tool_call_ids.add(tc_id)
+
         # Avoid exploding prompt size when tool signature recovery is impossible.
         # This path is a best-effort salvage mode, typically triggered after a proxy
         # restart or when a client does not preserve thought signatures.
         max_tool_result_chars = 2000
         max_converted_tool_messages = 50
 
-        # Keep only the most recent tool result messages.
-        tool_message_count = 0
+        # Keep only the most recent tool result messages that we need to downgrade.
+        convertible_tool_message_count = 0
         for raw in messages:
             role = (
                 raw.get("role") if isinstance(raw, dict) else getattr(raw, "role", None)
             )
-            if role == "tool":
-                tool_message_count += 1
-        tool_message_skip_before = max(
-            0, tool_message_count - max_converted_tool_messages
+            if role != "tool":
+                continue
+            tool_call_id = (
+                raw.get("tool_call_id")
+                if isinstance(raw, dict)
+                else getattr(raw, "tool_call_id", None)
+            )
+            if isinstance(tool_call_id, str) and tool_call_id in kept_tool_call_ids:
+                continue
+            convertible_tool_message_count += 1
+
+        convertible_tool_message_skip_before = max(
+            0, convertible_tool_message_count - max_converted_tool_messages
         )
-        tool_message_seen = 0
+        convertible_tool_message_seen = 0
 
         for msg in messages:
             if isinstance(msg, dict):
@@ -535,23 +570,71 @@ def _downgrade_tool_calls_to_text(self, canonical_request: Any) -> Any:
                 continue
 
             if msg.role == "assistant" and msg.tool_calls:
+                kept_tool_calls: list[Any] = []
+                for tc in msg.tool_calls:
+                    sig = self._extract_thought_signature(tc)
+                    if sig:
+                        kept_tool_calls.append(tc)
+                        tc_id = (
+                            tc.get("id")
+                            if isinstance(tc, dict)
+                            else getattr(tc, "id", None)
+                        )
+                        if isinstance(tc_id, str) and tc_id:
+                            kept_tool_call_ids.add(tc_id)
+
                 # IMPORTANT: Do not append any "downgrade" transcript text.
                 # That text becomes part of the prompt and can easily cause the model
                 # to repeat it, creating visible loops for clients.
-                downgraded.append(
-                    ChatMessage(
-                        role="assistant",
-                        content=msg.content,
-                        reasoning_content=msg.reasoning_content,
-                        name=msg.name,
+                if kept_tool_calls:
+                    # Preserve any descriptive content in a separate message.
+                    if msg.content:
+                        downgraded.append(
+                            ChatMessage(
+                                role="assistant",
+                                content=msg.content,
+                                name=msg.name,
+                            )
+                        )
+
+                    downgraded.append(
+                        ChatMessage(
+                            role="assistant",
+                            content=None,
+                            tool_calls=kept_tool_calls,
+                            reasoning_content=msg.reasoning_content,
+                            name=msg.name,
+                        )
+                    )
+                else:
+                    # No tool calls can be kept; keep the text content.
+                    downgraded.append(
+                        ChatMessage(
+                            role="assistant",
+                            content=msg.content,
+                            reasoning_content=msg.reasoning_content,
+                            name=msg.name,
+                        )
                     )
-                )
                 continue
 
             if msg.role == "tool":
-                tool_message_seen += 1
-                if tool_message_seen <= tool_message_skip_before:
+                tool_call_id = msg.tool_call_id
+                if (
+                    isinstance(tool_call_id, str)
+                    and tool_call_id
+                    and tool_call_id in kept_tool_call_ids
+                ):
+                    downgraded.append(msg)
                     continue
+
+                convertible_tool_message_seen += 1
+                if (
+                    convertible_tool_message_seen
+                    <= convertible_tool_message_skip_before
+                ):
+                    continue
+
                 tool_text = extract_prompt_text([msg])
                 if tool_text.startswith("tool:"):
                     tool_text = tool_text[len("tool:") :].lstrip()
diff --git a/tests/unit/connectors/gemini_base/test_chat_request_preparer_thought_signature_downgrade.py b/tests/unit/connectors/gemini_base/test_chat_request_preparer_thought_signature_downgrade.py
@@ -126,3 +126,80 @@ def capture(canonical_request: CanonicalChatRequest):
     await preparer.prepare(
         request_data=request_data, effective_model="gemini-3-flash-preview"
     )
+
+
+@pytest.mark.asyncio
+async def test_prepare_keeps_tool_calls_with_signatures_and_downgrades_only_missing() -> (
+    None
+):
+    context = MockConnectorContext()
+    converter = MockMessageConverter()
+    limiter = MockPromptLimiter()
+    builder = MockRequestBodyBuilder()
+
+    translation_service = MagicMock()
+
+    def capture(canonical_request: CanonicalChatRequest):
+        roles = [m.role for m in canonical_request.messages]
+        assert roles == ["user", "assistant", "assistant", "user", "tool"]
+
+        # Descriptive content preserved as text-only assistant message.
+        assert canonical_request.messages[1].tool_calls is None
+        assert str(canonical_request.messages[1].content) == "doing tool"
+
+        # Only the signed tool call remains.
+        assert canonical_request.messages[2].tool_calls is not None
+        assert len(canonical_request.messages[2].tool_calls) == 1
+        assert canonical_request.messages[2].content is None
+        assert canonical_request.messages[2].tool_calls[0].id == "t2"
+
+        # Unsigned tool response is converted to user text.
+        assert canonical_request.messages[3].role == "user"
+        assert "tool_call_id=t1" in str(canonical_request.messages[3].content)
+
+        # Signed tool response remains structured.
+        assert canonical_request.messages[4].role == "tool"
+        assert canonical_request.messages[4].tool_call_id == "t2"
+        return {"contents": [{"parts": [{"text": "ok"}]}]}
+
+    translation_service.from_domain_to_gemini_request = MagicMock(side_effect=capture)
+
+    preparer = ChatRequestPreparer(
+        connector_context=context,
+        message_converter=converter,
+        prompt_limiter=limiter,
+        request_body_builder=builder,
+        translation_service=translation_service,
+    )
+
+    request_data = CanonicalChatRequest(
+        model="gemini-3-flash-preview",
+        stream=True,
+        session_id="s1",
+        messages=[
+            ChatMessage(role="user", content="hi"),
+            ChatMessage(
+                role="assistant",
+                content="doing tool",
+                tool_calls=[
+                    ToolCall(
+                        id="t1",
+                        type="function",
+                        function=FunctionCall(name="list_files", arguments="{}"),
+                    ),
+                    ToolCall(
+                        id="t2",
+                        type="function",
+                        function=FunctionCall(name="read", arguments="{}"),
+                        extra_content={"google": {"thought_signature": "sig-1"}},
+                    ),
+                ],
+            ),
+            ChatMessage(role="tool", tool_call_id="t1", content="result-one"),
+            ChatMessage(role="tool", tool_call_id="t2", content="result-two"),
+        ],
+    )
+
+    await preparer.prepare(
+        request_data=request_data, effective_model="gemini-3-flash-preview"
+    )