Merge branch 'existence-master:master' into feature/outlook-integration

AnshumanAI · web-flow · commit f84745cda2ae · 2025-08-18T22:58:22.000+05:30
diff --git a/src/server/litellm-config.yaml b/src/server/litellm-config.yaml
@@ -1,21 +1,34 @@
 model_list:
+  # Primary: Tier 1 project
   - model_name: gemini-2.5-flash
     litellm_params:
       model: gemini/gemini-2.5-flash
-      api_key: os.environ/GEMINI_API_KEY
+      api_key: os.environ/GEMINI_API_KEY   # Tier 1 key
+
+  # Fallback: Free Tier project (aliased so LiteLLM doesn’t confuse it)
   - model_name: gemini-2.5-flash-fallback
     litellm_params:
-      model: gemini/gemini-2.5-flash
-      api_key: os.environ/GEMINI_API_KEY_FALLBACK_1
+      model: gemini/gemini-2.5-flash@fallback
+      api_key: os.environ/GEMINI_API_KEY_FALLBACK_1   # Free Tier key
+
+  # Last resort: flash-lite on Tier 1
   - model_name: gemini-2.5-flash-lite
     litellm_params:
       model: gemini/gemini-2.5-flash-lite
-      api_key: os.environ/GEMINI_API_KEY
-  - model_name: gemini-2.5-flash-lite
+      api_key: os.environ/GEMINI_API_KEY   # Tier 1 key
+
+  # Optional: flash-lite on Free Tier (extra cushion)
+  - model_name: gemini-2.5-flash-lite-fallback
     litellm_params:
-      model: gemini/gemini-2.5-flash-lite
+      model: gemini/gemini-2.5-flash-lite@fallback
       api_key: os.environ/GEMINI_API_KEY_FALLBACK_1
 
 litellm_settings:
   drop_params: true
-  fallbacks: [{"gemini-2.5-flash": ["gemini-2.5-flash-lite","gemini-2.5-flash-fallback"]}]
+  pre_call_checks: true         # check quota before routing
+  num_retries: 3                # retry call up to 3 times per model before moving on
+  request_timeout: 10           # raise error if request takes >10s
+  allowed_fails: 3              # cooldown model if >3 fails/min
+  cooldown_time: 30             # cooldown duration in seconds
+  fallbacks:
+    - {"gemini-2.5-flash": ["gemini-2.5-flash-fallback", "gemini-2.5-flash-lite", "gemini-2.5-flash-lite-fallback"]}
diff --git a/src/server/main/db.py b/src/server/main/db.py
@@ -16,10 +16,16 @@
 
 DB_ENCRYPTION_ENABLED = ENVIRONMENT == 'stag'
 
+def _datetime_serializer(obj):
+    """JSON serializer for objects not serializable by default json code, like datetime."""
+    if isinstance(obj, datetime.datetime):
+        return obj.isoformat()
+    raise TypeError(f"Object of type {obj.__class__.__name__} is not JSON serializable")
+
 def _encrypt_field(data: Any) -> Any:
     if not DB_ENCRYPTION_ENABLED or data is None:
         return data
-    data_str = json.dumps(data)
+    data_str = json.dumps(data, default=_datetime_serializer)
     return aes_encrypt(data_str)
 
 def _decrypt_field(data: Any) -> Any: