did I really need to specify the context window size in API requests this whole time?

2025-08-13 04:13:19 +08:00 · 2025-04-08 23:55:04 +00:00 · 2025-04-08 23:55:04 +00:00 · e523d88d23
commit e523d88d23
parent 7373249dee
1 changed files with 28 additions and 0 deletions
--- a/src/services/llm/providers/ollama_service.ts
+++ b/src/services/llm/providers/ollama_service.ts
@ -99,6 +99,8 @@ export class OllamaService extends BaseAIService {
                messages: messagesToSend,
                options: {
                    temperature,
                    // Add num_ctx parameter based on model capabilities
                    num_ctx: await this.getModelContextWindowTokens(model),
                    // Add response_format for requests that expect JSON
                    ...(expectsJsonResponse ? { response_format: { type: "json_object" } } : {})
                },
@ -385,4 +387,30 @@ export class OllamaService extends BaseAIService {
            throw error;
        }
    }
    /**
     * Gets the context window size in tokens for a given model
     * @param modelName The name of the model
     * @returns The context window size in tokens
     */
    private async getModelContextWindowTokens(modelName: string): Promise<number> {
        try {
            // Import model capabilities service
            const modelCapabilitiesService = (await import('../model_capabilities_service.js')).default;
            // Get model capabilities
            const modelCapabilities = await modelCapabilitiesService.getModelCapabilities(modelName);
            // Get context window tokens with a default fallback
            const contextWindowTokens = modelCapabilities.contextWindowTokens || 8192;
            log.info(`Using context window size for ${modelName}: ${contextWindowTokens} tokens`);
            return contextWindowTokens;
        } catch (error: any) {
            // Log error but provide a reasonable default
            log.error(`Error getting model context window: ${error.message}`);
            return 8192; // Default to 8192 tokens if there's an error
        }
    }
 }