Add proxy support for OpenAI

2025-07-12 10:37:00 +03:00 · 2025-07-12 10:37:00 +03:00 · bf830fd330
parent c5306bb56e
commit bf830fd330
4 changed files with 50 additions and 11 deletions
--- a/env_example.txt
+++ b/env_example.txt
@ -1,6 +1,7 @@
 OPENAI_API_KEY=your_openai_api_key_here
-OPENAI_MODEL=gpt-4o-mini
+OPENAI_MODEL=gpt-4o
 OPENAI_TEMPERATURE=0.0
+OPENAI_PROXY_URL='socks5h://37.18.73.60:5566' # socks5 recommended

 DB_PATH=./data/wiki.db

--- a/src/adapters/llm.py
+++ b/src/adapters/llm.py
@ -1,12 +1,15 @@
 import asyncio
 import time

+import httpx
 import openai
 import structlog
 import tiktoken
 from openai import AsyncOpenAI
 from openai.types.chat import ChatCompletion

+from src.models.constants import LLM_MAX_INPUT_TOKENS, MAX_TOKEN_LIMIT_WITH_BUFFER
+
 from ..models import AppConfig
 from .base import BaseAdapter, CircuitBreaker, RateLimiter, with_retry

@ -31,7 +34,10 @@ class LLMProviderAdapter(BaseAdapter):
        super().__init__("llm_adapter")
        self.config = config

-        self.client = AsyncOpenAI(api_key=config.openai_api_key)
+        self.client = AsyncOpenAI(
+            api_key=config.openai_api_key,
+            http_client=self._build_http_client()
+        )

        try:
            self.tokenizer = tiktoken.encoding_for_model(config.openai_model)
@ -87,7 +93,7 @@ class LLMProviderAdapter(BaseAdapter):
                model=self.config.openai_model,
                messages=messages,
                temperature=self.config.openai_temperature,
-                max_tokens=1500,
+                max_tokens=MAX_TOKEN_LIMIT_WITH_BUFFER,
            )
            return response
        except openai.RateLimitError as e:
@ -102,8 +108,8 @@ class LLMProviderAdapter(BaseAdapter):
        prompt_template: str,
    ) -> tuple[str, int, int]:
        input_tokens = self.count_tokens(wiki_text)
-        if input_tokens > 6000:
-            raise LLMTokenLimitError(f"Текст слишком длинный: {input_tokens} токенов (лимит 6000)")
+        if input_tokens > LLM_MAX_INPUT_TOKENS:
+            raise LLMTokenLimitError(f"Текст слишком длинный: {input_tokens} токенов")

        try:
            prompt_text = prompt_template.format(
@ -142,7 +148,7 @@ class LLMProviderAdapter(BaseAdapter):

        output_tokens = self.count_tokens(simplified_text)

-        if output_tokens > 1200:
+        if output_tokens > MAX_TOKEN_LIMIT_WITH_BUFFER:
            self.logger.warning(
                "Упрощённый текст превышает лимит",
                output_tokens=output_tokens,
@ -179,6 +185,16 @@ class LLMProviderAdapter(BaseAdapter):

        return messages

+    def _build_http_client(self) -> httpx.AsyncClient:
+        if self.config.openai_proxy_url:
+            return httpx.AsyncClient(
+                proxy=self.config.openai_proxy_url,
+                timeout=60.0
+            )
+        return httpx.AsyncClient(timeout=60.0)
+
+
+
    async def health_check(self) -> bool:
        try:
            test_messages = [{"role": "user", "content": "Ответь 'OK' если всё работает."}]
--- a/src/models/config.py
+++ b/src/models/config.py
@ -19,6 +19,7 @@ class AppConfig(BaseSettings):
    openai_temperature: float = Field(
        default=0.0, ge=0.0, le=2.0, description="Температура для LLM"
    )
+    openai_proxy_url: str | None = Field(description="Proxy URL для OpenAI")

    db_path: str = Field(default="./data/wiki.db", description="Путь к файлу SQLite")

@ -33,7 +34,7 @@ class AppConfig(BaseSettings):
    log_level: Literal["DEBUG", "INFO", "WARNING", "ERROR"] = Field(default="INFO")
    log_format: Literal["json", "text"] = Field(default="json")

-    chunk_size: int = Field(default=2000, ge=500, le=8000, description="Размер чанка для текста")
+    chunk_size: int = Field(default=2000, ge=500, le=122000, description="Размер чанка для текста")
    chunk_overlap: int = Field(default=200, ge=0, le=1000, description="Перекрытие между чанками")
    max_retries: int = Field(default=3, ge=1, le=10, description="Максимум попыток повтора")
    retry_delay: float = Field(
--- a/src/services/write_queue.py
+++ b/src/services/write_queue.py
@ -65,6 +65,8 @@ class AsyncWriteQueue:
        await self._queue.put(operation)

    async def update_from_result(self, result: ProcessingResult) -> ArticleDTO:
+        self.logger.info("Получен результат для записи", url=result.url, success=result.success)
+        
        future: asyncio.Future[ArticleDTO] = asyncio.Future()

        operation = WriteOperation(
@ -73,15 +75,20 @@ class AsyncWriteQueue:
        )
        operation.future = future

+        self.logger.info("Добавляем операцию в очередь", url=result.url)
        await self._queue.put(operation)
-        return await future
+        self.logger.info("Операция добавлена в очередь, ожидаем результат", url=result.url)
+        
+        result_article = await future
+        self.logger.info("Получен результат из очереди", url=result.url)
+        return result_article

    async def _worker_loop(self) -> None:
        batch: list[WriteOperation] = []

        while not self._shutdown_event.is_set():
            batch = await self._collect_batch(batch)
-            if batch and (len(batch) >= self.max_batch_size or self._shutdown_event.is_set()):
+            if batch:
                await self._process_batch(batch)
                batch.clear()

@ -90,7 +97,7 @@ class AsyncWriteQueue:

    async def _collect_batch(self, batch: list[WriteOperation]) -> list[WriteOperation]:
        try:
-            timeout = 0.1 if batch else 1.0
+            timeout = 1.0 if not batch else 0.1
            operation = await asyncio.wait_for(self._queue.get(), timeout=timeout)
            batch.append(operation)
            return batch
@ -117,12 +124,18 @@ class AsyncWriteQueue:

    async def _process_operation_safely(self, operation: WriteOperation) -> None:
        try:
+            self.logger.info("Начинаем обработку операции", 
+                           operation_type=operation.operation_type,
+                           url=operation.result.url if operation.result else "N/A")
+            
            await self._process_single_operation(operation)
            self._total_operations += 1

            if operation.future and not operation.future.done():
                if operation.operation_type == "update_from_result" and operation.result:
+                    self.logger.info("Получаем статью из репозитория", url=operation.result.url)
                    article = await self.repository.get_by_url(operation.result.url)
+                    self.logger.info("Статья получена, устанавливаем результат", url=operation.result.url)
                    operation.future.set_result(article)

        except Exception as e:
@ -145,11 +158,15 @@ class AsyncWriteQueue:
            raise ValueError(msg)

    async def _update_article_from_result(self, result: ProcessingResult) -> ArticleDTO:
+        self.logger.info("Начинаем обновление статьи из результата", url=result.url)
+        
        article = await self.repository.get_by_url(result.url)
        if not article:
            msg = f"Статья с URL {result.url} не найдена"
            raise ValueError(msg)

+        self.logger.info("Статья найдена, обновляем поля", url=result.url, success=result.success)
+
        if result.success:
            if not (result.title and result.raw_text and result.simplified_text):
                msg = "Неполные данные в успешном результате"
@ -162,7 +179,11 @@ class AsyncWriteQueue:
            from src.models.article_dto import ArticleStatus
            article.status = ArticleStatus.FAILED

-        return await self.repository.update_article(article)
+        self.logger.info("Сохраняем обновлённую статью", url=result.url)
+        updated_article = await self.repository.update_article(article)
+        self.logger.info("Статья успешно обновлена", url=result.url)
+        
+        return updated_article

    @property
    def queue_size(self) -> int: