Spaces:

davanstrien
/

Smol-Hub-tldr-gradio-api

Paused

davanstrien HF Staff commited on Feb 19

Commit

572201a

verified ·

1 Parent(s): 7243626

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,7 +6,9 @@ import logging
 from typing import Tuple, Literal
 import functools
 import spaces
-from cashews import cache
 # Set up logging
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
@@ -16,8 +18,8 @@ MODEL_NAME = "davanstrien/Smol-Hub-tldr"
 model = None
 tokenizer = None
 device = None
-cache.setup("mem://", size_limit="4gb")
 def load_model():
     global model, tokenizer, device
@@ -87,9 +89,9 @@ def _generate_summary_gpu(card_text: str, card_type: str) -> str:
     return summary
-@cache(ttl="6h")
 def generate_summary(card_text: str, card_type: str) -> str:
-    """Cached wrapper for generate_summary."""
     return _generate_summary_gpu(card_text, card_type)
 def summarize(hub_id: str = "", card_type: str = "model", content: str = "") -> str:

 from typing import Tuple, Literal
 import functools
 import spaces
+from cachetools import TTLCache
+from cachetools.func import ttl_cache
+import time
 # Set up logging
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 model = None
 tokenizer = None
 device = None
+CACHE_TTL = 6 * 60 * 60  # 6 hours in seconds
+CACHE_MAXSIZE = 100
 def load_model():
     global model, tokenizer, device
     return summary
+@ttl_cache(maxsize=CACHE_MAXSIZE, ttl=CACHE_TTL)
 def generate_summary(card_text: str, card_type: str) -> str:
+    """Cached wrapper for generate_summary with TTL."""
     return _generate_summary_gpu(card_text, card_type)
 def summarize(hub_id: str = "", card_type: str = "model", content: str = "") -> str: