Spaces:

waliaMuskaan011
/

calendar-event-extraction-demo

Sleeping

App Files Files Community

waliaMuskaan011 commited on Aug 17

Commit

790eff3

verified ·

1 Parent(s): 5d38601

Upload app.py with huggingface_hub

Browse files

Files changed (1) hide show

app.py +71 -62

app.py CHANGED Viewed

@@ -1,88 +1,97 @@
 import gradio as gr
 import json
 import torch
-from functools import lru_cache
-from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
-# Load model and tokenizer
-@lru_cache(maxsize=1)
 def load_model():
-    print("Loading model...")
-    base_model = AutoModelForCausalLM.from_pretrained(
-        "HuggingFaceTB/SmolLM-360M",
-        torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32,
-        device_map="auto"
-    )
-    tokenizer = AutoTokenizer.from_pretrained("HuggingFaceTB/SmolLM-360M")
     if tokenizer.pad_token is None:
         tokenizer.pad_token = tokenizer.eos_token
-    # Load LoRA adapters
     model = PeftModel.from_pretrained(base_model, "waliaMuskaan011/calendar-event-extractor-smollm")
-    model.eval()
-    print("Model loaded successfully!")
     return model, tokenizer
-model, tokenizer = load_model()
-def extract_calendar_event(event_text):
-    """Extract calendar information from natural language text."""
     if not event_text.strip():
         return "Please enter some text describing a calendar event."
-    # Build prompt
-    prompt = f"""Extract calendar fields from: "{event_text}".
-Return ONLY valid JSON with keys [action,date,time,attendees,location,duration,recurrence,notes].
-Use null for unknown.
-"""
     try:
-        # Tokenize and generate
-        inputs = tokenizer(prompt, return_tensors="pt")
-        inputs = {k: v.to(model.device) for k, v in inputs.items()}
         with torch.no_grad():
             outputs = model.generate(
-                **inputs,
-                max_new_tokens=160,
-                temperature=0.0,
                 do_sample=False,
-                pad_token_id=tokenizer.eos_token_id
             )
-        # Decode response
         full_response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-        # Robustly find the first complete JSON object in the output
-        def _find_first_json(text: str):
-            start = text.find("{")
-            if start == -1:
-                return None
-            depth = 0
-            for i in range(start, len(text)):
-                ch = text[i]
-                if ch == "{":
-                    depth += 1
-                elif ch == "}":
-                    depth -= 1
-                    if depth == 0:
-                        return text[start:i+1]
-            return None
-        json_part = _find_first_json(full_response)
-        if json_part is None and full_response.startswith(prompt):
-            json_part = _find_first_json(full_response[len(prompt):])
-        if json_part:
-            try:
-                parsed = json.loads(json_part)
-                return json.dumps(parsed, indent=2, ensure_ascii=False)
-            except json.JSONDecodeError:
-                return "Generated (may need manual cleanup):\n" + json_part
         else:
-            return "No JSON found.\n" + full_response
     except Exception as e:
         return f"Error processing request: {str(e)}"
@@ -127,17 +136,17 @@ with gr.Blocks(title="Calendar Event Extractor", theme=gr.themes.Soft()) as demo
         ],
         inputs=[input_text],
         outputs=[output_json],
-        fn=extract_calendar_event,
         cache_examples=False
     )
     extract_btn.click(
-        fn=extract_calendar_event,
         inputs=[input_text],
         outputs=[output_json]
     )
-    gr.Markdown("""
     ---
     **Model Details**: Fine-tuned SmolLM-360M using LoRA • **Dataset**: ~2500 calendar events • **Training**: Custom augmentation pipeline

 import gradio as gr
 import json
 import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer
 from peft import PeftModel
+# Global variables for model and tokenizer
+model = None
+tokenizer = None
 def load_model():
+    """Load the fine-tuned model and tokenizer."""
+    global model, tokenizer
+    if model is not None and tokenizer is not None:
+        return model, tokenizer
+    print("🔄 Loading fine-tuned model...")
+    # Load base model and tokenizer
+    base_model_id = "HuggingFaceTB/SmolLM-360M"
+    tokenizer = AutoTokenizer.from_pretrained(base_model_id)
     if tokenizer.pad_token is None:
         tokenizer.pad_token = tokenizer.eos_token
+    # Load base model
+    base_model = AutoModelForCausalLM.from_pretrained(
+        base_model_id,
+        torch_dtype=torch.float32,
+    )
+    # Load fine-tuned adapter
     model = PeftModel.from_pretrained(base_model, "waliaMuskaan011/calendar-event-extractor-smollm")
+    print("✅ Model loaded successfully!")
     return model, tokenizer
+def extract_json_from_text(text):
+    """Extract the first JSON object from text."""
+    try:
+        # Find first { and matching }
+        start = text.find('{')
+        if start == -1:
+            return None
+        depth = 0
+        for i in range(start, len(text)):
+            if text[i] == '{':
+                depth += 1
+            elif text[i] == '}':
+                depth -= 1
+                if depth == 0:
+                    json_str = text[start:i+1]
+                    return json.loads(json_str)
+        return None
+    except (json.JSONDecodeError, TypeError, ValueError):
+        return None
+def predict_calendar_event(event_text):
+    """Extract calendar information from event text."""
     if not event_text.strip():
         return "Please enter some text describing a calendar event."
     try:
+        # Load model
+        model, tokenizer = load_model()
+        # Create prompt - same format as test_model.py
+        prompt = f"Extract calendar information from: {event_text}\nCalendar JSON:"
+        # Tokenize
+        inputs = tokenizer(prompt, return_tensors="pt", padding=True)
+        # Generate
         with torch.no_grad():
             outputs = model.generate(
+                inputs.input_ids,
+                attention_mask=inputs.attention_mask,
+                max_new_tokens=150,
                 do_sample=False,
+                pad_token_id=tokenizer.eos_token_id,
             )
+        # Decode
         full_response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+        generated_text = full_response[len(prompt):].strip()
+        # Extract JSON
+        extracted_json = extract_json_from_text(generated_text)
+        if extracted_json:
+            return json.dumps(extracted_json, indent=2, ensure_ascii=False)
         else:
+            return f"Could not extract valid JSON. Raw output: {generated_text[:200]}..."
     except Exception as e:
         return f"Error processing request: {str(e)}"
         ],
         inputs=[input_text],
         outputs=[output_json],
+        fn=predict_calendar_event,
         cache_examples=False
     )
     extract_btn.click(
+        fn=predict_calendar_event,
         inputs=[input_text],
         outputs=[output_json]
     )
+    gr.Markdown(f"""
     ---
     **Model Details**: Fine-tuned SmolLM-360M using LoRA • **Dataset**: ~2500 calendar events • **Training**: Custom augmentation pipeline