From f7165cc7530f4f78b1aeae1e4d60b5fd7fb0fc56 Mon Sep 17 00:00:00 2001
From: Sunghyun Park <sunggg@umich.edu>
Date: Wed, 22 Nov 2023 05:03:05 +0000
Subject: [PATCH] fix

---
 serve/mlc_serve/run.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/serve/mlc_serve/run.py b/serve/mlc_serve/run.py
index d2df68a8d1..ca462bad66 100644
--- a/serve/mlc_serve/run.py
+++ b/serve/mlc_serve/run.py
@@ -31,8 +31,8 @@ def parse_args():
     args.add_argument("--local-id", type=str, required=True)
     args.add_argument("--artifact-path", type=str, default="dist")
     args.add_argument("--use-staging-engine", action="store_true")
-    args.add_argument("--max-num-batched-tokens", type=int, default=-1)
-    args.add_argument("--max-input-len", type=int, default=-1)
+    args.add_argument("--max-num-sequences", type=int, default=8)
+    args.add_argument("--max-input-len", type=int, default=512)
     args.add_argument("--min-decode-steps", type=int, default=12)
     args.add_argument("--max-decode-steps", type=int, default=16)
     args.add_argument("--prompt-allocate-ratio", type=float, default=2.0)
@@ -90,7 +90,7 @@ def create_engine(
     # Set the engine config
     engine_config = get_engine_config({
         "use_staging_engine": args.use_staging_engine,
-        "max_num_batched_tokens": args.max_num_batched_tokens, 
+        "max_num_sequences": args.max_num_sequences,
         "max_input_len": args.max_input_len,    
         "min_decode_steps": args.min_decode_steps,
         "max_decode_steps": args.max_decode_steps,