sgl-project · WANG-GH · Mar 26, 2025 · Mar 26, 2025 · Mar 27, 2025 · Mar 28, 2025
@@ -173,8 +173,6 @@ def forward_batch_generation(
     ) -> Tuple[LogitsProcessorOutput, Optional[torch.Tensor]]:
         forward_batch = ForwardBatch.init_new(model_worker_batch, self.model_runner)
         logits_output = self.model_runner.forward(forward_batch)
-        if launch_done:
-            launch_done.set()
 
         if skip_sample:
             next_token_ids = None

@@ -132,7 +132,6 @@ def forward_thread_func_(self):
             batch_pt += 1
 
             # Create event
-            self.launch_done = threading.Event()
             copy_done = torch.get_device_module(self.device).Event()
 
             # Resolve future tokens in the input
@@ -141,7 +140,7 @@ def forward_thread_func_(self):
 
             # Run forward
             logits_output, next_token_ids = self.worker.forward_batch_generation(
-                model_worker_batch, self.launch_done
+                model_worker_batch
             )
 
             # Update the future token ids map
@@ -171,7 +170,6 @@ def forward_thread_func_(self):
     def resolve_batch_result(self, bid: int):
         copy_done, logits_output, next_token_ids = self.output_queue.get()
         copy_done.synchronize()
-        self.launch_done.wait()
 
         if logits_output.next_token_logprobs is not None:
             logits_output.next_token_logprobs = (