This repository was archived by the owner on Jul 4, 2025. It is now read-only.

feat: vLLM backend #2010

Draft

gau-nernst wants to merge 93 commits into dev

from thien/python_engine

Draft

feat: vLLM backend #2010

gau-nernst wants to merge 93 commits into dev from thien/python_engine

Conversation

gau-nernst

gau-nernst added 30 commits

February 14, 2025 09:14

@gau-nernst


 wip: download uv

60b13bb

@gau-nernst


 Merge branch 'dev' into thien/python_engine

3ddce8c

@gau-nernst


 fix: has_value -> has_error

f9817c8

@gau-nernst


 move uv stuff to python_engine. use uv to start process

2dbc296

@gau-nernst


 redirect stdout/stderr

eec24bd

@gau-nernst


 simplify code

26fdbd3

@gau-nernst


 rename python engine interface

3ba7994

@gau-nernst


 use PythonEngineI

5e7125f

@gau-nernst


 more checks to match all EngineV variants

c5da0ee

@gau-nernst


 improve Python load model

3c097fb

@gau-nernst


 consolidate process-related functions

84db8b0

@gau-nernst


 update PythonModelConfig. add UnloadModel

8ee815c

@gau-nernst


 implement PythonEngine::GetModels

29f5344

@gau-nernst


 Merge branch 'dev' into thien/python_engine

75ce355

@gau-nernst


 implement getModelStatus. add some notes

7949dcc

@gau-nernst


 add router for python

e2f0323

@gau-nernst


 call PythonEngine destructor

607d2cb

@gau-nernst


 remove unused method

f58b773

@gau-nernst


 remove unnecessary headers

bf23c9f

@gau-nernst


 Merge branch 'dev' into thien/python_engine

d7818d5

@gau-nernst


 remove unused stuff

8ebee7c

@gau-nernst


 download uv directly from github release

8f36adc

@gau-nernst


 check for entrypoint

5ebfbb7

@gau-nernst


 only record model size for llama.cpp

5d310d1

@gau-nernst


 don't include headers

c4c622c

@gau-nernst


 Merge branch 'dev' into thien/python_engine

fc0369c

@gau-nernst


 don't use std::optional to support < c++17

6b59878

@gau-nernst


 fix stringstream usage

250a2ac

@gau-nernst


 define pid_t for windows

bb38a56

@gau-nernst


 explicit call .string() on filesystem::path to support windows

723c5db

gau-nernst added 16 commits

March 18, 2025 13:06

@gau-nernst


 support download HF model

591d461

@gau-nernst


 use / for HF model

c3d41bf

@gau-nernst


 fix thread-unsafe

dc42ddd

@gau-nernst


 Merge branch 'dev' into thien/python_engine

13d9e3f

@gau-nernst


 Merge branch 'dev' into thien/python_engine

70151e2

@gau-nernst


 remove methods

73fe3e5

@gau-nernst


 remove old remnants

7bf287d

@gau-nernst


 support models list. add --relocatable for venv

2a2b607

@gau-nernst


 preparation works for start model

fffc686

@gau-nernst


 add sync download util. add vLLM version config. some boilerplate cod...

cea8020

...e to launch model (non-functional atm)

@gau-nernst


 list engines

86d4c01

@gau-nernst


 load and unload model

ec8b36d

@gau-nernst


 retrieve cortex port from yaml file

@gau-nernst


 add env vars support. log stdout and stderr

eeccd3a

@gau-nernst


 add GetModelStatus and GetModels

6fe7ae8

@gau-nernst


 fix typo

074a04a

@gau-nernst gau-nernst moved this from Icebox to In Progress in Menlo

Mar 20, 2025

gau-nernst added 2 commits

March 21, 2025 15:34

@gau-nernst


 Merge branch 'dev' into thien/python_engine

cd55d64

@gau-nernst


 add non-stream chat completions

368a4f3

@gau-nernst gau-nernst mentioned this pull request

Mar 22, 2025

idea: Apple MLX #678

Open

vansangpfiev and others added 10 commits

March 27, 2025 15:12

@vansangpfiev


 Merge pull request #2186 from menloresearch/s/chore/sync-dev

c0e0fca

fix: std::filesystem::equivalent does not work for non-exist path

@gau-nernst


 Merge branch 'main' into thien/python_engine

e141891

@gau-nernst


 add uninstall cmd

807b201

@gau-nernst


 support streaming

d38eca8

@gau-nernst


 fix cortex run

7e002cd

@gau-nernst


 wait for vLLM server to be up

1ebbbdb

@gau-nernst


 use health check for some stuff

b5d8315

@gau-nernst


 add some notes. support embeddings. support some extra vLLM args

5feda51

@gau-nernst


 remove old tests. some chores

5eea345

@gau-nernst


 remove unused function

2bde26a

Labels

None yet

3 participants

@gau-nernst @ramonpzg @vansangpfiev

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

feat: vLLM backend #2010

Are you sure you want to change the base?

feat: vLLM backend #2010

Uh oh!

Conversation

@gau-nernst gau-nernst commented Feb 21, 2025 •

edited

Loading

Uh oh!

Describe Your Changes

High-level design

`cortex engines install vllm`

`cortex models start <model>`

Fixes Issues

Self Checklist

Uh oh!

Uh oh!

feat: vLLM backend #2010

Are you sure you want to change the base?

feat: vLLM backend #2010

Uh oh!

Conversation

@gau-nernst gau-nernst commented Feb 21, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Describe Your Changes

High-level design

cortex engines install vllm

cortex models start <model>

Fixes Issues

Self Checklist

Uh oh!

Uh oh!

@gau-nernst gau-nernst commented Feb 21, 2025 •

edited

Loading

`cortex engines install vllm`

`cortex models start <model>`