server : fix pooled embedding output #14645

iamlemec · 2025-07-12T08:21:49Z

Fix pooled embedding server output issue reported in #14543. When using pooled embeddings, the response is now one vector per prompt entry. The response for unpooled embeddings is unchanged.

I'm not very familiar with reranking, so I didn't touch that path. But it seems like a similar fix could be in order there.

ggerganov · 2025-07-12T10:21:27Z

I'm also not very familiar with rerank. This change looks OK, so merging.

brunette69-ruby · 2025-07-12T14:10:05Z

Ty. I do have to mention that while investigating this I found a difference between accessing 1) /embedding or 2) openai url v1/embeddings. 2) V1/embeddings seemed to work producing one vector. On v1 reranking seem to work also.
For the record.

server : fix pooled embedding output

2f86bd6

iamlemec requested a review from ngxson as a code owner July 12, 2025 08:21

github-actions bot added examples server labels Jul 12, 2025

iamlemec mentioned this pull request Jul 12, 2025

Misc. bug: Embedding/pooling: I receive 10xvector not 1xvector #14543

Closed

ggerganov approved these changes Jul 12, 2025

View reviewed changes

ggerganov merged commit 0c1df14 into ggml-org:master Jul 12, 2025
48 checks passed

CISC linked an issue Jul 12, 2025 that may be closed by this pull request

Misc. bug: Embedding/pooling: I receive 10xvector not 1xvector #14543

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

server : fix pooled embedding output #14645

server : fix pooled embedding output #14645

iamlemec commented Jul 12, 2025

Uh oh!

Uh oh!

ggerganov commented Jul 12, 2025

Uh oh!

brunette69-ruby commented Jul 12, 2025

Uh oh!

Uh oh!

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

server : fix pooled embedding output #14645

server : fix pooled embedding output #14645

Conversation

iamlemec commented Jul 12, 2025

Uh oh!

Uh oh!

ggerganov commented Jul 12, 2025

Uh oh!

brunette69-ruby commented Jul 12, 2025

Uh oh!

Uh oh!

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.