github-starred/open-webui

mirror of https://github.com/open-webui/open-webui.git synced 2026-05-07 03:18:23 -05:00

[GH-ISSUE #8160] v0.5.2 Token Generation Slower Than v0.4.8 #15023

New Issue

Closed

opened 2026-04-19 21:18:42 -05:00 by GiteaMirror · 0 comments

GiteaMirror commented

2026-04-19 21:18:42 -05:00

Owner

Originally created by @yanghan-cyber on GitHub (Dec 28, 2024).
Original GitHub issue: https://github.com/open-webui/open-webui/issues/8160

Performance Regression in Token Generation Speed (v0.5.2 vs v0.4.8)

Environment Details

Version: v0.5.2
Deployment Method: Docker
Backend: Open-WebUI
API Management: Self-hosted OneAPI for OpenAI API

Issue Description

I've noticed a significant performance degradation in token generation speed when comparing version v0.5.2 to v0.4.8.

Steps to Reproduce

Deploy Open-WebUI using Docker
Use OneAPI to manage OpenAI API
Compare token generation speed between v0.4.8 and v0.5.2

Observed Behavior

In v0.4.8: Token generation was faster and more responsive
In v0.5.2: Token generation speed has noticeably decreased

Expected Behavior

Token generation speed should remain consistent or improve between versions.

Additional Information

Can provide more detailed performance metrics if needed
Willing to assist in debugging or providing more information

Suggested Next Steps

Investigate potential performance regressions
Review changes between v0.4.8 and v0.5.2 that might impact token generation speed

Originally created by @yanghan-cyber on GitHub (Dec 28, 2024). Original GitHub issue: https://github.com/open-webui/open-webui/issues/8160 ## Performance Regression in Token Generation Speed (v0.5.2 vs v0.4.8) ### Environment Details - **Version**: v0.5.2 - **Deployment Method**: Docker - **Backend**: Open-WebUI - **API Management**: Self-hosted OneAPI for OpenAI API ### Issue Description I've noticed a significant performance degradation in token generation speed when comparing version v0.5.2 to v0.4.8. ### Steps to Reproduce 1. Deploy Open-WebUI using Docker 2. Use OneAPI to manage OpenAI API 3. Compare token generation speed between v0.4.8 and v0.5.2 ### Observed Behavior - In v0.4.8: Token generation was faster and more responsive - In v0.5.2: Token generation speed has noticeably decreased ### Expected Behavior Token generation speed should remain consistent or improve between versions. ### Additional Information - Can provide more detailed performance metrics if needed - Willing to assist in debugging or providing more information ### Suggested Next Steps - Investigate potential performance regressions - Review changes between v0.4.8 and v0.5.2 that might impact token generation speed

GiteaMirror closed this issue

2026-04-19 21:18:42 -05:00

GiteaMirror referenced this issue

2026-04-19 23:04:00 -05:00

[GH-ISSUE #14670] issue: Azure Document Intelligence can crash Open WebUI #17330

GiteaMirror referenced this issue

2026-04-19 23:12:10 -05:00

[GH-ISSUE #15023] refac: make file upload process async (w/ polling) #17442

GiteaMirror referenced this issue

2026-04-19 23:27:06 -05:00

[GH-ISSUE #15702] issue: Failed uploading large markdown files to Knowledge #17643

GiteaMirror referenced this issue

2026-04-19 23:28:26 -05:00

[GH-ISSUE #15758] issue: Document Upload on Large PDFs Results in Gateway Timeout #17660

GiteaMirror referenced this issue

2026-04-19 23:41:46 -05:00

[GH-ISSUE #16158] issue: Processing does not continue after open_webui.retrieval.utils:generate_openai_batch_embeddings call #17807

GiteaMirror referenced this issue

2026-04-19 23:44:10 -05:00

[GH-ISSUE #16275] feat: Why are files uploaded to Knowledge Base processed one by one, even during bulk uploads? #17845

GiteaMirror referenced this issue

2026-04-20 00:49:44 -05:00

[GH-ISSUE #18495] feat: Add configurable timeout for MinerU document processing API #18614

GiteaMirror referenced this issue

2026-04-25 06:43:21 -05:00

[GH-ISSUE #14670] issue: Azure Document Intelligence can crash Open WebUI #32859

GiteaMirror referenced this issue

2026-04-25 06:48:50 -05:00

[GH-ISSUE #15023] refac: make file upload process async (w/ polling) #32971

GiteaMirror referenced this issue

2026-04-25 07:04:24 -05:00

[GH-ISSUE #15702] issue: Failed uploading large markdown files to Knowledge #33172

GiteaMirror referenced this issue

2026-04-25 07:06:01 -05:00

[GH-ISSUE #15758] issue: Document Upload on Large PDFs Results in Gateway Timeout #33189

GiteaMirror referenced this issue

2026-04-25 07:14:24 -05:00

[GH-ISSUE #16158] issue: Processing does not continue after open_webui.retrieval.utils:generate_openai_batch_embeddings call #33336

GiteaMirror referenced this issue

2026-04-25 07:16:19 -05:00

[GH-ISSUE #16275] feat: Why are files uploaded to Knowledge Base processed one by one, even during bulk uploads? #33374

GiteaMirror referenced this issue

2026-04-25 08:04:06 -05:00

[GH-ISSUE #18495] feat: Add configurable timeout for MinerU document processing API #34143

GiteaMirror referenced this issue

2026-05-05 18:27:46 -05:00

[GH-ISSUE #14670] issue: Azure Document Intelligence can crash Open WebUI #55996

GiteaMirror referenced this issue

2026-05-05 18:43:09 -05:00

[GH-ISSUE #15023] refac: make file upload process async (w/ polling) #56108

GiteaMirror referenced this issue

2026-05-05 19:08:40 -05:00

[GH-ISSUE #15702] issue: Failed uploading large markdown files to Knowledge #56309

GiteaMirror referenced this issue

2026-05-05 19:10:29 -05:00

[GH-ISSUE #15758] issue: Document Upload on Large PDFs Results in Gateway Timeout #56326

GiteaMirror referenced this issue

2026-05-05 19:29:25 -05:00

[GH-ISSUE #16158] issue: Processing does not continue after open_webui.retrieval.utils:generate_openai_batch_embeddings call #56473

GiteaMirror referenced this issue

2026-05-05 19:34:17 -05:00

[GH-ISSUE #16275] feat: Why are files uploaded to Knowledge Base processed one by one, even during bulk uploads? #56511

GiteaMirror referenced this issue

2026-05-05 20:48:44 -05:00

[GH-ISSUE #18495] feat: Add configurable timeout for MinerU document processing API #57280

Sign in to join this conversation.

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: github-starred/open-webui#15023