Alibaba hat mit Qwen 2.5 eine neue Version seiner KI-Sprachmodelle vorgestellt. Die Serie umfasst verschiedene Modelle, darunter Qwen2.5-Max, Qwen2.5-VL (ein visuell-sprachliches Modell) und Qwen2.5-1M (ein Modell mit erweitertem Kontext). Sie sind teilweise Open Source.

Besonders hervorzuheben ist Qwen2.5-Max, das auf einer Mixture-of-Experts (MoE)-Architektur basiert und mit über 20 Billionen Tokens vortrainiert wurde. Dieses Modell wurde durch überwachte Feinabstimmung und Verstärkungslernen aus menschlichem Feedback weiter verfeinert. In Benchmark-Tests übertrifft Qwen2.5-Max andere führende Modelle wie GPT-4o, DeepSeek-V3 und Llama-3.1-405B in mehreren Kategorien.

Die Qwen 2.5-Serie stellt einen bedeutenden Fortschritt in der KI-Entwicklung von Alibaba dar und soll in verschiedenen Anwendungsbereichen wie Text- und Bildverarbeitung sowie Audioanalyse eingesetzt werden.

Tags:

Comments are closed