DeepSeek AI: Fortschritt in der KI-Entwicklung mit minimalen Ressourcen

Chinesisches Unternehmen präsentiert beeindruckendes KI-Modell und zeigt, dass AGI in greifbare Nähe rückt.

In der Welt der Künstlichen Intelligenz hat das chinesische Unternehmen DeepSeek kürzlich einen bemerkenswerten Fortschritt erzielt, der sowohl die Technik als auch die finanzielle Tragfähigkeit betrifft. Mit nur 9% des typischen Rechenaufwands für das Training von Künstlicher Intelligenz hat DeepSeek ein leistungsstarkes Modell entwickelt, das mit den besten KI-Systemen konkurrieren kann. Dieses Fortschreiten in der KI-Entwicklung deutet darauf hin, dass wir auf dem Weg zu einer Allgemeinen Künstlichen Intelligenz (AGI) sind, deren Kosten für Training und Inferenz erschwinglicher werden könnten.

DeepSeek hat nun ein hochmodernes, gewichtsoptimiertes Sprachmodell (LLM) veröffentlicht, das auf einem relativ bescheidenen Budget von lediglich 6 Millionen US-Dollar und einem Einsatz von 2048 GPUs über einen Zeitraum von zwei Monaten trainiert wurde. Diese Ressourcennutzung steht im krassen Gegensatz zu bisherigen Standardmodellen, für die oft Cluster von bis zu 16.000 GPUs oder mehr erforderlich sind. Zum Vergleich: Das bekannte Llama 3-Modell mit 405 Milliarden Parametern benötigte sogar 30,8 Millionen GPU-Stunden. DeepSeek-V3 hingegen erreicht ähnliche oder sogar bessere Ergebnisse mit nur 2,8 Millionen GPU-Stunden – das entspricht einem Einsparpotenzial von etwa 11-fach.

Was diese Entwicklung noch faszinierender macht, ist die Möglichkeit, dass DeepSeek-V3 nicht nur in der Theorie funktioniert, sondern auch in praktischen Tests hohe Bewertungen erhält. In den aktuellen Rankings und Vergleichen in der LLM-Arena schneidet das Modell bereits vielversprechend ab. Sollten sich die positiven Tests weiter bestätigen, wäre dies ein beeindruckendes Beispiel für Forschung und Ingenieurkunst unter eingeschränkten Ressourcen.

Brian Wang, ein angesehener Futurist und Wissenschaftsblogger mit einer Leserschaft von einer Million pro Monat, hebt die Relevanz solcher Technologien hervor. Auf seiner Plattform, Nextbigfuture.com, beleuchtet er disruptive Technologien, darunter Raumfahrt, Robotik, Biotechnologie und Künstliche Intelligenz. Wang, der auch als Co-Gründer eines Startups fungiert und in der Investitionslandschaft tätig ist, betrachtet diese Entwicklungen als ein Zeichen dafür, dass der technologische Fortschritt nicht nur machbar, sondern auch zugänglich ist. Durch Engagement bei TEDx, Singularity University und zahlreichen Medienauftritten hat er sich als Vordenker für hochinnovative Technologien etabliert.

Die Errungenschaften von DeepSeek und die sich abzeichnenden Fortschritte in der Künstlichen Intelligenz zeigen, dass wir uns in eine neue Ära der Effizienz und Leistung bewegen. Wenn Ressourcenverbrauch und Kosten weiterhin optimiert werden, ist es durchaus möglich, dass wir dem Ziel einer Allgemeinen Künstlichen Intelligenz näherkommen als je zuvor.

Teile den Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert