Künstliche Intelligenz 28.01.2025, 16:30 Uhr

So gelang China das KI-Wunder Deepseek trotz Chipembargo

Dem chinesischen KI-Start-up Deepseek scheint ein leistungsstarkes KI-Modell gelungen zu sein, das mit geringen Ressourcen auskommt.

China DeepSeek AI

Die USA dachten, sie könnten China beim Wettlauf um die künstliche Intelligenz mit Ausfuhrbeschränkungen für Hochleistungschips auf Abstand halten. Deepseek beweist: Die Strategie ist gescheitert.

Foto: picture alliance / ASSOCIATED PRESS/Andy Wong

Künstliche Intelligenz (KI) hat in den letzten Jahren riesige Fortschritte gemacht. Eine der jüngsten Sensationen ist die leistungsfähige KI-Plattform Deepseek V3 und R1 aus China. Was diese Entwicklung des gleichnamigen Start-ups besonders bemerkenswert macht, ist Chinas Fähigkeit, trotz eines Embargos bezüglich der Halbleiter in Schlüsseltechnologien durch westliche Staaten eine so beeindruckende KI zu entwickeln. In offenbar überschaubarer Entwicklungszeit und mit ebenfalls überschaubaren Ressourcen ist eine kompetitive KI entstanden, die zudem noch auf einem freien Lizenzmodell zugänglich ist.

Deepseek verarbeitet Informationen aus Text, Bild, Video und Audio gleichzeitig

Deepseek basiert auf einem fortschrittlichen Transformer-Modell – ähnlich wie GPT (Generative Pretrained Transformer), jedoch mit spezifischen Optimierungen, die es in seiner Architektur neuartig machen. Auffällig ist der Multi-Dimensional-Attention-Mechanismus, der es ermöglicht, nicht nur sequenzielle, sondern auch multi-modale Daten in Echtzeit zu verarbeiten. Das bedeutet, dass das Modell Informationen aus Text, Bild, Video und Audio gleichzeitig verarbeiten kann, ohne separate Module zu benötigen.

Ein weiteres Merkmal ist das adaptive Quantisierungsverfahren. Diese Methode optimiert die Präzision der numerischen Repräsentation und reduziert dadurch den Bedarf an hochleistungsfähigen Chips erheblich. Ebenfalls als ressourcenschonend ist der Einsatz von Federated Learning. Diese Technik erlaubt es, das Training eines Modells auf eine Vielzahl verteilter Systeme aufzuteilen. Dadurch kann Deepseek effizient trainiert und genutzt werden, ohne dass eine zentrale Hochleistungsinfrastruktur erforderlich ist.

Stellenangebote im Bereich IT/TK-Projektmanagement

IT/TK-Projektmanagement Jobs
Mercer Stendal GmbH-Firmenlogo
Betriebstechniker (m/w/d) Prozessleittechnik Mercer Stendal GmbH
Arneburg Zum Job 
Wirtgen GmbH-Firmenlogo
Project Manager Product Lifecycle Management (m/w/d) Wirtgen GmbH
Windhagen Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur (w/m/d) Informationssicherheit Die Autobahn GmbH des Bundes
Frankfurt Zum Job 
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
Evonik Operations GmbH-Firmenlogo
Ingenieur (m/w/d) Informatik / Elektrotechnik / Automatisierungstechnik / Chemische Produktion Evonik Operations GmbH
Fachhochschule Dortmund-Firmenlogo
Zukunftsmacher*in Fachhochschule Dortmund
Dortmund Zum Job 
Hochschule Reutlingen-Firmenlogo
Akademische:r Mitarbeiter:in (m/w/x) "SMARTE ASSISTENZSYSTEME" Hochschule Reutlingen
Reutlingen Zum Job 
Stadtwerke Verkehrsgesellschaft Frankfurt am Main mbH-Firmenlogo
Planungsingenieur:in / Projektleiter:in Fahrgastinformation (d/m/w) Stadtwerke Verkehrsgesellschaft Frankfurt am Main mbH
Frankfurt am Main Zum Job 
Wirtgen GmbH-Firmenlogo
Software-Testingenieur (m/w/d) Testautomatisierung -Steuerungssoftware für mobile Arbeitsmaschinen Wirtgen GmbH
Windhagen Zum Job 
WIRTGEN GROUP Branch of John Deere GmbH & Co. KG-Firmenlogo
Project Manager Surveying and Designfor Machine Control (m/w/d) WIRTGEN GROUP Branch of John Deere GmbH & Co. KG
Ludwigshafen am Rhein Zum Job 
Bundespolizei-Firmenlogo
Ingenieur/in Elektro-/Nachrichtentechnik o. ä. für Satellitenkommunikation (w/m/d) Projektgruppe EU Bundespolizei
Neustadt in Holstein Zum Job 
Bundespolizei-Firmenlogo
Ingenieur/in Elektro-/Nachrichtentechnik o. ä. für Satellitenkommunikation (w/m/d) Projektgruppe EU Bundespolizei
Sankt Augustin Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Systemingenieur (m/w/i) für Oberflächeninspektion IMS Messsysteme GmbH
Heiligenhaus Zum Job 
Hochschule Hamm-Lippstadt-Firmenlogo
wissenschaftliche*r Mitarbeiter*in (m/w/d) für die Entwicklung einer Wissensdatenbank im Bereich der Sektorenkopplung Hochschule Hamm-Lippstadt
Hochschule Bielefeld-Firmenlogo
W2-Professur Software Engineering Hochschule Bielefeld
Gütersloh Zum Job 
Safran Data Systems GmbH-Firmenlogo
Embedded Software Engineer (m/w/d) Safran Data Systems GmbH
Bergisch Gladbach Zum Job 
Hochschule Bielefeld (HSBI)-Firmenlogo
W2-Professur Software Engineering Hochschule Bielefeld (HSBI)
Gütersloh Zum Job 
TU Bergakademie Freiberg-Firmenlogo
W2-Professur "Deep Learning" TU Bergakademie Freiberg
Freiberg Zum Job 
Fresenius Kabi Deutschland GmbH-Firmenlogo
Projekt IT-Ingenieur (m/w/d) Fresenius Kabi Deutschland GmbH
Friedberg Zum Job 
Regierungspräsidium Freiburg-Firmenlogo
BIM-Manager (w/m/d) Regierungspräsidium Freiburg
Freiburg im Breisgau Zum Job 

KI-Hardware-Not macht erfinderisch: Nvidias GPUs unterliegen Embargo

Statt auf westliche Hochleistungs-GPUs wie die Nvidia A100 oder H100 zurückzugreifen, setzt China auf neue, eigens entwickelte Asics (Application-specific integrated circuits) und Risc-V-basierte Prozessoren, die speziell für KI-Operationen optimiert sind. Zwar erreichen diese Chips nicht die Leistung westlicher High-End-Produkte. Da sie durch Softwareoptimierungen effizient genutzt werden, bleibt die Gesamtleistung dennoch konkurrenzfähig. Ein zentraler Punkt scheint die Eigenentwicklung von Hardware zu sein. Mit massiven Investitionen in die Halbleiterindustrie wurden Chips geschaffen, die speziell auf KI-Anwendungen zugeschnitten sind. Besonders die Prozessorarchitektur Risc-V ermöglicht es chinesischen Unternehmen, flexible und kostengünstige Chips zu entwickeln. Neben der Hardwareoptimierung setzt China auf Softwareoptimierungen. Es wurden Algorithmen geschaffen, die ressourceneffizienter arbeiten als westliche Pendants. Verfahren wie Sparse Training und fortschrittliche Komprimierungsmethoden reduzieren den Rechenaufwand und damit die Abhängigkeit von Hochleistungshardware.

Kontrollmechanismen wurden vermutlich ebenfalls umgangen

Ein weiterer Ansatz, um die Folgen des Embargos abzumildern, ist der Einsatz von Clustersystemen mit Chips in mittleren Leistungsklassen. Statt eine zentralisierte Infrastruktur mit High-End-GPUs zu betreiben, hat China Netzwerke aus weniger performanten Prozessoren geschaffen, die in verteilten Systemen parallel arbeiten. Diese Cluster-Computing-Strategie wird durch spezialisierte Frameworks wie Mindspore oder Paddlepaddle optimal genutzt. Vermutet wird auch, dass China auf internationale Kooperationen und Umgehungsstrategien der Embargos setzt. Trotz strenger Kontrollen gelingt es chinesischen Unternehmen, moderne Technologien indirekt zu beschaffen. Dies geschieht durch Partnerschaften mit Ländern, die nicht am Embargo beteiligt sind, oder durch das Reverse Engineering importierter Produkte. Die Entwicklung von Deepseek V3 innerhalb einer relativ kurzen Zeitspanne deutet darauf hin, dass die Grundlagen früherer KI-Plattform zügig weiterentwickelt wurden. China hat vermutlich frühzeitig mit der Forschung an alternativen Hardware- und Softwarestrategien begonnen, um sich von westlicher Technologie unabhängiger zu machen.

Chinas Fähigkeit, trotz erheblicher Handelsbeschränkungen eine konkurrenzfähige KI zu entwickeln, zeigt, dass Einschränkungen oft als Ansporn für Innovationen dienen können. Die globalen Auswirkungen dieser Entwicklung sind noch nicht vollständig absehbar, doch es ist offensichtlich, dass der internationale Wettbewerb im KI-Sektor durch Deepseek erheblich an Dynamik gewonnen hat. Szeneexperten wie Anjney Midha, Mitbegründer und CEO der Augmented-Reality-Plattform Ubiquity6, äußerte sich bei X sogar überschwänglich: „Praktisch über Nacht hat sich Deepseek R1 zum Modell der Wahl für Amerikas Top-Universitäten von Stanford bis hin zum MIT entwickelt.“

Bei aller aktuellen Euphorie darf aber nicht vergessen werden, dass bei der Nutzung des chinesischen Sprachmodells Daten unkontrolliert auf chinesische Server fließen. Gerade bei vertraulichen und personenbezogenen Informationen ist das ein nicht zu vernachlässigender Faktor, den vor allem Unternehmen bedenken sollten.

Ein Beitrag von:

  • Elke von Rekowski

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.