Warum Handshake mit Cleanlab zeigt, wo die wahre Macht in der KI liegt: bei den Daten, nicht den Modellen

28. Januar 2026
5 Min. Lesezeit
Grafik mit den Logos von Handshake und Cleanlab über Diagrammen zu KI‑Trainingsdaten

Warum Handshake mit Cleanlab zeigt, wo die wahre Macht in der KI liegt: bei den Daten, nicht den Modellen

Wer nur auf GPU‑Cluster und Modellparameter starrt, verpasst gerade den spannendsten Teil der KI‑Entwicklung. Die Übernahme von Cleanlab durch Handshake wirkt auf den ersten Blick wie ein kleiner Acqui‑Hire, ist aber ein deutlicher Fingerzeig: strategische Kontrolle verschiebt sich von Modellen hin zur Qualität der Trainingsdaten. In diesem Artikel ordne ich die Nachricht ein, zeige, warum sie für europäische – und insbesondere DACH‑Unternehmen – relevant ist, und welche Lücken sich jetzt im Markt für Datenqualität und Compliance auftun.


Die Nachricht in Kürze

Laut einem Bericht von TechCrunch hat das auf KI‑Datenlabeling spezialisierte Unternehmen Handshake den Data‑Auditing‑Anbieter Cleanlab übernommen. Handshake wurde 2013 ursprünglich als Karriereplattform für Studierende und Absolvent:innen gegründet und ist vor rund einem Jahr in das Geschäft mit menschlichem Datenlabeling eingestiegen, um große KI‑Labore mit Trainingsdaten zu versorgen. Zu den Kunden gehört unter anderem auch OpenAI.

Cleanlab wurde 2021 von drei Informatik‑Promovierten des MIT gegründet. Das Startup entwickelt Software, die automatisch fehlerhafte oder inkonsistente Labels in Datensätzen erkennt – ohne dass eine zweite menschliche Annotator:in notwendig ist. Ziel der Transaktion ist laut TechCrunch vor allem ein Acqui‑Hire: Neun zentrale Mitarbeitende, darunter die drei Gründer, wechseln in die Forschungsorganisation von Handshake. Finanzielle Details wurden nicht veröffentlicht; Cleanlab hatte zuvor rund 30 Millionen US‑Dollar Wagniskapital eingesammelt.

TechCrunch berichtet außerdem, dass mehrere andere Datenlabeling‑Firmen Übernahmeinteresse bekundet hatten. Cleanlab entschied sich jedoch für Handshake, das heute bereits als Quelle für hochqualifizierte Expert:innen – etwa Ärzt:innen, Jurist:innen und Wissenschaftler:innen – für viele dieser Wettbewerber dient.


Warum das wichtig ist

Strategisch betrachtet verschiebt diese Übernahme die Machtbalance in einem bislang unterschätzten Bereich der KI‑Wertschöpfungskette. Handshake war bisher vor allem ein effizient organisierter Marktplatz für hochqualifizierte menschliche Arbeit. Mit Cleanlab holt sich das Unternehmen nun den „Qualitätsmotor“ ins Haus, der entscheidet, wie vertrauenswürdig diese Arbeit am Ende ist.

Kurzfristig profitieren mehrere Gruppen:

  • Handshake stärkt seine Forschungs‑DNA. Cleanlab bringt erprobte Algorithmen zur Erkennung von Fehlannotationen mit, die sich direkt in bessere Datenqualität und geringere Kosten für manuelle Qualitätskontrolle übersetzen können.
  • Die großen KI‑Labore erhalten potenziell sauberere, besser dokumentierte Datensätze – ein direkter Performance‑Hebel, ohne an Modellen oder Infrastruktur zu drehen.
  • Die Cleanlab‑Gründer und ‑Investoren bekommen einen Exit in einem Segment, in dem reine Tool‑Anbieter es schwer haben, neben großen Plattformen eigenständig zu bestehen.

Verlierer sind nicht sofort sichtbar, aber durchaus vorhanden. Datenlabeler, die Cleanlab ebenfalls übernehmen wollten, sehen sich nun einem Handshake gegenüber, das gleichzeitig Lieferant von Expert:innen und zunehmend technologischer Taktgeber bei der Qualitätskontrolle ist. Kleine Anbieter, die primär über niedrige Stundenlöhne konkurrieren, geraten unter Druck: Wenn Spitzenkunden „Labeling plus automatisches Auditing plus Reporting“ aus einer Hand bekommen, bleibt wenig Raum für Low‑Cost‑Angebote ohne eigene F&E.

Das eigentliche Problem, das hier adressiert wird, ist jedoch grundsätzlicher: Menschliche Labels sind fehlerhaft, subjektiv und teuer zu verifizieren. Doppelannotationen und große QA‑Teams skalieren schlecht. Cleanlabs Ansatz – statistische Verfahren und Modelle, die verdächtige Labels markieren – macht einen Teil dieses Prozesses algorithmisch. Genau hier entsteht eine neue Form von „Moat“: Wer die Kombination aus menschlichem Fachwissen und automatisierter Qualitätsmessung beherrscht, kann sich als unverzichtbare Infrastruktur im KI‑Stack etablieren.


Der größere Kontext

Im größeren Bild fügt sich die Transaktion in mehrere Entwicklungen der letzten Jahre ein.

Erstens: Die Branche bewegt sich klar in Richtung data‑centric AI. Statt sich ausschließlich auf Modellarchitektur und Parameteroptimierung zu fokussieren, rückt die systematische Arbeit an Datensätzen in den Vordergrund – von Kuratierung über Balancing bis hin zu ausführlicher Dokumentation. Cleanlab steht mit seinem Fokus auf Labelqualität exemplarisch für diesen Paradigmenwechsel.

Zweitens: Große Infrastruktur‑Player sichern sich gezielt Spezial‑Know‑how. Databricks’ Übernahme von MosaicML, Snowflakes Acqui‑Hire des Neeva‑Teams oder Googles und Microsofts Zukäufe im Bereich RLHF und Model‑Evaluation folgen alle derselben Logik: kritische, schwer kopierbare Kompetenzen werden vertikal integriert.

Drittens: Das Bild vom „billigen Outsourcing“ im Datenlabeling zerbröselt. Spätestens seit Foundation‑Models im Einsatz sind, ist klar: Ein vermeintlich kleiner Qualitätsgewinn – etwa bei medizinischen Bilddaten oder juristischen Texten – kann enorme Downstream‑Effekte haben. Anbieter wie Scale AI, Surge oder Mercor investieren deshalb massiv in Tools, Plattformen und eigene Forschung. Handshake reiht sich nun mit einem eigenen, klar forschungsgetriebenen Baustein in diese Liga ein.

Handshake unterscheidet sich allerdings in zwei Punkten von einigen Wettbewerbern: Die Firma fokussiert stark auf hochqualifizierte Fachkräfte statt auf breite Crowd‑Workforces. Und mit Cleanlab integriert sie nicht nur Tools für Labeling‑Workflows, sondern explizit Forschung zur Fehlererkennung. Das erlaubt mittelfristig einen Übergang von „wir organisieren Menschen, die Daten markieren“ zu „wir betreiben ein System, das kontinuierlich misst, verbessert und dokumentiert, wie gut diese Daten sind“.

Die Botschaft an den Markt – auch an Startups in Berlin, München, Zürich oder Wien – ist deutlich: Wer Daten nur als Rohstoff betrachtet und nicht als Produkt mit eigener Roadmap, verliert.


Die europäische / DACH‑Perspektive

Für europäische Unternehmen – insbesondere im regulierten Umfeld – berührt diese Entwicklung einen wunden Punkt: Datenhoheit und Compliance.

Die Kombination aus EU‑KI‑Verordnung (AI Act), DSGVO und branchenspezifischen Regeln (etwa in Finanz‑ und Gesundheitssektor) macht Daten‑Governance zum Kernproblem jeder ernstzunehmenden KI‑Einführung. Hochrisiko‑Systeme müssen künftig detailliert nachweisen können, woher Trainingsdaten stammen, wie sie annotiert wurden, wie Bias adressiert wurde und welche menschlichen Kontrollmechanismen bestehen.

Cleanlab‑artige Auditing‑Verfahren können genau solche Nachweise untermauern – etwa über Reports zu Label‑Fehlerquoten, systematischen Verzerrungen oder verdächtigen Teilmengen im Datensatz. Aus europäischer Sicht stellen sich jedoch zwei Fragen:

  1. Jurisdiktion: Handshake ist ein US‑Unternehmen. Auch wenn Daten theoretisch in europäischen Rechenzentren verarbeitet werden, bleiben Themen wie Cloud‑Act, internationale Datentransfers und Auftragsverarbeitung hochsensibel – insbesondere in Deutschland, wo Betriebsräte und Datenschutzbeauftragte traditionell sehr kritisch sind.
  2. Souveränität: Wollen wir zentrale Teile der Datenqualitäts‑Infrastruktur dauerhaft an außereuropäische Anbieter auslagern, oder entsteht hier ein Feld, in dem europäische Player eigene Standards setzen können?

Bislang gibt es im DACH‑Raum zwar eine lebendige Szene im Bereich MLOps, Data Platforms und Consulting, aber nur wenige Spezialisten für Label‑Auditing und AI‑Compliance‑taugliche Datenpipelines. Für deutsche, österreichische und Schweizer Unternehmen, die heute schon Annotation‑Services anbieten – oft mit Near‑shoring innerhalb der EU – ist Handshakes Schritt deshalb Warnsignal und Chance zugleich. Wer früh in eigene Prüfalogrithmen, Dokumentations‑Pipelines und AI‑Act‑konforme Reporting‑Layer investiert, kann sich als „europäische Antwort“ auf diesen Trend positionieren.


Blick nach vorn

In den kommenden 12–24 Monaten ist mit weiterem Aufkauf von Spezial‑Know‑how im Bereich Datenqualität zu rechnen. Die Funktion „Label‑Auditing“ wird sich von einem Nischen‑Tool zu einer Standardkomponente in großen Plattformen entwickeln – sei es bei Cloud‑Providern, bei MLOps‑Anbietern oder bei etablierten Labeling‑Firmen.

Für Handshake werden mehrere Punkte entscheidend sein:

  • Rollenklärung im Ökosystem: Bleibt das Unternehmen ein „Arms Dealer“, der auch Konkurrenten beliefert, oder entwickelt es sich zu einem vertikal integrierten Komplettanbieter, der mit diesen Konkurrenten frontal in Wettbewerb tritt?
  • Tiefe der Integration: Ein Acqui‑Hire bringt kurzfristig Schlagzeilen, aber Mehrwert entsteht erst, wenn Cleanlabs Forschung tief in Workflows, Plattform und Kundenprodukte einfließt – inklusive Schnittstellen zu Governance‑Systemen bei Großkunden.
  • Anpassung an europäische Regulierung: Spätestens wenn der AI Act in Kraft tritt, werden Banken, Versicherer und Industriekonzerne im DACH‑Raum Lösungen bevorzugen, die AI‑Act‑kompatible Dokumentation weitgehend automatisiert bereitstellen. Wer das am besten kann, wird de‑facto‑Standard.

Parallel dazu öffnet sich Raum für spezialisierte Anbieter – auch aus Europa: etwa für synthetische Datengenerierung mit integrierter Bias‑Kontrolle, Branchensuites zur Modell‑Evalvierung (z. B. für Automotive, Industrie 4.0 oder MedTech) oder On‑Prem‑Auditing‑Lösungen für besonders sensible Datenbestände.

Kulturell dürfte sich der Umgang mit Datenqualität in den nächsten Jahren ähnlicher zu DevOps entwickeln: weg von einmaligen „Data Cleaning‑Projekten“, hin zu kontinuierlicher Überwachung und Verbesserung als integraler Bestandteil von KI‑Produktentwicklung.


Fazit

Die Übernahme von Cleanlab durch Handshake ist weniger wegen des Deal‑Volumens spannend als wegen des Signals: Die nächste Verteidigungslinie im KI‑Wettbewerb verläuft nicht entlang von Modellarchitekturen, sondern entlang der Qualität und Dokumentation der Trainingsdaten. Wer die Mechanik der Label‑Qualität kontrolliert, kontrolliert einen zentralen Hebel für Model Performance – und damit Wertschöpfung. Für Unternehmen im DACH‑Raum stellt sich jetzt die Frage, ob sie diese Schicht dauerhaft US‑Anbietern überlassen oder selbst in eine souveräne, regulierungskompatible Datenqualitäts‑Infrastruktur investieren wollen.

Kommentare

Hinterlasse einen Kommentar

Noch keine Kommentare. Sei der Erste!

Ähnliche Beiträge

Bleib informiert

Erhalte die neuesten KI- und Tech-Nachrichten direkt in dein Postfach.