Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

Entwicklungssystem Devin im Test

Blogpost über einen Monat intensive Tests mit der KI-Software Devin: Trotz anfänglicher Erfolge gibt es erhebliche Schwächen in der praktischen Anwendung.
Im März 2024 kam Devin auf den Markt, ein als vollautonomer Softwareentwickler angepriesenes Tool. Geplant war, dass Devin durch Interaktion über Slack und das Einrichten einer eigenen Rechenumgebung operiert. Anfangs waren die Demonstrationen vielversprechend; Devin bewältigte Aufgaben, die sonst Programmierern vorbehalten waren, und löste unter anderem mehr als 13 Prozent realer GitHub-Probleme.Trotz dieser vielversprechenden Anfänge war das Team von Answer.AI, das Devin erprobte, nicht ganz überzeugt. Eingängig und beeindruckend in der Theorie offenbarte Devin in der Praxis große Schwierigkeiten. Bei der Durchführung von über 20 Aufgaben erzielte Devin lediglich drei Erfolge, während die Mehrheit der Tests in Misserfolgen endete. Die anfänglichen Triumphe wie das Übertragen von Daten aus einer Notion-Datenbank in Google Sheets schienen vielversprechend, wurden jedoch schnell von ernüchternden Erfahrungen überschattet.Das Team musste feststellen, dass Devin bei komplexeren Aufgaben oft in technische Sackgassen geriet und eher dazu neigte, übermäßig komplizierte Lösungen zu entwickeln. So scheiterte die KI unter anderem daran, mehrere Anwendungen gleichzeitig zu deployen, was von ihr nicht richtig erkannt wurde, und dazu führte, dass viel Zeit für die Fehlersuche verloren ging.Die Analyse der Ergebnisse ergab, dass Devin insbesondere bei Aufgaben, die ein tiefes Verständnis bestehender Codemuster erforderten, versagte. Bei der Migration eines Python-Projekts in die nbdev-Umgebung war Devin nicht in der Lage, die grundlegenden Anforderungen zu erfüllen, trotz Zugang zu umfassender Dokumentation. Ein weiteres Beispiel war die Verwendung von Devin für eine Sicherheitsüberprüfung, bei der sie zahlreiche Fehlalarme ausgab und echte Probleme ignorierte.Die überwiegende Zahl der eingesetzten Funktionen war zum Teil so einfach definiert, dass menschliche Entwickler diese schneller und effizienter bearbeiten konnten. Das Team kam zu dem Schluss, dass, obwohl Devin in bestimmten Bereichen potenziell von Nutzen sein könnte, die Auseinandersetzung mit den echten Herausforderungen der Softwareentwicklung bei weitem nicht ausreichend war.Im Ganzen zeigen die Erfahrungen mit Devin, dass der Hype um KI-Entwicklungstools oft von der tatsächlichen Nützlichkeit abweicht. Statt auf Devins autonomes Arbeiten zu setzen, plant das Team von Answer.AI, in Zukunft Tools zu verwenden, die eine menschliche Steuerung bei der Softwareentwicklung ermöglichen und gleichzeitig auf AI-Assistenz zurückgreifen.Blogpost über die Erfahrungen mit Devin

Neueste Beiträge

Managed DevOps Pools - Azure DevOps Pipelines Security
Agent Pools als Managed Service mit einfacher Integration in private Netzwerke und Authentisierung mittels Managed Identity tragen deutlich zur Sicherheit der Agent-Infrastruktur bei.
7 Minuten
7. Aug 2025
Keine Zeit für das UX? Was für ein Fehler: Interview mit Vicky Pirker - Interview
Wer Software baut, die mehr können soll als nur zu funktionieren, muss das Thema User Experience zur Teamsache machen. UX-Expertin Vicky Pirker erklärt im DWX-Interview, warum UX und Development untrennbar zusammengehören.
3 Minuten
30. Jul 2025
Arbeiten mit Tabellen und KI in Dataverse
Microsoft unterstützt die zentrale Datenmanagement-Lösung Dataverse in Power Apps mit KI-Features.
7 Minuten
6. Aug 2025
Miscellaneous

Das könnte Dich auch interessieren

Sicher ist sicher - Azure DevOps Pipelines Security
Als integraler Bestandteil der Entwicklungsumgebung ist Azure DevOps Pipelines oft Ziel von Angriffen. Da ist es gut zu wissen, wo die Schwachstellen des Systems liegen.
14 Minuten
16. Jun 2025
MuMu Player 11 (Beta): Emulator für Android 11 - NetEase
MuMu Player ist eine kostenlose Software, die Android-Geräte emuliert, so dass Spieler verschiedene mobile Spiele und Apps auf einem PC ausführen können. Der Player bietet Vulkan-Unterstützung für die Ausführung weiterer Spiele und bietet Bildraten von bis zu 120 FPS.
3 Minuten
26. Apr 2022
CodeProject.AI Server in neuer Version - Lokaler AI-Server
CodeProject.AI Server (jetzt in Version 2.1.10) ist ein lokal installierter, selbstgehosteter, schneller, kostenloser und Open Source Artificial Intelligence Server für jede Plattform und jede Sprache.
2 Minuten
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige