ChatGPT und Depression: Plausibel – aber medizinisch falsch
Neue Studie der Uni Salzburg: ChatGPT klingt beim Depressionsscreening überzeugend, liefert aber medizinisch ungenaue Antworten.
Wer nachts nicht schlafen kann, wer sich seit Wochen leer fühlt oder kaum noch Freude empfindet, greift immer öfter zum Smartphone – nicht um jemanden anzurufen, sondern um ChatGPT zu fragen: „Habe ich eine Depression?" Die Antwort kommt prompt, klingt einfühlsam, und wirkt medizinisch fundiert. Doch eine neue Studie der Paris-Lodron-Universität Salzburg vom Juni 2026 zeigt: Plausibel klingt ist nicht dasselbe wie klinisch korrekt.
Was die Salzburger Studie herausgefunden hat
Forscherinnen und Forscher der Universität Salzburg untersuchten, wie präzise Sprachmodelle wie ChatGPT beim Depressionsscreening abschneiden. Das Ergebnis ist eindeutig: Die KI liefert sprachlich überzeugende, medizinisch aber ungenaue Antworten. Das Modell erkennt Formulierungen wie „Ich fühle mich seit Wochen antriebslos" korrekt als potenzielle Warnsignale – aber es ordnet diese Signale nicht mit der diagnostischen Genauigkeit ein, die für eine zuverlässige Einschätzung notwendig wäre. Die Forschenden fordern deshalb klare und transparente Regeln für den KI-Einsatz in der psychischen Gesundheitsversorgung. KI könne assistieren – Fachärztinnen und Fachärzte ersetzen könne sie nicht, so das Fazit der Salzburger Studie.
Das zentrale Problem: Sprachmodelle sind darauf trainiert, kohärente und sprachlich plausible Texte zu erzeugen. Das macht ihre Antworten überzeugend. Es bedeutet aber nicht, dass die Einschätzung medizinisch korrekt ist. Gerade bei komplexen Erkrankungen wie Depressionen, die sich in Symptommustern ausdrücken und sorgfältige Differenzialdiagnostik erfordern, ist dieser Unterschied entscheidend.
Warum das Problem größer wird
Gleichzeitig wächst der Druck auf das Gesundheitssystem rapide. Laut dem DAK-Psychreport 2025 stiegen die Fehltage wegen Depressionen in Deutschland um 50 Prozent, Klinikaufenthalte wegen depressiver Erkrankungen legten im Vergleich zu vor 20 Jahren um 77 Prozent zu. Die Wartelisten für Psychotherapieplätze sind lang – manchmal Monate. In dieser Lücke erscheinen KI-Chatbots als niedrigschwellige Alternative.
Der Markt wächst entsprechend rasant. Branchenanalysen zufolge lag das weltweite Marktvolumen für KI-gestützte Mental-Health-Apps 2025 bei rund 574 Millionen US-Dollar, für 2026 werden bereits 767 Millionen Dollar prognostiziert. Bis 2034 soll der Markt auf rund 7,8 Milliarden Dollar wachsen – mit einer jährlichen Wachstumsrate von über 33 Prozent. Anbieter wie Wysa, Limbic und Headspace konkurrieren um dieses Wachstum.
Dass der Bedarf real ist, zeigt auch das Deutschland-Barometer Depression 2025 der Stiftung Deutsche Depressionshilfe: Besonders junge Menschen greifen zunehmend auf Chatbots zurück, wenn sie psychische Beschwerden haben – häufig bevor sie professionelle Hilfe suchen. Für viele ist der Chatbot der erste Ansprechpartner.
Warum das riskant ist
Das klingt zunächst nach einem positiven Trend. Aber der Befund aus Salzburg macht deutlich, warum Vorsicht geboten ist. Depression ist keine einfache Diagnose. Sie wird nach klinischen Kriterien gestellt – etwa dem Patientengesundheitsfragebogen PHQ-9, einem validierten Screening-Instrument –, erfordert eine strukturierte Anamnese und schließt andere körperliche Ursachen aus. Schilddrüsenerkrankungen, Vitamin-D-Mangel oder schlafbezogene Atemstörungen können depressionsähnliche Symptome erzeugen, haben aber andere Behandlungen.
Wenn eine KI eine falsch-negative Einschätzung liefert – also jemanden beruhigt, der eigentlich dringend professionelle Hilfe bräuchte – kann das schwerwiegende Folgen haben. Depressionen bleiben in Deutschland häufig zu lange unbehandelt; im Schnitt vergehen mehrere Jahre zwischen ersten Symptomen und dem Beginn einer Behandlung. Eine falsch beruhigende KI-Antwort verlängert diese Lücke noch weiter.
Was die Forscher fordern – und was das für Nutzer bedeutet
Die Wissenschaftlerinnen und Wissenschaftler aus Salzburg plädieren nicht für ein Verbot von KI im psychischen Gesundheitsbereich. Ihr Credo lautet Transparenz und klare Grenzen: KI-gestützte Anwendungen sollen offen kommunizieren, was sie können und was nicht. Screening-Hinweise ja – Diagnosen nein. Orientierung bieten ja – ärztliche Einschätzung ersetzen nein.
In der EU greift dafür der AI Act, der KI-Systeme im Gesundheitsbereich als Hochrisikoanwendungen einstuft und entsprechende Transparenzpflichten vorsieht. Für Nutzerinnen und Nutzer bedeutet das aber wenig, wenn sie nicht wissen, welche Apps reguliert sind und welche nicht. Digitale Gesundheitsanwendungen (DiGAs), die als Medizinprodukt zugelassen und im BfArM-Verzeichnis gelistet sind, unterliegen strengen Qualitätsanforderungen – allgemeine ChatGPT-Gespräche dagegen nicht.
Häufige Fragen
Kann ChatGPT eine Depressionsdiagnose stellen?
Nein. ChatGPT kann Informationen zu Depressionssymptomen geben und als Gesprächspartner dienen. Eine Diagnose – das heißt eine klinisch abgesicherte Einschätzung, ob jemand eine depressive Episode hat – kann nur eine Ärztin, ein Arzt oder eine Psychotherapeutin stellen. Das bestätigt die Salzburger Studie ausdrücklich.
Welche Depressionsapps sind seriös?
Digitale Gesundheitsanwendungen (DiGAs), die als Medizinprodukt zugelassen und in das BfArM-DiGA-Verzeichnis aufgenommen sind, haben klinische Evidenznachweise erbracht. Sie sind kein Ersatz für Diagnose und Therapie, aber können als ergänzendes Angebot sinnvoll sein. Allgemeine Chatbots ohne Zulassung als Medizinprodukt sind dagegen unreguliert.
Was soll ich tun, wenn ich glaube, eine Depression zu haben?
Erster Anlaufpunkt ist die Hausarztpraxis. Dort kann eine erste Einschätzung erfolgen und eine Überweisung zu Psychiaterinnen oder Psychotherapeutinnen veranlasst werden. Die Telefonseelsorge (0800 111 0 111, kostenlos, rund um die Uhr) ist für akute Belastungssituationen erreichbar. Online-Verzeichnisse der Kassenärztlichen Vereinigung helfen bei der Suche nach Therapieplätzen.