Ein neues Multi-Universitäts-Benchmark wurde am Dienstag veröffentlicht und fand, dass führende KI-Modelle in Fragen, die mit Konversion zusammenhängen, durchgehend eine positive Verzerrung zugunsten des Katholizismus zeigten, während sie Nutzer von anderen Glaubensrichtungen weglenkten. Die Studie stammt vom Consortium for Evaluating Faith and Ethics in AI (CEFE-AI), einer Zusammenarbeit zwischen der Baylor University, der Brigham Young University, der University of Notre Dame und der Yeshiva University. Das Konsortium veröffentlichte die ersten Ergebnisse seines AllFaith Benchmark auf Github und beim Athens Summit on AI Ethics und argumentierte, dass religiöse Verzerrungen in der KI-Sicherheitsforschung weitgehend übersehen werden. Die Ergebnisse kamen einen Tag, nachdem Papst Leo XIV Magnifica Humanitas veröffentlicht hatte, die erste päpstliche Enzyklika, die vollständig der künstlichen Intelligenz gewidmet ist. Darin argumentierte der Papst, dass Technologie die Werte, blinden Flecken und wirtschaftlichen Anreize ihrer Erschaffer aufnimmt.
Research Methodology and Key Findings
Researchers analyzed 3,640 responses across 20 AI models, including ChatGPT, DeepSeek, Claude, Gemini, Grok, and Llama. The study identified clear patterns in how these systems handled religion-related questions.
According to the benchmark, nearly every model responded more positively toward Catholicism, with a 61% "encouraged" rating. Jehovah's Witnesses received significantly lower ratings at 3%. Mainline Protestant received a 49.2% rating, while Evangelical Protestant received 34%. Notably, agnostic—the belief that it is impossible to know whether God exists—scored higher than every religion tested with a 71% encouraged rating. Many models also responded negatively toward atheism and agnosticism, while giving more favorable responses to Baha'i and Sikh beliefs.
Model-Specific Results
Grok 4.20 showed the strongest religious bias in the study, with a 69% positive rating toward Catholicism and 51% toward Evangelical Protestant. While Grok 4.20 skewed toward Christianity, it and DeepSeek Chat v3.1 were the only AI models that gave Jehovah's Witnesses more than a 5% positive rating. Anthropic and Meta models showed the least religious bias among those tested.
Religious Bias in AI Research
Despite growing focus on AI by religious leaders, the consortium noted that religious bias remains largely overlooked in AI research. Only 0.2% of more than 12,000 AI bias papers examined religion-related bias.
BYU professor David Wingate stated: "We are seeing a systematic pattern of religious omissions. AI systems encourage users to discuss life's challenges with their parents, teachers, friends, and therapists… but not with a pastor, a rabbi, an imam, or a spiritual leader."
Nancy Fulda, also a professor at Brigham Young University, added: "Our expectation was that the conversion benchmark would show models to be neutral and symmetrical in their guidance. The results show significant and repeatable positive and negative biases toward certain belief systems."
Päpstliche Perspektive auf KI-Werte
In Magnifica Humanitas schrieb Papst Leo XIV: „Daten sind das Produkt vieler Mitwirkender und sollten nicht so behandelt werden, als sei es etwas, das man abverkauft oder einer ausgewählten Minderheit anvertraut.“ Die Enzyklika betonte, dass Technologie nie neutral ist, weil sie die Werte ihrer Erschaffer aufnimmt.