Faktenprüfungs-Richtlinie
Wir sichern Genauigkeit durch Quellenprüfung, Replikation, Expert:innen-Review und klare Kennzeichnung.
Verifizierung zuerst
Wesentliche Aussagen werden geprüft: Quelle, Kontext, Reproduzierbarkeit, Limitationen.
Unser Prozess
Quellenprüfung
Primärquellen identifizieren (Paper, Repos, Modellkarten, Regulierungstexte) und Glaubwürdigkeit bewerten.
Mehrquellen-Abgleich
Übereinstimmung der Angaben in mehreren zuverlässigen Publikationen und Community-Threads.
Benchmark-Validierung
Ergebnisse gegen etablierte Benchmarks prüfen (z. B. MMLU, MT-Bench, Safety-Eval); Replikationen priorisieren.
Expert:innen-Review
Technische Aussagen (Training, Evaluation, Safety, Datenschutz) extern intern plausibilisieren lassen.
Finale Redaktion
Formale Prüfung: Genauigkeit, Kontext, klare Kennzeichnung von Annahmen und Meinungen.
Was wir verifizieren
Metriken & Leistungsdaten
- Benchmark-Scores (z. B. MMLU, HellaSwag, GSM8K, MT-Bench)
- Evaluations-Setups (Prompting, Temperature, Kontextlänge)
- Vergleichbarkeit (Versionen, Daten, Hardware/Compute)
- Produkt-/API-Änderungen und Release-Notes
Technische Informationen
- Modellkarten, Lizenzbedingungen, Trainingsdaten-Hinweise
- Architektur/Parameter, Kontextfenster, Modalitäten
- Sicherheits-/Guardrail-Mechanismen, Red-Teaming-Resultate
- Inference-Pfad, Caching, Tool-/Agenten-Fähigkeiten
Regulatorik & Governance
- EU AI Act, NIST-Frameworks, nationale Leitlinien
- Aufsichts-/Behördenmitteilungen
- Gerichtsentscheidungen und Rechtsauslegungen
- Compliance-Anforderungen, Risiko-Klassifizierung
Unternehmensangaben
- Partnerschaften, Investitionen, Akquisitionen
- Produktstarts, Feature-Rollouts
- Team- und Beraterangaben
- Open-Source-Releases und Roadmaps
Community-Quellen
Reddit & Soziale Medien
Community-Posts inspirieren Story-Auswahl und Stimmungsbilder, gelten aber nicht als Primärquelle.
Unser Umgang:
- Community-Insights werden klar gekennzeichnet
- Behauptungen aus Social-Posts benötigen unabhängige Verifikation
- Sentiment ≠ Fakt: wir trennen Meinung und Messwert
- User-Generated Content wird korrekt zitiert und eingeordnet
Qualitätsstandards
Wir prüfen
- Numerische Aussagen und Statistiken
- Direktzitate und Zuordnung
- Technische Spezifikationen und Features
- Zeitliche Korrektheit und Versionsstände
- Rechtliche/regulatorische Informationen
Wir kennzeichnen
- Prognosen und Meinungen
- Unverifizierte Behauptungen mit Haftungs-Disclaimer
- „Breaking“-Stories mit dem Hinweis auf Entwicklung
- Community-Sentiment als nicht-faktisch
- Potenzielle Interessenkonflikte
Leserfeedback zur Genauigkeit
Sie haben eine Korrektur oder Zusatzquelle? Schreiben Sie uns:
E-Mail: editorial
Alle Hinweise werden innerhalb von 24 Stunden geprüft.