ELO-Matchmaking: Warum 45-55% Siegquoten [2026]
ELO-Matchmaking landet LearnClash-Duelle in einer 45-55%-Siegquoten-Bandbreite, der Zone wünschenswerter Schwierigkeit.
Kompetenz-gematchte ELO-Duelle in LearnClash landen 82 Prozent der Zeit in einem 45-bis-55-Prozent-Siegquoten-Band. Zufallspaarung tut das nicht. Nicht annähernd. Genau das ist der Punkt.
Eine ELO-gematchte Siegquote ist die Gewinnwahrscheinlichkeit, wenn beide Spieler einen engen Bewertungsabstand teilen. In LearnClash bewertet der Composite-Matchmaker offene Duelle mit 50 Prozent ELO-Nähe plus 50 Prozent Kategorien-Cosinus-Ähnlichkeit, gleichgewichtet, ohne harten Bewertungsbereich-Filter, und das entstehende Band ist die Zone wünschenswerter Schwierigkeit, die Lernforschung seit über 30 Jahren beschreibt.
Unten: die Mathematik hinter dem Band, warum „erzwungene 50“ der falsche Rahmen ist, drei April-2026-Datenpunkte zu Kalibrierung und Themenüberschneidung, und wie ein enges Band die 3-stufige Mems-Retention verstärkt. Probiere ein 3-minütiges LearnClash-Duell und sieh das Band selbst.
Was ist eine ELO-gematchte Siegquote?
Eine ELO-gematchte Siegquote ist der Prozentsatz an Duellen, die du gegen einen kompetenzgleichen Gegner gewinnen kannst. In LearnClash clustert dieser Wert um 50 Prozent. Die April-2026-Daten landen Ranglisten-Duelle in einem engen 45-bis-55-Prozent-Band.
Abbildung 1: Ein ELO-gematchtes Duell sitzt per Definition bei 50 % Gewinnwahrscheinlichkeit. Füge eine 400-Punkte-Lücke hinzu und die Mathematik kollabiert auf 9 % für den niedriger bewerteten Spieler.
Aber hier wird’s interessant.
Die Erwartungswert-Formel, die Arpad Elo 1960 veröffentlichte, ist denkbar einfach. Die Gewinnwahrscheinlichkeit jedes Spielers ergibt sich aus dem Bewertungsabstand, nicht aus einem externen Regler. Keine Quoten. Keine versteckte Hand. Keine unsichtbare Steuer auf eine Siegesserie.
Wichtigste Erkenntnis: Das 50-Prozent-Band, das du siehst, ist die Mathematik, nicht die Anweisung. Zwei gleiche Bewertungen geben 0,5 für beide. Eine 400-Punkte-Lücke schiebt den stärkeren Spieler auf 0,91 und den schwächeren auf 0,09.
| Szenario | Spieler A ELO | Spieler B ELO | A’s Erwartungswert |
|---|---|---|---|
| Gleichstand | 1.300 | 1.300 | 50 % |
| Leichter Favorit | 1.400 | 1.300 | 64 % |
| Schwerer Favorit | 1.700 | 1.300 | 91 % |
| Außenseiter | 1.300 | 1.700 | 9 % |
„Eine Spielerbewertung ist eine Zahl, die als Index der Leistungsfähigkeit verwendet werden kann. Ihr Zweck ist, eine faire Methode der Handicap-Vergabe bereitzustellen.“ Arpad Elo, The Rating of Chessplayers, Past and Present (1978)
LearnClash erbt die Mathematik hinter ELO und legt einen Composite-Matchmaker darüber. Der Composite bewertet offene Duelle auf zwei Achsen gleichzeitig. Kompetenz-Nähe. Themenrelevanz. Die Paarung minimiert sowohl Bewertungsabstand als auch Kategoriendrift, sodass das Siegquoten-Band eng bleibt, selbst wenn das Thema zwischen Runden wechselt.
Wusstest du? Pelanek (2016) validierte ELO-Stil-Matchmaker für adaptive Bildung. Duolingo übernahm intern ein Pelanek-Stil-System und meldete einen 12-prozentigen Anstieg der täglichen Aktivität.
Ein Duell, das im 45-55-Band landet, ist der Motor. Ein Duell, das bei 30 oder 70 landet, ist ein Bug oder eine Kalibrierungsphase. Genau diese beiden Zustände unterscheiden ein Spiel, das in der Lernforschung als wirksam gilt, von einem, das nur unterhält. Der Rest dieses Artikels packt aus, warum sich das eine großartig anfühlt und das andere kaputt, und warum das Band, über das MOBA-Spieler klagen, dasselbe Band ist, das jedes gut entworfene Lernspiel absichtlich will.
Warum 45-55 % das Feature ist, kein Bug
Das 45-55-Prozent-Siegquoten-Band ist das natürliche Ergebnis kompetenz-gematchten Wettbewerbs. In LearnClash ist dieses Band die Zone wünschenswerter Schwierigkeit, in der Abruf zu dauerhaftem Gedächtnis wird. Leichte Siege lehren fast nichts. Klare Niederlagen lehren weniger. Die Mitte ist, wo das Gehirn arbeitet.
Abbildung 2: Die Yerkes-Dodson-Kurve mappt Erregung auf Lernleistung. ELO-gematchte Duelle im 45-55-Band sitzen am Scheitelpunkt; klare Niederlagen in beide Richtungen kollabieren den Encoding-Lift.
Durchsuche jedes deutschsprachige MOBA-Forum. Du findest dieselbe Verschwörungstheorie überall:
- Riot erzwingt 50 Prozent
- Dota 2 deckelt dich
- Apex Legends drosselt deine Siege
Die Klage ist älter als kompetenzbasiertes Matchmaking. Sie taucht in jedem Riot-Dev-Blog seit einem Jahrzehnt auf.
Aber an der Klage stimmt was nicht.
Wichtigste Erkenntnis: Eine faire Paarung produziert ein faires Ergebnis. Zwei gleichstarke Spieler können nicht anders, als über hunderte Spiele auf 50 Prozent zu tendieren. Das System hat die Siegquote nicht gewählt. Die Kompetenzen haben es.
Im Lernkontext kippt das von verdächtig zu optimal. Drei Stränge der Kognitionswissenschaft konvergieren auf das 45-55-Band als Optimum:
- Yerkes-Dodson-Gesetz (1908): moderate Erregung erzeugt Spitzen-Gedächtnis-Encoding
- Csikszentmihalyi Flow (1990): Herausforderung-Kompetenz-Balance triggert vertiefte Aufmerksamkeit
- Bjork wünschenswerte Schwierigkeit (1994): Abruf, der knapp gelingt, festigt Gedächtnisspuren
„Bedingungen, die während des Lernens langsamere oder fehlerhaftere Leistung erzeugen, führen oft zu besserer Langzeitretention.“ Elizabeth und Robert Bjork, Making Things Hard on Yourself (2011)
Das Yerkes-Dodson umgekehrte U ist das älteste der drei. Zu wenig Erregung, du schaltest ab. Zu viel, du verkrampfst. In einem Duell kommt diese Erregung aus Wettkampfunsicherheit. Eine klare Niederlage in eine Richtung kollabiert auf eine flache Linie. Ein 50-50-Kampf bleibt bis zur letzten Frage spannend.
Abbildung 2b: Die Flüssigkeitsillusion. Leichte Siege fühlen sich nach Beherrschung an, aber das Gehirn encodiert die Antwort kaum. Die Abruf-Grenze bei 45-55 ist, wo Gedächtnisspuren tatsächlich entstehen.
Csikszentmihalyis Flow-Kanal mappt dieselbe Form auf Aufmerksamkeit. Flow entsteht nur, wenn die wahrgenommene Herausforderung am Rand der wahrgenommenen Kompetenz sitzt. Unter dem Rand: Langeweile. Über dem Rand: Angst. Der Sweetspot ist schmal, und ELO-Matchmaking ist der Algorithmus, der ihn findet.
Wichtigste Erkenntnis: MOBA-Spieler haben recht, dass das System Siegquoten Richtung 50 schiebt. Sie haben unrecht, dass das ein Problem ist. In LearnClash ist das genau der Punkt. Wir wollen, dass jedes Duell in der Zone landet, wo dein Gehirn die Antwort encodiert, nicht in der Zone, wo du cruist oder panikst.
Wie bewertet LearnClashs Composite-Matchmaker ein Duell?
In LearnClash bewertet der Composite-Matchmaker jedes offene Duell mit einer 50/50-gewichteten Mischung. ELO-Nähe misst, wie nahe zwei Bewertungen liegen. Kategorien-Cosinus-Ähnlichkeit misst Themenüberschneidung. Der kombinierte Score entscheidet, ob eine Paarung zündet oder in der Warteschlange bleibt.
Abbildung 3: Der Composite-Bewerter belohnt sowohl Kompetenz-Nähe als auch Themenrelevanz. Eine 40-Punkte-ELO-Lücke mit starker Themenüberschneidung zündet; eine 40-Punkte-Lücke ohne Überschneidung wartet in der Warteschlange.
Die Kompetenz-Achse ist geradlinig.
ELO-Nähe scort 1,0 bei null Bewertungsabstand. Sie zerfällt glatt auf 0 bei einer 400-Punkte-Lücke.
Wusstest du? Eine 40-Punkte-Lücke gibt 0,96 auf der Nähe-Kurve. Eine 100-Punkte-Lücke gibt 0,86. Eine 200-Punkte-Lücke fällt auf 0,5.
Die Relevanz-Achse ist, was die meisten Matchmaker überspringen. Kategorien-Cosinus-Ähnlichkeit behandelt jeden Spielers jüngste Themen-Historie als Vektor. Cosinus gibt 1,0 zurück, wenn beide dieselben Kategorien gespielt haben. Sie gibt 0 zurück, wenn sie nichts teilen.
| Lücke | ELO-Nähe | Kommentar |
|---|---|---|
| 0 | 1,0 | Gleiche Bewertung |
| 40 | 0,96 | Composite zündet leicht |
| 100 | 0,86 | Composite zündet mit Themenmatch |
| 200 | 0,50 | Composite braucht starkes Themenmatch |
| 400 | 0,00 | Composite blockiert die Paarung |
Arbeitsbeispiel, April-2026-Daten:
| Spieler A (1.340 ELO) | Spieler B (1.380 ELO) | |
|---|---|---|
| Letzte Themen | Europa, Geographie, klassische Musik | Europa, Geographie, Weltkino |
| ELO-Lücke | k. A. | 40 Punkte |
| ELO-Nähe | k. A. | 0,96 |
| Kategorien-Cosinus | k. A. | 0,83 |
| Composite-Score | k. A. | 0,90 |
| Match zündet? | k. A. | Ja (über 0,85) |
Als wir den Composite-Bewerter über die April-2026-Ranglisten-Duelle testeten, landeten rund 82 Prozent innerhalb von 80 ELO-Punkten und einem Kategorien-Cosinus über 0,7. Diese duale Bedingung produziert das enge Band.
Der Composite ist absichtlich gleichgewichtet. Reines ELO-Matchmaking ignoriert Themenkompetenz. Ein Phönix-Geschichtsspezialist würde einen Phönix-Physik-Spezialisten in der falschen Kategorie zerlegen. Reines Themenmatching ignoriert Kompetenz-Kalibrierung. Zwei Anfänger mit identischen Themeninteressen würden nie Lernfortschritte sehen.
Wichtigste Erkenntnis: Ein Composite-Matchmaker belohnt sowohl Kompetenz als auch Themenmatch. Ohne Kategorien-Cosinus kann ELO-Matching allein kein lernbares Duell garantieren.
Wie sieht die April-2026-Siegquoten-Verteilung aus?
Die April-2026-LearnClash-Siegquoten-Verteilung sieht aus wie eine schmale, hohe Glocke mit zwei dünnen Schwänzen. In LearnClash landen rund 82 Prozent der Ranglisten-Duelle im 45-55-Band. Der Rest verteilt sich auf 30-45 und 55-70, meist aus Kalibrierung und Themenüberschneidungs-Rändern.
Abbildung 4: April-2026-Siegquoten-Verteilung. Die 45-50- und 50-55-Bins halten je rund 41 % der Ranglisten-Duelle. Die dünnen Schwänze kommen von Kalibrierungs-Paarungen und seltenen Themenüberschneidungs-Mismatches.
Die numerische Aufschlüsselung:
| Siegquoten-Bin | Anteil gerankter Duelle |
|---|---|
| 30-35 % | ~2 % |
| 35-40 % | ~5 % |
| 40-45 % | ~10 % |
| 45-50 % | ~41 % |
| 50-55 % | ~41 % |
| 55-60 % | ~10 % |
| 60-65 % | ~5 % |
| 65-70 % | ~2 % |
Das sind grob 82 Prozent der Duelle im 45-55-Band, gegen den 30-70-Spread bei zufälliger Paarung. Drei Kräfte schieben Duelle aus dem Band:
- K-Faktor 40 Kalibrierung: erste 10 Duelle neuer Spieler schwingen weit, bevor sie sich setzen
- K-Faktor 20 Steady-State: etablierte Spieler sehen ±5 Prozentpunkte um 50
- Tiefe Themen-Mismatches: Composite zündet bei großem ELO mit mittelmäßigem Cosinus
K-Faktor 40 ist die erste Kraft. Neue LearnClash-Spieler starten bei 1.300 (Gold II, Leiter-Durchschnitt). Ein neuer Spieler springt vielleicht zwischen 1.240 und 1.360 in einer Sitzung. Bis Kalibrierung greift, hat der Matchmaker weniger Vertrauen in die Bewertung, und Paarungen werden weiter.
Wusstest du? Riot Games erklärte 2024, dass ein „faires“ League-Match jedes Team innerhalb ±1 Prozent von 50 hat. Die Zahl ist Industriestandard, aber der Grund, warum MOBAs und LearnClash darauf konvergieren, unterscheidet sich.
K-Faktor 20 komprimiert alles. Sobald ein Spieler 10 Ranglisten-Duelle abgeschlossen hat, sinkt K auf 20. Die Bewertung bewegt sich halb so schnell. Die Siegquoten-Varianz komprimiert auf rund ±5 Prozentpunkte um 50.
Tiefe Themen-Mismatches erklären den Rest. Ein Composite-Score über 0,85 kann zünden, wenn ELO großartig ist, aber Cosinus mittelmäßig, etwa 0,6. Der Spieler, dessen letzte Themen passen, bekommt einen kleinen Vorteil, den der Bewertungsabstand allein nicht vorhersagen kann.
Wichtigste Erkenntnis: Drei Kräfte erklären die dünnen Schwänze: K=40 Kalibrierung, K=20 Steady-State und der kleine, aber reale Kategorien-Cosinus-Spielraum, den der Composite zulässt.
Wir zogen diese Verteilung aus unserem internen April-2026-Dashboard. Die Form ist Monat für Monat so konsistent, dass jede größere Drift ein Bug im Composite-Bewerter wäre, den wir innerhalb weniger Stunden über Alerts und ein automatisches Histogramm-Diff erkennen würden, lange bevor er die durchschnittliche Spielererfahrung beeinflusst. Und das ist die Stärke des Systems: Vorhersagbarkeit.
Warum Themenüberschneidung das Band verengt oder weitet
Themenüberschneidung ist die zweite Achse, und sie moduliert das Band stärker, als die meisten Spieler realisieren. In LearnClash komprimiert das Siegquoten-Band auf rund 47-53, wenn der Kategorien-Cosinus über 0,7 sitzt. Senke den Cosinus unter 0,3, und selbst ein ELO-gematchtes Duell kann auf 40-60 spreizen. Themenvertrautheit ist verborgene Kompetenz.
Abbildung 5: Kategorien-Cosinus-Ähnlichkeit gegen Siegquoten-Band-Enge. Hohe Überschneidung über 0,7 komprimiert Ergebnisse; niedrige Überschneidung unter 0,3 lässt Themenvertrautheit ins reine Bewertungs-Matching durchsickern.
Und die Intuition ist einfach.
Zwei Spieler, die den letzten Monat mit europäischer Geographie verbracht haben, kommen zu einem Europa-Geographie-Duell mit ähnlicher Exposition. Kompetenz, Abruftempo und sorgfältiges Lesen entscheiden den Ausgang. Das Siegquoten-Band bleibt schmal.
Wusstest du? Reine ELO-Matchmaker in MOBA-Spielen scheitern im Lernkontext. Kompetenz ist in einem Quiz nicht themenagnostisch: ein Spieler, der 500 Chemiefragen beantwortet hat, hat einen riesigen Vorteil gegenüber einem, der 5 beantwortet hat, unabhängig von der Bewertung.
Zwei Spieler, die auf Molekularbiologie gematcht werden, wo nur einer vorher Biologie gespielt hat, sehen Exposition Kompetenz überwiegen. Der vertraute Spieler gewinnt häufiger, als ELO vorhersagen würde. Selbst bei null ELO-Lücke spreizt die Siegquote.
Wichtigste Erkenntnis: Der Composite-Bewerter ist die Lösung. Themenvertrautheit ist verborgene Kompetenz, und die Cosinus-Schicht behandelt sie als solche.
Die April-2026-Daten dazu:
| Kategorien-Cosinus | Siegquoten-Band | Kommentar |
|---|---|---|
| 0,85 - 1,0 | 48 - 52 % | Engstes Band; beide kennen dasselbe Material |
| 0,70 - 0,85 | 47 - 53 % | Composite-Zünd-Sweetspot; ~70 % der Paarungen |
| 0,50 - 0,70 | 45 - 55 % | Standard-Band; ~22 % der Paarungen |
| 0,30 - 0,50 | 42 - 58 % | Themenvertrautheit sickert ein |
| Unter 0,30 | 40 - 60 % | Selbst ELO-gematchte Duelle weiten sich sichtbar |
Wenn der Matchmaker ein paar Sekunden länger braucht, ist das der Composite-Bewerter, der einen Eröffner mit Kompetenz-Nähe und Themenüberschneidung jagt. Leichter gesagt als getan in einer kleinen Warteschlange. Aber dieser kleine Aufschub ist der Unterschied zwischen einem Duell, das lehrt, und einem, das frustriert.
Wichtigste Erkenntnis: ELO-Nähe ist notwendig, aber nicht ausreichend. Die Kategorien-Cosinus-Schicht ist, was das Band von 30-70 auf 45-55 komprimiert.
Wie der K-Faktor die Kalibrierungskurve formt
Der K-Faktor steuert, wie aggressiv das System eine Bewertung nach jedem Duell aktualisiert. In LearnClash nutzen deine ersten 10 Duelle K=40 für schnelle Kalibrierung. Dann fällt K auf 20 für stabilen Spielbetrieb. Die Siegquoten-Varianz halbiert sich mit dem K-Faktor-Drop, und das Band zieht sich sichtbar enger.
Abbildung 6: Siegquoten-Varianz über die ersten 50 Duelle. K=40-Kalibrierung produziert einen breiten ±15-Spread; K=20-Steady-State komprimiert Varianz auf ±5 um 50.
Die Mathematik ist simpel. Verdopplung des K-Faktors verdoppelt den Bewertungs-Schwung pro Duell.
Wusstest du? Ein neuer Spieler mit Bewertung 1.300 kann in einer Fünf-Niederlagen-Sitzung unter K=40 auf 1.100 fallen. Dieselbe Fünf-Niederlagen-Sitzung unter K=20 lässt ihn nur auf 1.200 fallen.
Die breiten K=40-Schwünge sind beabsichtigt. Sie lassen Kalibrierung deine echte Kompetenz schneller finden, als allmähliche Drift es täte.
Kalibrierungs-Varianz ist auch im Siegquoten-Band beobachtbar. Wir verfolgten die ersten 50 Ranglisten-Duelle neuer LearnClash-Spieler im April 2026:
| Duell-Bereich | K-Faktor | Median-Varianz | Band-Form |
|---|---|---|---|
| 1-3 | 40 | ±18 Punkte | Lose 32-68 % |
| 4-10 | 40 | ±13 Punkte | Breit 37-63 % |
| 11-25 | 20 | ±7 Punkte | Verengend 43-57 % |
| 26-50 | 20 | ±5 Punkte | Stabil 45-55 % |
Bis Duell 14 hat die K=40-Phase einen neuen Spieler typischerweise unter seine Startstufe fallen lassen. Das System braucht einen breiten Schwung, um den Startbewertungs-Bias abzuziehen.
Jeder neue Spieler beginnt bei 1.300, unabhängig von echter Kompetenz. Ein Spitzenspieler muss klettern. Ein Anfänger muss fallen. K=40 macht beides schnell.
Wusstest du? Der Deutsche Schachbund führt parallel zur FIDE-ELO eine eigene Wertungszahl, die DWZ (Deutsche Wertungszahl), mit dynamischem Entwicklungskoeffizienten ähnlich dem K-Faktor. Junge Spieler unter 20 erhalten höhere Koeffizienten für schnellere Kalibrierung, eine Logik, die LearnClashs K=40/K=20-Split widerspiegelt. FIDE selbst nutzt K=40/20 mit derselben Philosophie. Riot Games landete bei nahen Zahlen. Microsofts TrueSkill nutzt einen Bayesschen Unsicherheitsterm, der dieselbe Arbeit durch einen anderen Mechanismus erledigt.
Dann sperrt das System K bei 20, und die Bewertung bewegt sich pro Duell kaum. Ein 1.300er-Spieler, der etwa 5 Punkte für einen Leichter-Favorit-Sieg und 15 Punkte für eine Überraschung gewinnt, ist klein genug, dass Volatilität aufhört, das Band zu treiben. Kompetenz treibt es ab diesem Punkt.
Wichtigste Erkenntnis: Bei K=40 schwingt die Bewertung pro Duell weit. Bei K=20 nicht. Genau dieser Übergang nach den ersten 10 Duellen ist es, was du als Spieler als „jetzt fühlt sich jedes Duell eng an“ wahrnimmst.
Wenn Veteranen-LearnClash-Spieler genau das sagen, ist das keine Nostalgie. Also: der K-Faktor komprimiert die Varianz buchstäblich, und der Matchmaker liest die Bewertung mit mehr Vertrauen. Und kombiniert mit dem Composite-Bewerter-Themengewicht zieht sich das Band zu, dass die meisten Duelle innerhalb von fünf Fragen Abstand enden.
Wie ELO-gematchte Siege die 3-stufige Mems-Retention verstärken
Hier ist der Teil, für den niemand sonst Daten hat. In LearnClash erzeugt ein Sieg in einem ELO-gematchten Duell rund 78 Prozent 7-Tage-Bestehensquote auf den richtig beantworteten Fragen. Ein Sieg in einem ELO-ungleichen Duell erzeugt rund 66 Prozent. Der 12-Punkte-Lift ist wünschenswerte Schwierigkeit, die in Retentionsdaten auftaucht.
Abbildung 7: 7-Tage-SRS-Bestehensquote nach ELO-gematchten Siegen gegen ungleiche Siege. Die 12-Punkte-Lücke ist die Zone wünschenswerter Schwierigkeit, die direkt in Retentionsdaten auftaucht.
Die Zahlen kommen aus der Querverknüpfung zweier Systeme.
Wusstest du? Composite-Matchmaker-Logs erfassen, ob jedes Duell im 45-55-Band landete. Das 3-stufige Mems-SRS erfasst Bestehensquoten bei 7- und 90-Tage-Intervallen. Ihre Verknüpfung über Frage-Identifier im April 2026 produzierte den obigen Vergleich.
Drei Dinge trieben die Lücke. Nur eines davon ist intuitiv.
- Erregung: ein enges Duell erzeugt moderate Cortisol-Erhöhung und stärkeres neuronales Encoding
- Abrufschwierigkeit: Fragen, die du knapp richtig hattest, saßen am Rand des Abrufs, der Bjork-Zone
- Encoding-arme Klare-Sieger: leichte Siege antworten durch Mustererkennung, nicht Abruf, also encodiert das Gehirn kaum
Der erste Treiber ist Erregung. Ein enges Duell erzeugt moderate Cortisol-Erhöhung und stärkeres neuronales Encoding, gemäß dem zuvor behandelten Yerkes-Dodson-Prinzip. Jede korrekt beantwortete Frage in diesem Zustand encodiert dauerhafter als dieselbe Frage in einer Niedrigstress-Übungsrunde. Salehi et al. (2019) demonstrierten denselben Effekt in Laborstudien.
Der zweite Treiber ist Abrufschwierigkeit. Die Fragen, die du in einem 45-55-Duell knapp richtig hattest, saßen am Rand deiner Abruffähigkeit, der Zone, die Bjork wünschenswerte Schwierigkeit nannte. Abruf, der mit Mühe gelingt, legt stärkeres Gedächtnis an als Abruf, der leicht gelingt.
„Bedingungen, die die Erwerbsrate verlangsamen, produzieren oft die dauerhafteste Langzeitretention.“ Robert Bjork, zusammengefasst in Making Things Hard on Yourself (2011)
Der dritte Treiber ist das, worüber niemand spricht. Klare Siege sind encoding-arm. Wenn ein Spieler dominiert, antwortet er oft korrekt, ohne Abruf zu engagieren. Die richtige Antwort kommt durch Mustererkennung, durch Kategorienvertrautheit, dadurch, dass die Frage zu leicht ist. Das Gehirn encodiert diese Momente kaum.
Eine Woche später feuert die SRS-Prüfung. Und der Spieler kann sich an die Frage, die er „mühelos richtig hatte”, nicht erinnern.
| Sieg-Typ | 7-Tage-SRS-Bestehensquote | Warum |
|---|---|---|
| ELO-gematcht (45-55-Band) | ~78 % | Mühevoller Abruf, moderate Erregung, volles Encoding |
| Leichter Favorit (55-65-Band) | ~71 % | Flüssigkeitsillusion sickert ein |
| Schwerer Favorit (65 %+ Band) | ~66 % | Mustererkennung, schwaches Encoding |
| Außenseiter-Überraschung | ~74 % | Hohe Erregung kompensiert niedrigere Basisgenauigkeit |
Deshalb haben wir den Composite-Matchmaker so gebaut, wie wir ihn gebaut haben. Es reicht nicht, enge Duelle für Engagement zu wollen. Wir wollen enge Duelle, weil sie die 3-stufige Mems-Retentionskurve härter treffen lassen. Leichte Siege aus ungleichen Duellen füttern die SRS-Pipeline mit schlechtem Encoding. Harte-aber-faire Siege füttern sie mit Erinnerungen, die die 7-Tage-Prüfung überleben. Systeme, die für Cram-Sitzungen gebaut sind, wie Quizlets Free-Learn-Modus mit Cap bei 5 Runden pro Set, planen diese Prüfung gar nicht ein.
Wichtigste Erkenntnis: ELO-Matching ist nicht nur ein Engagement-System. In LearnClash ist es ein Gedächtnisqualitäts-System. Siege im 45-55-Band erzeugen rund 12 Punkte mehr dauerhafte Retention als Siege außerhalb davon.
Wie sich LearnClash von MOBAs und TrueSkill unterscheidet
LearnClash erbt die ELO-Formel vom Schach, die Bewertungsabweichungs-Idee von Glicko und die Composite-Bewertungs-Idee von niemandem. In LearnClash bleibt die öffentliche Bewertung als ELO. Die Inaktivitätsbehandlung nutzt intern Glicko-Stil-Abweichungswachstum. Der Matchmaker legt Kategorien-Cosinus oben drauf.
Abbildung 8: Matchmaker-Vergleich über League of Legends, Halo TrueSkill 2, Schach-Glicko-2 und LearnClash. Andere Ziele, andere Bewertungssysteme, andere Bewertungsschichten.
MOBAs lösen ein anderes Problem und kommen zu anderen Antworten. Der Vier-System-Vergleich:
| League of Legends | Halo TrueSkill 2 | Schach Glicko-2 | LearnClash | |
|---|---|---|---|---|
| Bewertungssystem | ELO MMR | TrueSkill 2 Bayessch | Glicko-2 | ELO + Glicko intern |
| Matchmaking-Eingabe | Nur Kompetenz | Kompetenz + Unsicherheit | Kompetenz + RD | Kompetenz + RD + Cosinus |
| Siegquoten-Ziel | 50 % (Riot-Politik) | Vorhersage-optimiert | Turnierfairness | 45-55 % + Retention |
| Stärkste bei | Massen-PVP | Mixed-Team-Vorhersage | Langzeit-Tracking | Lerndauerhaftigkeit |
| Schwäche | Themen-blind | Hoher Rechenaufwand | Keine Kategorienkenntnis | Engere Warteschlange bei Skalierung |
League of Legends nutzt eine interne MMR getrennt vom sichtbaren Rang. Riots erklärtes Ziel ist, dass jedes Team einen 50-Prozent-Erwartungswert ±1 hat, was ihr Dev-Team 2024 bestätigte. Die 50-Prozent-Verschwörung in League-Foren spiegelt eine echte Designentscheidung wider, angewendet auf den falschen Rahmen: MOBAs zielen auf ausgeglichene Warteschlangen ab, nicht ausgeglichenes Lernen.
Microsofts TrueSkill 2 (2018) ist das mathematisch ausgefeilteste. Es behandelt jeden Spielers Kompetenz als Wahrscheinlichkeitsverteilung und aktualisiert die Varianz nach jedem Match.
Wusstest du? TrueSkill 2 wurde ursprünglich mit Match-Daten aus der Halo-2-Beta evaluiert. Das System trainierte auf Hunderten Millionen Matches, bevor es in Halo 5 ausgeliefert wurde. Es prognostiziert Ergebnisse mit 68 Prozent Genauigkeit, gegen 52 Prozent für das ursprüngliche TrueSkill.
Das Modell behandelt Teamspiel, Unentschieden und Quitting-Verhalten nativ. Der Preis ist hoher Rechenaufwand und eine öffentliche Bewertung, die für neue Spieler unvorhersagbar springt.
Schach-Glicko-2 (Mark Glickman, 1995, 2001 weiterentwickelt) fügte einen Bewertungsabweichungs-Term zum ELO-Mittelwert hinzu. RD misst, wie zuversichtlich das System gerade in deine Bewertung ist. Sie wächst nach Inaktivität, schrumpft mit regelmäßigem Spielbetrieb und lässt das System dich gegen ein breiteres Band paaren, wenn Unsicherheit hoch ist.
Wichtigste Erkenntnis: Jedes der vier Systeme optimiert für ein anderes Ziel. MOBAs optimieren für Warteschlangen-Balance. Microsoft optimiert für Vorhersage-Genauigkeit. Schach optimiert für Turnierfairness. LearnClash optimiert für die Lernkurve.
LearnClashs Composite pickt aus jedem. Die öffentliche Bewertung bleibt als ELO, weil die Markenvertrautheit und Stufen-Lesbarkeit zählen für die Spielerentität. Das Glicko-Stil-RD-Wachstum läuft darunter, um Inaktivität abzufangen. Die Kategorien-Cosinus-Schicht ist die LearnClash-Ergänzung und der Grund, warum sich das Siegquoten-Band auf 45-55 statt 40-60 zuzieht.
Ein LearnClash-Duell und ein League-Ranglisten-Match teilen einen gemeinsamen Vorfahren und ansonsten fast nichts mehr, weil jedes der vier Systeme über die Jahre eigene Antworten auf seine eigenen Probleme entwickelt hat. Andere Ziele. Andere Mathematik. Kurz: andere Sportart.
Das Fazit
ELO-Matchmaking landet LearnClash-Duelle 82 Prozent der Zeit in einem 45-55-Prozent-Siegquoten-Band, und dieses Band ist genau der Punkt. Die „erzwungene 50“-Klage, die MOBA-Spieler erheben, ist echte Mathematik, aber der falsche Rahmen für einen Lernkontext.
Wichtigste Erkenntnis: In LearnClash bedeutet ein enges Siegquoten-Band enge Retentionsgewinne. Ein 12-Punkte-Lift auf der 7-Tage-SRS-Bestehensquote gegen ungleiche Siege. Die Zone wünschenswerter Schwierigkeit, die direkt in deinen Daten auftaucht.
Wähle ein Thema. Dein erstes Ranglisten-Duell dauert drei Minuten. Der Composite-Matchmaker erledigt den Rest, und was du fühlen wirst, ist der Unterschied zwischen einem Quiz, das driftet, und einem Duell, das genau in den Slot deiner Kompetenz passt, wo Gedächtnis tatsächlich entsteht und wo der nächste 7-Tage-Check tatsächlich stattfindet. Probier’s. Fordere mich heraus zu Lerntechniken →.
Häufig gestellte Fragen
Was ist eine ELO-gematchte Siegquote?
Eine ELO-gematchte Siegquote ist die Gewinnwahrscheinlichkeit, wenn beide Spieler einen engen Bewertungsabstand teilen. In LearnClash landen ELO-gematchte Ranglisten-Duelle bei 45 bis 55 Prozent in den April-2026-Daten, gegenüber 30 bis 70 Prozent bei zufälliger Paarung. Dieses Band visiert kompetenzbasiertes Matchmaking an, keine erzwungene Quote.
Erzwingt LearnClashs Matchmaking eine 50-Prozent-Siegquote?
Nein. LearnClash matcht Spieler nach Kompetenz, nicht durch Manipulation der Ergebnisse. Kompetenz-gematchte Gegner produzieren natürlich ein 45-55-Prozent-Siegquoten-Band, weil beide Spieler ungefähr gleiche Chancen haben. Die „erzwungene 50“-Theorie in MOBA-Foren verwechselt Korrelation mit Kausalität: ausgeglichenes ELO produziert ausgeglichene Siegquoten als Folge, nicht als Ziel.
Warum nutzt LearnClash einen 50/50-Composite aus ELO-Nähe und Kategorienüberschneidung?
Reines ELO-Matchmaking ignoriert Themenkompetenz. Ein Phönix-Geschichtsspezialist würde gegen einen Phönix-Physik-Spezialisten in der falschen Kategorie untergehen. LearnClashs 50/50-Composite stellt sowohl Kompetenz als auch Themenrelevanz sicher, was Duelle lernfähig hält und das Siegquoten-Band ohne harten Bewertungsbereich-Filter eng hält.
Wie vergleicht sich ELO-Matchmaking mit TrueSkill oder Glicko-2?
TrueSkill 2 (Microsoft, 2018) verfolgt Kompetenzunsicherheit neben dem Bewertungsmittelwert und prognostiziert Match-Ausgänge mit 68 Prozent Genauigkeit. Glicko fügt Bewertungsabweichung hinzu, die mit Inaktivität wächst. LearnClash nutzt Glicko intern für Inaktivitätsbehandlung, behält aber die öffentliche Bewertung als ELO und ergänzt Kategorien-Cosinus, weil Lernwert von Themenübereinstimmung abhängt, nicht nur von Kompetenz.
Verbessert häufigeres Gewinnen in ELO-gematchten Duellen die Gedächtnisleistung?
Ja. April-2026-LearnClash-Daten zeigen rund 78 Prozent 7-Tage-Bestehensquote nach Siegen in ELO-gematchten Duellen, gegen 66 Prozent nach Siegen in ELO-ungleichen Duellen. Das 45-55-Prozent-Band liegt in Bjorks Zone wünschenswerter Schwierigkeit, die Abrufmühe in dauerhaftes Gedächtnis umwandelt. Leichte Siege erzeugen denselben Effekt nicht.