ELO für 40k

Aelaephos

Aushilfspinsler
21. April 2010
7
0
4.621
Vor einiger Zeit fiel mal wieder auf, dass das NTR bei T3 leider nicht die höchste Aussagekraft hat, da es doch vor allem Teamturniere und Vielspieler stark bevorteilt. Aus diesem Grund gab es die Idee ein ELO ähnliches System für Warhammer zu etablieren.



Das Ergebnis kann man hier sehen:

http://www.familie-schitthelm.de/index.html




Einige von euch mögen sich fragen: Was ist ELO eigentlich? Warum soll das so toll sein? Ich versuche mal eine kurze Erklärung:
Das ELO Wertungssystem wurde in den 1960er Jahren für den Vergleich von Schachspielern eingeführt. Es berücksichtigt für die Berechnung der Spielstärke bzw. der Punktzahl nur gegen welche Spieler man gespielt hat, nicht aber wie beispielsweise in einem spezifischen Turnier abgeschnitten wurde. Wir haben uns entschieden nicht den genauen ELO Ansatz zu nehmen wie er bei Wikipedia steht, sondern aufgrund der recht geringen Anzahl an Partien bei den meisten Spielern eine eigene Parametrisierung zu wählen.
Unser ELO System basiert auf 4 Parametern die erstmal willkürlich gewählt sind. Die Parameter sind:
[TABLE="align: center"]
[TR]
[TD]Startpunktzahl:[/TD]
[TD]1200[/TD]
[/TR]
[TR]
[TD]Maximaldifferenz:[/TD]
[TD]300[/TD]
[/TR]
[TR]
[TD]Maximaler Gewinn:[/TD]
[TD]32[/TD]
[/TR]
[TR]
[TD]Spielbonus:[/TD]
[TD]0[/TD]
[/TR]
[/TABLE]
Die Startpunktzahl ist der Wert bei dem jeder Spieler anfängt. Aufgrund der zu geringen Spielzahl halten wir ein Schätzen für schwierig.
Die Maximaldifferenz ist der Wert ab dem der bessere Spieler für einen Sieg keine Punkte bekommt. Wer 300 Punkte mehr als der Gegner hat bekommt bei einem Sieg genau 0 Punkte.
Der maximale Gewinn ist die Punktzahl die man bekommt falls man einen Spieler schlägt der 300 und mehr Punkte besser ist. Genau so viele verliert der entsprechende Spieler. Im Falle eines Unentschiedens wird der Wert um die Hälfte der maximalen Punkte reduziert. Spiele ich gegen einen 300 Punkte besseren Spieler Unentschieden gewinne ich also 16 Punkte in dieser Konfiguration
Der Spielbonus ist eine optionale Variable die es erlaubt Vielspieler zu belohnen indem sie bei jedem Spiel Bonuspunkte vergibt. Wir sind uns noch unsicher ob das sinnvoll ist und haben den Wert erstmal auf 0 gesetzt. Allerdings ist durch die bereits vorhandene Implementierung eine schnelle Anpassung einfach durchführbar.

Bisher haben wir über 20 große und kleine Turniere in unserer Datenbank hinterlegt, was schonmal für über 2600 Spiele reicht, die von knapp 500 Spielern ausgetragen wurden. Die Auswahl entfiel dabei nicht willkürlich, sondern wir haben einfach alle Turniere genommen die ihre Ergebnisse hier im Forum veröffentlicht haben. 😉

Diese Turnierbasis reicht schon für eine halbwegs aussagefähige Tabelle wie ich finde, die Top20 sind alles starke und erfolgreiche Spieler.
Wirklich belastbar kann die Tabelle aber nur werden wenn die Zahl der in der Datenbank hinterlegten Turniere wesentlich größer wird, und dafür brauchen wir die Mithilfe aller Orgas, bitte schickt uns eure Göpp-Ergebnis-Dateien, egal ob das Turnier alt oder aktuell ist, und egal wie groß.

An alle Turnierspieler die Frage, was haltet ihr generell von ELO für 40k und ganz im speziellen von unseren gewählten Parametern?
Was könnten wir anders machen um die Aussagekraft zu erhöhen?
 
Ehrlich gesagt halte ich davon nichts.
Die Maximaldifferenz ist der Wert ab dem der bessere Spieler für einen Sieg keine Punkte bekommt. Wer 300 Punkte mehr als der Gegner hat bekommt bei einem Sieg genau 0 Punkte.
Der maximale Gewinn ist die Punktzahl die man bekommt falls man einen Spieler schlägt der 300 und mehr Punkte besser ist. Genau so viele verliert der entsprechende Spieler. Im Falle eines Unentschiedens wird der Wert um die Hälfte der maximalen Punkte reduziert. Spiele ich gegen einen 300 Punkte besseren Spieler Unentschieden gewinne ich also 16 Punkte in dieser Konfiguration
Wenn ein 300+ Spieler mit seinen Tyras gegen Dark Eldar haushoch gewinnt, bekommt er also 0 Punkte?
Gleichzeitig kann jeder Noob mit 3 Drachen einen 300+ Dark Angels Spieler tablen und bekommt dafür 32?
Ne, sagt mir ehrlich gesagt nicht zu...
 
Naja, wenn man darüber nachdenkt. Wenn sich jemand mit Dark Angels eine Wertung erarbeitet um die 300 Punkte Differenz zu haben dann wird auch nicht gleich jeder der mit der Imba copy&paste Liste kommt diesen auch gleich besiegen können. Zusätzlich können sich sehr gute Spieler welche erst seid kurzem auf Turniere fahren so leichter eine Wertung erarbeiten die ihrem können entspricht. Den sonst haben nur diejenigen eine gute Wertung die lange genug auf jedes Turnier fahren, und jemand der neu dazu kommt hat keine Chance in der Liste innerhalb eines brauchbaren Zeitraumes eine nach oben zu kommen. Im sinne von, an die Spitze zu kommen ist leicht, aber sich dort zu halten was ganz anderes.
 
Der Denkfehler, der mMn gemacht wird, ist, dass 40k kein Schach ist. Bei 40k haben nicht beide Spieler dieselben Voraussetzungen.

ELO setzt einfach verschiedene Sachen vorraus:
1) Ein Spieler spielt immer auf einem ähnlichen Powerlevel (nicht, dass Braindead plötzlich just4fun Fun-Listen spielt, die FenneQ ihm geschrieben hat)

2) Jede Armee kann gegen jede andere Armee gewinnen.

Sonst spiele ich einfach gegen braindeads Tau mit einer Raider-Liste auf Unentschieden und kassiere 16 Punkte...
 
Sonst spiele ich einfach gegen braindeads Tau mit einer Raider-Liste auf Unentschieden und kassiere 16 Punkte...
Und wie stehen die Chancen auf einem Turnier mit der Liste dann auch braindead mit Tau als Gegner hast bzw wenn du erfolgreich forderst, das die 16 Punkte sich nicht aufheben weil man gegen andere verliert? Nicht das die 2 Probleme nicht existieren würden, aber ich sehe sie nicht als entscheidende Probleme die in der Turnierrealität eine große Rolle spielen würden.
 
Bei Magic ist/war das nie ein Problem. Da wurden nur Spielerstärken verglichen und das Turnierlevel. Welches Deck man hatte/brachte/sich gedrafted hat sorgte auch für Ungleichheit. Das System funktioniert aber auch etwas anders.

Viel wichtiger ist doch die Frage, wozu wir angebliche Spielstärke messen sollen. Es gibt doch überhaupt keinen Anreiz dafür. Bei Magic ist es Geld, Flüge, Sponsoring sogar Fernsehübertragungen. Bei 40k ist es....ein von Fans für Fans gesponsorter Blechpokal.

40k ist ein Hobby und kein "Sport". Dann bräuchte man auch richtige Schiedsrichter, klare Reglements, Support durch eine Organisation (oft der Hersteller) etc.

Das einzige was ich an Ranking gut finde, ist das man Seeding durchführen kann, aber das ist ja allgemein auch unerwünscht. Wir werden ohne GW Support niemals eine Turnierszene erschaffen können, die sich mit Schach etc. vergleichen lässt.

Vielmehr fällt mir auf, das es kaum Nachwuchs gibt. Ob man mit sowas Nachwuchs anzieht oder abschreckt mag jeder selber beurteilen.

Ich fahr auf 40k Turniere um alte Bekannte zu treffen, mal von zu hause raus zu kommen und meine Armee auszuführen. Gewinnen ist natürlich cool, aber sicherlich nicht meine Motivation. Ich denke das das NTR Ranking viele Schwachstellen hat, aber es ist ja auch nur ein Abfallprodukt des wichtigsten Instruments der deutschen Szene. Ohne T3 gäb es keine nationale Szene, weshalb ich T3 für unersätzlich halte. Eine alternative Berchenungsmethode wäre eventuell prima, aber ELO?
 
Was sollte GW denn tun, um eine größere Hilfe für die Turnierlandschaft zu sein? Ausbalancierte Armeen und wirklich eindeutige Regeln fällt mir da spontan ein, zumindest die eindeutigen Regeln würden sich doch über das GRC erarbeiten lassen.
Auf einen Versuch mit ELO innerhalb von T3 sollte man es mal ankommen lassen.
 
T3 ist doch nicht das Problem, wie sollen wir Organisatoren das denn leben/umsetzen?
Man würde neue Turniersoftware benötigen etc. Ausserdem funktionieren solche Systeme nur mit S/U/N. Was bei 40k das Problem der zu wenigen Runden um einen Sieger zu ermitteln Problematik führt.
Da kann man einen 100seitigen Aufsatz zu schreiben, aber es ist unmöglich sowas umzusetzen ohne Support aller wichtigen Turnier-Orgas in Deutschland. Und dann müssen die Spieler das auch noch mögen/annehmen.

Nochmal:

Hohes Rating führt normalerweise zu :
a) Seeding --> Fußball etc.
b) Byes --> http://www.wizards.com/magic/tcg/events.aspx?x=grandprix/byes

Bei 10-ründigen Turnieren müssen die Pros die ersten Runden im sogenannten "Sumpf" nicht spielen um nicht zufällig gegen einen Nobody Punkte zu verlieren. Bei 40k WILL MAN SPIELEN, da es meist drei Runden gibt wird kaum ein "Pro" nur 1-2 Runden sielen wollen. Bei Magic ist man froh wenn man nicht spielen muss.

Wenn man mal annimmt das Byes bullshit sind bei 40k und Seeding keiner mag, vor allem nicht die Anfänger. Wozu dann ein Ranking???
Damit irgendwer "omg isch hab 284858584859 Punkte" in seine Bewerbungen schreiben kann? Was genau soll das Rating bewirken wenn Byes und Seeding keiner will?

Bitte mal erklären.
 
Der T3 NTR hat ohnehin wenig Aussagekraft, und daran wird auch ein anderes System zur Bewertung des NTR nichts ändern. Denn was willst du eigentlich messen? Die tatsächliche Spielstärke eines Spielers? Da werfe ich doch einfach folgende Aussagen in den Raum:

1) Warhammer 40k ist zu Teilen pay-2-win.

2) Du hast im Gegensatz zu Schach keine gemeinsame Basis: jedes Turnier hat andere Regeln/Missionen. Daraus ergibt sich jedes Mal ein anderes Spielgleichgewicht. Vergleichbarkeit ist nicht gegeben.

--> Warhammer 40k ist nicht kompetitiv.

Das sind systeminhärente Probleme, die du durch einen anderen Bewertungsmaßstab nicht lösen kannst. Wenn dich die aktuellen NTR ärgern, dann gibt es zwei Lösungen:

1) Pfeif drauf: das Hobby ist vielfältig genug und bietet reichlich andere Aspekte, um sich drin verlieren zu können.
2) Schwimm mit dem Strom: wenn du ein besseres Ranking haben willst, dann mach was dafür.
 
Zuletzt bearbeitet:
AGB von T3 schrieb:
§ 7 Datenschutz

1.
Ihre personenbezogenen Daten werden ausschließlich zum Zwecke der Veranstaltung von Turnieren genutzt. Die Daten der angemeldeten Spieler sind für die jeweiligen Veranstalter zugänglich. Umgekehrt sind die Kontaktdaten der Veranstalter für die Spieler zugänglich.

Mit der Anmeldung zu einem durch T³ vermittelten Turnier, stimmt der Nutzer ferner der Veröffentlichung seiner Daten in Bezug auf Teilnehmerlisten, Ergebnis- und Ranglisten usw. auf T³ zu und gibt diese für die statistische Verarbeitung frei...

- und wer wurde eigentlich gefragt, ob er an der ETC Teamfindungswertung teilnehmen wollte; btw. wer stimmt denn vorher zu, wenn ein Turnier nach T3 das Pairing organisieren will.

Vielleicht einfach mal die Kirche im Dorf lassen und akzeptieren, dass es auch ein paar wenige Spieler gibt, die aktuell eben nicht zufrieden mit der Situation sind - aber statt lange zu lamentieren, das alles shice ist und darüber graue Haare bekommen, aber nichts bewegen - eben einfach die Zustände der Unzufriedenheit einfach mal verändern.

- und auch wenn ELO nicht perfekt für 40k ist; besser als das aktuelle System ist es für mich zB in jedem Fall.



MfG
 
Zuletzt bearbeitet:
Hat der Threadersteller ein wenig zu oft League of LEgends gespielt? 😉

Muss aber sagen, dass das ELO-System ganz gut funktioniert.
Die Gleichheit bei Warhammer 40000 liegt doch bei der Punktzahl einer entsprechenden Armee.
Somit stehen sich gleiche Armee gegenüber wie beim Schach.

Natürlich kann man immer einen Konter aufstellen, aber das kann man beim Schach auch.
Dort stellt man vielleicht keine unterschiedlichen Truppen auf, aber man spielt unterschiedliche Strategien/Zugfolgen.
Ich denke das ist mit einer Armeeaufstellung vergleichbar.

ELO wird nicht immer auf Begeisterung treffen und einige werden ihre Einstufung auch in Frage stellen,
aber ich finde so ein System funktioniert sehr gut.

Die Frage hier ist nur wie schon erwähnt der Nutzen und die Realisibarkeit.

Für eine eigene Spielergruppe aber sicher denkbar.
Wenn man sich denn klassifizieren will.
 
Ich finde ELO für so was gar nicht schlecht, aber es sollte kein Nullergebnis in der Formel geben. Es ist definitiv besser als ein reines Punktesammelsystem, weil irgendwann Noobs schrubben fast nichts mehr wert ist.

Wir nutzen so was auf unserem Mekwars-Kampagnenserver, wo die ELO-Zahl die Payouts und den Landeroberungsfaktor beeinflusst, bei großem Unterschied bekommt der LELO (so nennen wir Spieler mit niedrigem ELO: Low-ELO) deutlich mehr Geld und der HELO eben weniger (egal, ob der HELO gewinnt oder nicht. Ich kriege relativ oft relativ schlechtere Payouts als der Verlierer, das soll ein bisschen dem pay-to-win-Effekt vorbeugen 😉), und es geht automatisch um weniger Planetenprozente, wenn Leute mit großem Unterschied gegeneinander spielen (das schwächt den Kampagnenimpact der HELOs ab und verhindert, dass schlechte Spieler durch reines Glück viel erobern können; wir hatten das mal asymmetrisch versucht wie beim Geld, aber das fand am Ende keiner gut).

Ich würde schon sagen, dass es sich bewährt hat, auf dem Server laufen pro Jahr je nach Betrieb 10-15000 Spiele, als Kampagnentool ist es ziemlich nützlich, auch zur Einschätzung von Gegnern und sich selbst. Der einzige Nachteil, den ich persönlich finden konnte, ist, dass schwächere Spieler von hohen Rankings eingeschüchtert werden können und dann schlechter spielen, als sie es würden, wenn sie gegen "gleichwertige" Spieler spielen würden (als Moderator/Judge auf dem Server sehe ich bei ziemlich vielen Spielen zu, man kennt irgendwann den Stil der Leute in verschiedenen Situationen). Aber das dürfte bei NTR-Punkten nicht anders sein.
 
Einer der Gründe für ein aussagefähiges Ranking-System ist in der Tat einfach um zu sehen wo man selber steht, wer ganz oben steht und überhaupt, wie so die Verteilung der Spieler ist die man kennt. Also reine Neugierde, sicherlich, aber ich persönlich finde das schon interessant, und das geht sicher mehr Leuten so, auch wenn das eventuell viele nicht zugeben würden.

Dass das ELO-System schon ganz gut funktioniert sieht man denke ich an der aktuellen Liste. Mittlerweile sind 2859 Turnierspiele in der Datenbank hinterlegt und die Top20 sehen meiner Ansicht nach plausibel aus. Braindead ist natürlich zu weit hinten, aber das liegt schlicht daran dass von ihm bisher nur 3 Turniere erfasst wurden und von den anderen Topspielern wesentlich mehr. Man kann mit wenigen Spielen nicht gleich an die Spitze kommen, das finde ich aber auch genau richtig so.

Weitere Beweggründe für das ELO sind durchaus Gedanken über eine Setzliste in der ersten Runde eines Turniers. Gerade wenn ein Turnier ein sehr unausgewogenes Verhältnis von Spielern zu Runden hat (z.B. 50 Spieler bei 3 Runden) würde ein Paaren nach Setzliste in der 1. Runde sicher helfen ein "faireres" Ergebnis zu erhalten. Ich sehe da auch kaum Gründe warum Spieler dagegen sein sollten. Herausforderungen kann man ja trotzdem erlauben. Die technische Umsetzung wird eher ein Problem, Göpp gibt sowas aktuell nicht her.

Außerdem wird ein Teil des ETC-Teams über das NTR bestimmt, obwohl sich alle einig sind dass das wirklich nicht sehr aussagefähig bezüglich der Spielerstärke ist. Das wird nur so gemacht weil halt nix besseres da war, bis jetzt. ELO ist meiner Ansicht nach wesentlich besser geeignet um die Spielerstärke zu messen als NTR, ich denke ELO ist so gut dass man auch die ersten 5-6 des ETC-Teams nach Tabelle bestimmen könnte, nicht nur die Top 3 wie aktuell nach NTR.
Aber warten wir mit der Diskussion bezüglich ETC-Teamfindung bis nach dem ETC.
 
Es ist vollkommen gleich. Das eine System ist ebenso aussagekräftig wie das andere. Spieler 1 müht sich mit einen Soros total einen ab, hat es aber in Wirklichkeit voll drauf. Spieler 2 hat dennoch den besseren Rang, weil er genug Kohle hat um sich stets dem neuesten Trend anzupassen und derzeit mit Tau/Eldar ordentlich punktet ohne auch nur drei Gehirnzellen abzumühen.

Spieler 3 und Spieler 4 spielen beide Tyraniden. Doch Spieler 3 spielt in einem Umkreis, wo es nur wenig Gelände auf Turnieren gibt und die Missionen aufs Vernichten ausgelegt sind, Spieler 4 hingegen hat ein Umfeld wo ordentlich viel Deckung existiert und die Missionen mehr aufs Erobern setzen. Spieler 4 gewinnt öfter mit seinen Tyraniden, weil denen Erobern besser steht als Vernichten. Vielleicht ist Spieler 3 aber unter gleichen Bedingungen besser...

Ähnliche Situation mit zwei Tau Spielern. Der Spielumkreis des einen lässt kein "Deckung ignorieren" gegen Fahrzeuge zu, der Umkreis des anderen schon,...

Schach und Online-Spiele bieten allen Spielern die selbe Plattform unter den selben Bedingungen. Eine solche Basis fehlt Warhammer 40k komplett. Daher ist der T3 Rang nicht sehr aussagekräftig, egal nach welchem System er bewertet wird.

P.S. Und die Auswahl fürs ETC kann's doch nun wirklich nicht sein, oder? Wer da wirklich mitmachen will, der kann das auch jetzt schon tun. Da gibt es mehrere Möglichkeiten.
 
@ Raven: wenn schon zitieren bitte richtig und vollständig.

§ 7 Datenschutz

1.
Ihre personenbezogenen Daten werden ausschließlich zum Zwecke der Veranstaltung von Turnieren genutzt. Die Daten der angemeldeten Spieler sind für die jeweiligen Veranstalter zugänglich. Umgekehrt sind die Kontaktdaten der Veranstalter für die Spieler zugänglich.

Mit der Anmeldung zu einem durch T³ vermittelten Turnier, stimmt der Nutzer ferner der Veröffentlichung seiner Daten in Bezug auf Teilnehmerlisten, Ergebnis- und Ranglisten usw. auf T³ zu und gibt diese für die statistische Verarbeitung frei. Hierbei finden sich sowohl der Name als auch der Accountname auf den entsprechenden Listen wieder.

Soweit eine Veröffentlichung dieser Daten nicht gewünscht ist, hat der Nutzer die Möglichkeit der kompletten Anonymisierung. Im System (Teilnehmerlisten, Ranglisten, Ergebnislisten) wird er daraufhin nur noch als "Anonym" geführt. Lediglich die T³-Administratoren und Organisatoren haben dann Zugriff zu seinen Daten. Die Möglichkeit der Anonymisierung besitzt jeder registrierte Nutzer durch seine ihm zur Verfügung gestellten Einstellungen. Nicht registrierte Spieler müssen sich zur Anonymisierung an die T³-Administratoren wenden.

2.
Veranstalter, die die T³-Turnierverwaltung nutzen, verpflichten sich, die Daten im Sinne dieses Paragraphen nur zum Zwecke der Turnierverwaltung zu nutzen. Des Weiteren haben sie dafür Sorge zu tragen, dass die Ergebnisse der Turniere möglichst fehlerfrei erstellt werden. Eine Fälschung der Ergebnislisten ist verboten.

3.
Alle weiteren Daten werden streng vertraulich behandelt. Eine Weitergabe Ihrer Daten zum Zwecke der Vermarktung oder zu anderen Werbezwecken erfolgt nicht.

Wichtig für mich vor allem der Absatz über anonymisierung meiner Daten!
 
Würde das ganze auf einer rechtlich nicht so fragwürdigen Basis stehen, könnte ich eine Schnittstelle in meine Turniersoftware einbauen.
Damit die ELO-Geschichte fuktioniert, müssten die Leute sich schon auf der ELO-Seite registrieren und der Nutzung ihrer Daten zustimmen müssen.
Aber im Gegensatz zu T3 bietet die ELO-Seite ja außer einer Tabelle nichts. Was ein ziemlich schwacher Anreiz ist, sich dort auch noch anzumelden.
Zudem hinter der ELO-Seite kein bekannter Name steht. Aber selbst das würde bei einer Turnierlandschaft, in der jeder 5 Meinungen über alles hat, nicht ausreichen genug Leute dafür zu begeistern.
 
@Morten - Du hast die Intention des Zitates falsch verstanden. Mein Auszug diente lediglich als Hinweis darauf, was bereits bekannt sein sollte, weil bereits zugestimmt wurde. Auch habe ich die entsprechende Quelle ausreichend benannt, so dass jeder Betroffene (wie auch Du) in die Lage versetzt wurde, sich - nochmals btw. im Nachhinein - darüber zu informieren, wozu er da eigentlich ja gesagt hat - nämlich zur Möglichkeit einer offenen, ggf anonymisierten 😉 , statistischen Verarbeitung. Das diese nur von/durch/über T3 erfolgen darf, ist - zwangsläufig - offenzuhalten.


btw. - damit wir uns richtig verstehen - eine / die Nutzung von Klarnamen btw. die Veröffentlichung der solchen durch ELO finde auch ich nicht in Ordnung; auch wenn man mit ein wenig Geduld jeden ggf verwendeten Nick durchaus verifizieren könnte, wenn man denn wollte.


MfG
 
@ Raven: ja, hab dich wohl missverstanden. Wir sind einigermaßen einer Meinung 😛rost:

@ Aelaephos: ich wäre ja über ne Antwort dankbar. Insgesamt sehe ich inzwischen mehr und mehr einen Verstoß gegen die Datenschutzbestimmungen aus der AGB von T3. Verarbeiten kann man meine Daten meinetwegen, aber veröffentlichen ist n anderer Schuh. Ich finds einfach n bisschen komisch, dass man ohne viel Aufwand (meinen Namen bei Google eintragen) auf eurer Seite landen kann.