Bewertungssystem-Vorschlag fürs Nordmanöver 2010

Vovin

Tabletop-Fanatiker
06. Juni 2001
6.291
5
31.671
43
Als erstes analysiere ich, warum die jetzigen Nordmanöver-System nicht funktionieren, dann stelle ich einige Prinzipien auf, die ein funktionierendes System erfüllen muss und zum Schluss stelle ich das AXE-Turnier-System vor, das nach diesen Prinzipien entwickelt wurde. Wer sich die Analyse ersparen will, kann also direkt runter scrollen und nur den Vorschlag lesen.

Analyse des Scheiterns der Softscore-Wertung:

Um es klar zu machen: Man wird nie alle Spieler erreichen. Einige werden nie mit einem Turnier mit Softscores zufrieden sein, egal wie gut sie umgesetzt wurden, aus dem einfachen Grund, dass es ihre Siegchancen schmälert, weil sie in diesen Bereichen nicht so gut sind oder sein wollen, weil es ihrem Spielverständis zuwiderläuft. Genau andersherum werden einige auch nie zu einem Turnier ohne Softscores gehen, weil das ihre Siegchancen schmälert, da sie auch dort gut sind und es ihrem Spielverständnis zuwiderläuft, dass diese Bereiche keine Rolle spielen (ja, auch Softscore-Spieler wollen gewinnen, gebens aber nicht so gerne zu).

Jenseits dieser Extreme kann man trotzdem viele Spieler zu einem Turnier bringen, das Softscores benutzt, wenn es eine vernünftige Balance gibt und vor allem, wenn die Bewertung nachvollziehbar ist. So wie es im Moment ist, begibt man sich bei den Softscores in Gottes Hand. Das ist das eigentliche Problem. Selbst wenn die Bewertung gerecht ist, hat man nie das Gefühl das zu bekommen, was man verdient, weil es zu undurchsichtig ist, wie die Bewertung zustande kommt.

Die Balance eines Mixturniers sollte in etwa so aussehen:

Ein reine Powerarmee ohne jeglichen Anspruch auf Style und Bemalqualität: kann den Generalssieg holen, aber hat keine Chance auf den Gesamtsieg.

Eine optimierte Liste, die möglichst spielstark ist, dabei aber auch etwas Style und eine stimmige, aber nicht unbedingt niederknieenswerte Bemalung berücksichtigt: sollte den Gesamtsieg erringen können

Eine richtig schön angemalte Liste mit Hintergrunds-Konzept, bei der die Armeeliste aber nicht nur aus Ladenhüter-Einheiten besteht und die von einem fähigen General gesteuert wird, der mit der Liste zumindest ein Unentschieden gegen Powerlisten herausholen kann: sollte den Gesamtsieg erringen können

Eine Armee mit Bemalung auf GD-Niveau mit einer Truppauswahl, die direkt der Hintergrundssektion entsprungen sein könnte, die aber von einem Vollhonk als General geführt wird: sollte Chancen auf Best Painted und/oder Style haben, aber beim Gesamtsieg nicht mitreden können


Für das Problem, dass die Bewertung der Softscores undurchsichtig ist, gibt es zwei Lösungen: 1. Beschränkungen, 2. eine mutige Neubewertung der Art und Weise, wie man Style „misst“

1.) Da die Nordmanöver Orga keine Beschränkungen will, gehe ich hier nicht detailliert drauf ein. Es wäre aber durchaus für die ganze Turnierszene wünschenswert, wenn sich ein allgemein akzeptiertes Beschränkungssystem etablieren würde. Weil dadurch weniger Stein-Schere-Papier-Situationen entstehen, bei der der Sieger eines Spiels schon vorher feststeht und weil es Fun- und Powergamer etwas näher zusammen bringt.
Der Knackpunkt ist aber das Stichwort „Autorität“. Wenn GW ein System aus schlecht balancierten Regeln und Armeelisten herausbringt, dann akzeptiert das jeder und nutzt die ganzen Balanceschwächen zu seinem Vorteil aus. Wenn jedoch eine einzelne Turnierorga dieses schlecht balancierte System durch Beschränkungen modifiziert und damit ein eigenes System schafft, meckern die meisten rum, weil ihre alten Armeelisten nicht mehr funktionieren. Selbst wenn das beschränkte System balancierter ist, wird es nicht akzeptiert werden, weil es ANDERS balanciert ist. Es fehlt dem System an Autorität um akzeptiert zu werden – es kommt ja nicht von GW. Wenn es allerding einen Konsens zwischen möglichst vielen Spielern geben würde und das System von mehreren Turnieren benutzt werde würde, dann wäre es der neue Status Quo und die Autorität wäre da. Auch hier würden sich die Spieler drauf stürzen und die Balanceschwächen ausnutzen. Das ist auch vollkommen in Ordnung. Man wäre in der gleichen Situation wie im unbeschränkten GW-System: ein unbalanciertes System, das man zu seinen Gunsten ausnutzen kann, von dem man ausgehen kann, dass es eine gewisse Verbreitung hat, zu dem es sich lohnt, sich stundenlang Gedanken zu machen um seine Armeeliste darauf zu optimieren. Der Vorteil an dem beschränkten System wäre jedoch, dass sowohl sich sowohl Turnierspieler als auch Fungamer damit identifizieren können.
Wenn ein einzelnes Turnier ein Beschränkungssystem hat, dann müssen Spieler ihre fürs unbeschränkte Spielen erstellte Armeeliste umbauen. Das passt natürlich nicht jedem.
Wenn ein solches Beschränkungssystem jedoch verbreitet ist (eventuella uch in verschiedenen Abstufungen), dann würden Spieler das schon direkt beim Planen der Liste berücksichtigen. Sie würden ihre Liste also nicht für ein einzelnes Turnier umstellen müssen.

2.) Ich halte aber auch jenseits von Beschränkungen ein Softscoresystem für so ausbaubar, dass es konsensfähig ist. Man muss sich erstmal die Dinge vor Augen führen, die das jetzige System scheitern lassen:

- Turnierspieler akzeptieren Softscore-Regeln nicht, weil sie sich dadurch benachteiligt im Vergleich zu einem reinen Generalspunkte-Turnier sehen. Wie schon erwähnt, wird man nicht jeden Spieler überzeugen können. Ein harter Kern wird immer jedes System ablehnen, dass ihnen auch nur den geringsten Nachteil bringt. Man sollte das also gar nicht erst versuchen, da man sonst wieder zwangsweise bei einem System landet, das gar keine Softscores hat.

- Softscores werden nicht als turnierrelevante Kriterien gesehen, sondern als artfremder Mechanismus, der vom Wesentlichen nur ablenkt. Dem kann man entgegenwirken, indem man die Softscore-Regeln im Vorfeld planbar macht. Je mehr Kontrolle ein Spieler über sein Abschneiden in den Bereichen hat, desto mehr wird er es als turniertaugliche Disziplin akzeptieren.

- Ergebnisse, wie 12 Moloche, die den Stylepreis absahnen, untergraben das komplette System und vermitteln völlig zu Recht den Eindruck, dass hier ein Mechanismus am Werk ist, der im besten Fall willkürlich ist und im schlechtesten Fall Betrug. Transparenz muss her.

- Style ist ein so schwammiger Begriff, dass jeder darunter etwas anderes versteht. Eine genauere Definition muss her.

- Das System soll erreichen, dass die Schere zwischen Stylespielern und Powergamern nicht zu weit auseinander klafft. Das Ziel ist gut, aber die Umsetzung ist schlecht. Im Moment werden Powergamer abgestraft und bekommen das Gefühl, auf die Wertung keinen Einfluss zu haben. Jedem Spieler muss bewusst die Wahl gelassen werden, auf welchen Powerlevel sich seine Armee bewegt und ihm muss auch direkt klar sein, welche Konsequenzen diese Entscheidung nach dem Bewertungssystem hat. Im Moment ist es leider eher ein „Ich bau die Armeeliste so hart auf wie möglich, baue einige Verschleierungselemente ein, die sehr stylish aussehen und hoffe dann, dass ich durchs Raster falle und viele Softscores absahne“. Der Glücksfaktor ist zu hoch und die Schere zwischen den Armeelisten wird nicht geschlossen, sondern nur in glückliche Powergamer und Pechvögel unterteilt.

- Wenn man eine Armeeliste bewertet, dann muss man den Spielern auch sagen, warum sie ihre Note bkommen haben. Wenn man das scheut, weil es dann nur noch mehr Diskussionen gibt, dann ist an dem System etwas falsch. Wenn vorher einige Bewertungseckpunkte bekannt sind, könnte man die Bewertungen hinterher auch einfacher rechtfertigen.

Einige Prinzipien für ein funktionierendes Allround-Turnier:

Ein radikales Umdenken muss her, das vor allem von der Orga einiges abverlangt. Alle einfachen Lösungen haben sich als Spaßkiller erwiesen – mit einfachen Lösungen kommt man nicht weiter.

Mut zur Komplexität:
Der heilige Gral wäre ein einfaches System, das gut funktioniert. Leider wurden schon viele einfache Systeme durchprobiert, ohne dass eines auch nur ansatzweise zufriedenstellend wäre. Also darf man sich vor etwas mehr Komplexität nicht fürchten. Wir kommen immerhin mit einem Regelwerk von Hunderten von Seiten zurecht, da kann man uns auch mehr zutrauen als minimalistische Turnierregeln. Schlanke Regeln haben natürlich etwas ästhetisches, aber wenn dieses Kompaktheit gleichzeitig dazu führt, dass die Regeln nicht mehr funktionieren, dann muss eben eine Schippe drauf gepackt werden. Natürlich muss von der Orga während des Turniers noch alles in Echtzeit regelbar sein und es darf nicht so kompliziert sein, dass es für die Spieler genauso undurchschaubar ist, wie das alte System – aber bis dahin ist noch viel Luft.

Mut zur Transparenz:
Selbst wenn die Bewertung sich nicht an feste Kriterien hält sondern nur an einen groben Rahmen, so muss doch im Vorfeld kommuniziert werden, wonach sich die Bewertung richtet. So wie es dieses Jahr war, ist es ein klares NoGo. Die Intention ist klar: die Spieler sollen sich nicht zu sehr darauf einstellen. Aber warum nicht? Transparenz ist wichtig, damit sich nicht 80% der Spieler ungerecht behandelt fühlen. Und nicht nur das: wenn man sich nicht sicher ist, ob seine Armeeliste Style-Punkte bekommt oder nicht, welchen Anreiz sollte dann ein Turnierspieler haben, seine Armeeliste abzuschwächen? Wenn er aber einen klaren Rahmen hat, dann kann er eine begründete Entscheidung treffen, ob er mit einer Knüppelliste kommen will oder es sich doch lohnt etwas ausgewogener aufzustellen, anstatt die Katze im Sack zu kaufen.

Divide and Conquer:
Style ist etwas sehr sehr schwammiges. Nicht nur, weil man es kaum messen kann, sondern auch, weil jeder etwas anderes darunter versteht: Spielstärke, Hintergrundtreue, Thema und Individualität sind die wichtigsten Facetten. Ihr habt mit eurer Style-Wertung vor allem die Spielstärke gemeint. Aber wer konnte das ahnen? Selbst wenn ihr daraus lernt und nächstes mal besser kommuniziert, was ihr meint, deckt diese Bewertung nur einen Teil des Styles ab. Eine Lösung wäre, aus einer großen Stylekategorie mehrere kleinere Kategorien zu machen: z.B. eine Kategorie für die Spielstärke, eine für die Hintergrundtreue und eine dritte für die Individualität. Der Nachteil ist der erhöhte Aufwand. Die Vorteile sind aber weit größer. Zu jeder Kategorie kann man weit verbindlichere Angaben machen, wie bewertet wird. Es erhöht die Transparenz gewaltig. Zudem macht es auch das Bewerten an sich einfacher. Man kann auch viel besser dosieren, zu was für Armeelisten man die Spieler hinleiten will. Vor allem können sich die Speiler darauf einstellen.

Außerdem gibt es bei bei allen anderen Bewertungsarten, die den Style als ganzes nach einem gewissen System bewerten, das Problem, dass stets eine bestimmte Art der Armeeliste als unstylish gebrandmarkt wird, obwohl sie es nach Ansicht der Mehrheit nicht sein sollte. Wenn man z.B. ein System hat, dass Dopplungen bestraft, werden z.B. Themenarmeen schlecht bewertet, die auf eine kleine Bandbreite an Trupps setzen. Das sollte aber nicht sein. Bei einer Teilung der Kategorie Style würden diese Listen dann in jeweils einer durchfallen, in den anderen aber glänzen.

Noch wichtiger wird diese Unterteilung bei System wie DarkProphecy, bei der Spielergruppen bewerten. Dort kann es ganz schnell passieren, dass die eine Gruppe vor allem nach Spielstärke beurteilt, die andere hingegen nach Dopplungen und eine dritte wiederum nur nach Hintergrundtreue. Das ist einer der Gründe, warum das System nicht funktioniert.

Mut zur Flexibilität
Gebt den Spielern bei den Softscores eine Möglichkeit, eine der Kategorien aus der Wertung herauszunehmen. Das schwächt das Problem ab, dass Themenarmee oder jeweils ein anderer Armeetypus ungewollt abgestraft wird. Diese Möglichkeit kommt aber nicht nur den Stylespielern zugute, sondern auch den Powergamern, denn diese haben mehr Optimierungsspielraum. Funktionieren kann das aber nur, wenn man genug Kategorien hat, damit man nicht gleich 50% der Softscores streichen kann und so das ganze System unterwandert. Es soll nur ein Mechanismus sein um besondere Härten abzuschwächen und zudem dem Spielern das klare Gefühl zu geben, er hätte in der Hand, wie seine Softscore-Punkte aussehen.

Mut zur Imbalance
Mit jedem System kann man Szenarien finden, in denen es zu komischen und ungewollten Ergebnissen kommt. Damit muss man immer leben. Man sollte sich also nicht zu sehr von Zweifeln blenden lassen. Vor allem, wenn man die Stylekategorien splittet und noch dazu eine kicken kann, ist genug Spielraum im System, um solche Fälle abzufangen. Es darf also in einer Kategorie Vorteile für bestimmte Armeen geben, da dies durch die anderen Kategorien aufgefangen werden. Wenn man versucht, jedes Bewertungssystem für alle Armeen gleich vorteilhaft zu gestaltet, ist man gelähmt. Selbst wenn man gar kein System benutzt, kommen wieder die Imbalances zum Tragen, die GW in die Codices reingeschrieben hat. Also nur Mut dazu, auch wenn der Necronspieler über Kategorie A motzt und der Eldarspieler über Kategorie B.

Mut zur Subjektivität
Ganz klar: Ziel muss es sein, alle Bewertungen so objektiv wie möglich durchzuführen.
Das heißt aber nicht, dass man zu jeder Kategorie ein klares Punktesystem nach dem Schema „für x, gibt es +2 Punkte“ braucht. Ein klarer Rahmen ist wichtig, damit sowohl die Spieler als auch die Jury von vornherein wissen, was bewertet wird. Die Bewertung selbst kann dann frei erfolgen, solange die Jury aus genug Leuten zusammensetzt. Wenn genug Leute abstimmen, wird aus einer subjektiven Wertung eine objektive. Bei einer Miss-Wahl mögen subjektiv 20% Miss Deutschland am schönsten finden, wenn aber 60% für Miss Brasilien gestimmt haben, dann ist diese auch objektiv die Schönere. Dafür reicht es aber nicht aus, wenn bei 100 Teilnehmern 5 Personen abstimmen. Es muss eine kritische Masse erreicht werden, damit die Bewertung die Subjektivität verliert. Zusammen mit einem mathematischen Kniff (s.u.) und der Splittung der Kategorien kann man viel gerechtere Ergebnisse erzielen.

Mut zum Kampf
Ein Grund, warum die Softscores als lasch angesehen werden, ist, dass es keinen Wettkampf um sie gibt. Generalspunkte sind begrenzt und wenn es ein 20-0, 10-10, 0-20 System gibt, wird immer eine feste Anzahl an Punkten im Laufe des Turniers ausgeschüttet. Und wer 100 Punkte erringt, hat damit gezeigt, dass er besser als alle anderen ist. Bei den Softscores können aber theoretisch alle Teilnehmer die Maximalpunktzahl erreichen. Man kämpft nicht gegen die Konkurrenten um die Punkte, sondern mit der Jury um die Punkte. Das ist ein fatales Signal. Wenn hier mehr Konkurrenz herrscht, weckt das den Ehrgeiz hier mehr aus seiner Armeeliste herauszuholen. Softscores werden turnierfähiger.

PS: rechnerisch macht es natürlich idR keinen so großen Unterschied, pychologisch aber sehr wohl

Mut zur Relativität
Wer kennt es nicht, das Geschrei: „Letztes Jahr hatte ich aber mit der gleichen Liste noch 2 Punkte mehr“. Das Problem ist, dass die Style- und Bemalpunkte als absolute Größen angesehen werden. Aber warum? Bei den Generalspunkten sagt ja auch niemand „Aber ich hab doch die gleiche Liste und hab genauso gut gespielt, warum bin ich diesmal schlechter?“. Die Punkte sind auch abhängig von der Konkurrenz. So sollte es bei den Softscores ebenfalls sein. Wenn die Gegner nur Powerlisten haben, sollte man mit einer Durchschnittsliste gut abschneiden. Gegen ein Feld mit Themenarmeen sieht man damit aber alt aus. Dann wäre nächstes Mal die Antwort auf das Rumgeheule: „Letztes Jahr hatte ich aber mit der gleichen Liste noch 2 Punkte mehr“ - „Da waren ja auch nur Bartarmeen am Start – Du Punk!“

Mut zur Mathematik
Ja, ich weiß: Mathe ist doof. Trotzdem kann sie ungemein helfen. Das Problem ist ja, dass die Gruppen oder Orga-Juroren sehr unterschiedlich bewerten – der/die eine streng, der ander/die freimütig. Wenn man dann einfach den Durchschnitt bildet, hängt das Abschneiden des Spielers auch zum großen Teil daran, ob er von großzügigen oder strengen Gruppen bewertet wurde. Das sollte nicht der Fall sein.
Die Lösung ist, die Bewertungsergebnisse zu normieren. Also der Mittelwert aller Bewertungen der Gruppe wird vom Ergebnis eines Spielers abgezogen und dann durch die Standardabweichung geteilt. Jeder Student eines naturwissenschaftlichen oder wirtschaftlichen Studiengangs wird damit schonmal in Berührung gekommen sein – es ist also kein völlig esotherisches Verfahren.

Dadurch werden sozusagen die Eigenheiten der verschiedenen Gruppen „rausgewaschen“. Heraus kommt jeweils ein Wert zwischen -1 und 1, die dann auch vergleichbar sind. Egal ob die Gruppe Punkte verschenkt, Punkte bunkert, die Punkte streut oder die Bewertungen dicht beieinander hält. Das ganze ist mit einer Exceltabelle voll zu automatisieren: ein Kinderspiel!
Mal ein Beispiel: 5 Spieler werden von 3 Gruppen auf einer Skala von 0 bis 20 bewertet

Gruppe 1 bewertet Spieler 1-5: 4/6/12/12/18
Gruppe 2 ist strenger: 0/2/10/12/16
und Gruppe 3 traut sich nicht so richtig, extreme Wertungen zu vergeben: 7/8/10/10/13

nach der Normierung (und einer Rückskalierung auf 0-20 um es vergleichbar zu machen) erhält man gerundet:

Gruppe 1: 4/6/11/11/17
Gruppe 2: 4/6/11/13/16
Gruppe 3: 4/7/11/11/17

Man sieht also: die Ergebnisse liegen viel dichter beieinander. Und das schon bevor man den Mittelwert zwsichen verschiedenen Gruppen bildet. Man erhält mit diesem einfachen mathematischen Trick eine viel höhere Genauigkeit.

Mut zur Masse
Softscores werden auch deshalb abgelehnt, weil der Jury – egal ob es nun die DarkPro-Grüppchen, die Orga, oder, am schlimmsten, die Gegenspieler sind – in den Augen der Spieler die Autorität fehlt, den Style zu bewerten. Es wird einfach nicht akzeptiert – vor allem, wenns negativ ifür einen ausfällt. Autorität entsteht entweder durch Kompetenz wie bei Ringrichtern beim Boxen, Fußballschiedsrichtern oder Eiskunstlauf-Juroren. Solche anerkannten Experten gibt es bei 40k aber nicht, denn dazu müsste man die Bewertung von Listen schon hundertmal gemacht haben. Der einzige andere Weg, der Bewertung autorität zu geben, ist deshalb Quantität. Wenn drei Leute sagen, dass Deine Liste lame ist, fühlst Du Dich ungerecht behandelt, wenn es allerdings 80 von 100 Spielern sagen, dann kannst Du Dich winden, wie Du willst, das Urteil ist klar. (Ja, es wird immernoch Unverbesserliche geben, die sich gemobbt fühlen oder eine Verschwörung wittern). Um diese kritische Masse zu erreichen, gibt es mehrere Möglichkeiten. Alle Spieler abstimmen zu lassen, wird wohl nur als Online-Abstimmung gehen (wäre aber defintiv eine interessante Alternative – ich geh aber nicht drauf ein, da Freder das schon kategorisch ausgeschlossen hat). Beim DarkPro-System kann man durch die Splittung der Kategorien und damit die genauere Bewertung, eine geschickte Überlagerung der Gruppen und die mathematische Normierung der Bewertung eine ähnliche Genauigkeit erreichen, wie bei einer Abstimmung durch alle Spieler (wenn man das mal ausrechnen würde, würde man bei großen Turnieren sicherlich auf einen Fehler von unter 5% kommen – d.h. Man würde ein Ergebnis bekommen, dass nicht mehr als 5% von dem abweicht, was man bekommen hätte, wenn alle Spieler abgestimmt hätten).

Mut zu S-U-N
Dieser Punkt ist konkreter und weniger grundsätzlich als der Rest. Ein System, dass nach Massaker-überlegenem Sieg-knappem Sieg unterscheidet, verschärft die Kluft zwischen Fun- und Turnierlisten erheblich. Auf einem Turnier, wo beide Spielergruppen zusammengeführt werden sollen, ist dies eine schlechte Wahl. Wenn man unbedingt eine Gliederung nach Höhe des Sieges will, dann zumindest 20-0, 18-2, 17-3 und10-10, so dass es zwar einen Unterschied zwischen knappem Sieg und Massaker gibt, dieser aber verhältnismäßig Klein ist.

Es muss natürlich eine sinnvolle Zweitbewertung geben.

Das folgende System ist recht modular und man kann leicht einige Ideen daraus ziehen und andere weglassen, wenn sie einem nicht gefallen. Als ganzes berücksichtigt es aber alle Punkte der vorhergehenden Analyse. Es ist komplizierter als das alte System, aber im Gegenzug dazu hat es die Aussicht zu funktionieren.

Das AXE-Turnier-System

(AXE=Adjusted Cross Evaluation, oder einfach wie die Axt, weil eine Bewertungskategorie einfach gekillt wird)

Es gibt folgende Kategorien:

1. General Wertung (0-100 Punkte möglich)
2. Progamer- Wertung (0-10 Punkte möglich)
3. Bemal- Wertung (0-10 Punkte möglich)
4. Power vs. Thema Wertung (0-10 Punkte möglich)
5. Innovations Wertung (0-10 Punkte möglich)
6. Hintergrunds Wertung (0-10 Punkte möglich)

Jeder nimmt an der Generals-Wertung teil und an vier der fünf anderen Wertungen. Auf der Armeeliste ist zu vermerken, welche Wertung nicht in das Endergebnis einfließt. (Anm.: die Spieler erhalten also je nach ihrer Wahl 110 Punkte durch Spiele und 30 durch Softscores oder kämpfen um 100 Spiel-Punkte und 40 aus Softscores)

1. General-Wertung: es werden 5 rechtzeitig vor Abgabetermin der Armeeliste bekannt gegebene Missionen gespielt. Jeder Sieg bringt 20 Punkte. Jedes Unentschieden 10 Punkte.

2. Progamer Wertung: jeder Sieg, der ein Massaker war, gibt zusätzlich 2 Punkte. Jeder Sieg, der ein überlegener Sieg war, gibt 1 Punkt extra. Knappe Siege, Unentschieden und Niederlagen geben keine Extra- oder gar Minuspunkte.

Paarung: Die Paarungen werden in der ersten Runde ausgelost und in Runde zwei, drei und vier nach dem Schweizer System festgelegt. Berücksichtigt werden jeweils die Summe aus General und Progamer Wertung (sofern gewählt)! (Anm.: das führt dazu, dass Spieler mit Powerlisten, die wahrscheinlich an der Progamer-Wertung teilnehmen, erstmal unter sich bleiben, solange sie gut sind und überlegen gewinnen.)

Nach der vierten Runde werden alle Wertungen (bis auf die gestrichene) der Spieler benutzt um die Paarungen festzulegen. Es werden also alle Softscores mitberücksichtigt. (Anm.: wer das Turnier über die Softscores gewinnen will, soll zumindest in der letzten Runde beweisen, dass er auch gegen die besten Spieler bestehen kann. Das beugt auch ganz Cleveren vor, die absichtlich keine Progamer Wertung wählen um gegen schlechtere Spieler gepaart zu werden. Man kann es auch verschärfen und schon ab Runde 4 so paaren. Oder man legt fest, dass in Runde 1 nur Spieler untereinander gepaart werden, die an der Progamer-Wertung teilnehmen und welche, die nicht dran teilenehmen)

Softskills:
Es gibt 4 Softskill- Wertungskategorien (1x Bemalung, 2x Styleaspekte und 1x eine Mischung aus Bemalung und Style), wobei bei jedem Spieler mindestens drei in die Bewertung mit einfließen. In jeder Kategorie sind bis zu 10 Punkte zu holen. Auch in der Kategorie, die gestrichen wurde, erhält eine Armee Punkte um das System nicht zu verzerren, diese werden aber natürlich nicht mit in die Endauswertung einbezogen.

Grundsätzlich werden je Kategorie entweder von der Orga oder der Spieler-Jury 0-20 Bewertungspunkte vergeben. (Anm.: Man könnte auch hier wie bei den Turnierpunkten 0-10 Punkte nehmen, aber um Verwechslungen auszuschließen, bietet es sich an, eine andere Obergrenze zu nehmen) Das sind aber nicht die Turnierpunkte, die der Spieler letztendlich bekommt. Diese vorläufigen Bewertungspunkte werden dazu benutzt um alle Spieler miteinander zu vergleichen und eine Reihenfolge festzulegen. Anhand dieser Reihenfolge werden dann die Turnierpunkte festgelegt.

Egal in welcher Kategorie, ein Juror oder Juror-Team gibt einer ganzen Anzahl an Armeen eine Bewertung zwischen 0 und 20. Die Ergebnisse werden dann jeweils normiert (siehe
http://tinyurl.com/kur453 ) und der Mittelwert aller Ergebnisse der Juroren oder Juror-Teams gebildet (geht mit Excel ganz einfach). Jede Armee auf diese Weise eine einzelne Bewertung zwischen -1 und 1 erhalten. Damit werden alle teilnehmenden Spieler in absteigender Reihenfolge geordnet. Nach dem nachfolgenden Schlüssel wird bestimmt, wie viele wirkliche Turnierpunkte die Armee bekommt.

(Anm.: das dient dazu um zu kontrollieren, wie viele Punkte im Umlauf sind. Bei den Generalpunkten werden, egal wie die Spiele ausgehen, gleichviel Punkte an die Spieler ausgeschüttet. Der Punktepool bleibt also auch bei den Softscores konstant und es gibt keine Punkteinflation. (Die einzige Fluktuation gibt es bei der Progamer Wertung oder bei Gleichstand) )

Platz 1= 10 Punkte
Platz 2-10= 9 Punkte
Platz 11-20= 8 Punkte
Platz 21-30 = 7 Punkte
Platz 31-40 = 6 Punkte
Platz 41-60 = 5 Punkte
Platz 61-70 = 4 Punkte
Platz 71-80 = 3 Punkte
Platz 81-90 = 2 Punkte
Platz 91-99 = 1 Punkte
Platz 100 = 0 Punkte


(Anm.: wenn weniger als 100 Spieler da sind, ist jeweils ein anderer vorher definierter Schlüssel anzuwenden. Wichtig ist, dass die Summe der verteilten Punkte = Spieleranzahl * 5 ist. Auch hier gibt’s Methoden, die Schlüssel für Teilnehmerzahlen von 30 bis 100 festzulegen, sprengt aber jetzt den Rahmen.)

modifizierte Dark Pro Bewertung: es werden jeweils 3er Gruppen gebildet, die jeweils 9 Armeen in den Kategorien 3. und 4. bewerten. Somit wird jede Armee von 3 Gruppen bewertet. Dabei ist die Verteilung möglichst chaotisch zu wählen. Armeen 1-9 sind also nicht von Gruppe 1, 2 und 3 zu bewerten, sondern Armee 1 von Gruppe 1, 14 und 30, Armee 2 von Gruppe 1, 15 und 32. (Anm.: wie man diese Einteilung im Detail vornimmt, wird hier ausgelassen, ist aber leicht möglich)

Orgabwertungen:
Die Kategorien 5. und 6. werden von der Orga vor Beginn des Turniers bewertet. Das läuft in 2 Phasen ab.

Phase 1: jeder Spieler, der das Geld bereits überwiesen hat (!!), darf vor dem Abgabetermin eine vorläufige Liste einreichen. Ein Teil der Jury bewertet die Liste grob und teilt dem Spieler die ungefähre Punktzahl und eine kurze Begründung mit. Der Spieler kann danach eine modifizierte oder neue Liste einreichen. Das ganze hat die Länge von 2-3 sms und es reicht einen ungefähren Punktwert mitzuteilen – diese Vorabbewertung soll von der Orga ja auch zu bewältigen sein. Jeder diesbezüglichen Email ist ein standardisierter Block angehängt, der dem Spieler überdeutlich erklärt, dass er keinen Anspruch darauf hat, dass auch seine endgültige Liste diesen Wert erhält und vor allem, dass die mitgeteilten Bewertungspunkte auf einer Skala von 0 bis 20 nicht den Turnierpunkten entsprechen. Diese hängen auch zum großen Teil davon ab, wie die Armeelisten der Konkurrenten aussehen.

Phase 2: alle Spieler, die nicht rechtzeitig die Armeeliste abgegeben haben, bekommen automatisch 0 Punkte. Alle anderen Listen werden von 5 Jurymitglieder aus der Orga unabhängig voneinander bewertet. Die Ergebnisse bleiben bis zum Ende des ersten Turniertages unter Verschluss.

3. Bemal-Wertung:
erfolgt nach der modifizierten Dark Pro Bewertung. Bewertet wird die technische Bemalqualität, die Einheitlichkeit der Bemalung, die Qualität der Umsetzung und die Schwierigkeit der verwendeten Techniken. Nicht bewertet wird, wie passend die Bemalung ist. Ultramarines können in rot sein, Necron in bunny-rosa.

Zur Bewertung wird den Spielern eine Skala an die Hand gegeben, die ihnen eine Hilfe sein soll. Sie können die Punkte zwar als Gruppe frei verteilen, haben so aber einen gewissen Rahmen, der ihnen als Orientierung hilft:

vollständig in 3 Farben bemalt
-> soviele Farben wie nötig
-> Farbschema einheitlich
-> Bases einheitlich
-> Farbschema sauber bemalt
-> Details bemalt -> kleinere Umbauten (z.B. Armtausch)
-> einfache Akzente/Schattierungen/Dipping
-> mehrstufige Akzente/Schatten
-> kleinere Effekte wie Edelsteine, Abnutzungsspuren
-> einige besonders hervorstechende Modelle
-> schwer zu realisierende Umbauten (Green Stuff Einsatz, sieht gelungen aus)
-> sehr aufwendige Akzentschichten, kaum noch zu erkennen
-> aufwendige Effekte wie Freehands, Lichtquellen

Die Spieler werden ausdrücklich dazu angehalten, nach der Bewertung aller Armeen noch einmal zurückzublicken und ihre Ergebnisse zu vergleichen. Oft erkennt man dann, dass man anfangs noch etwas anders bewertet hat als zum Schluss.

(Anm.: Die Skala hilft den Gruppen, ihre 9 Armeen untereinander konsistent zu bewerten. Um die Vergleichbarkeit der ergebnisse mit denen der anderen Gruppen sorgt das Normieren.)

4. Power vs. Thema Wertung:
Auch diese Bewertung wird von den Spielern mit dem modifizierten DarkPro System durchgeführt.

Zur Bewertung stellen die Spieler ihre Armee auf und legen die Armeeliste aus. Dazu kommt dann noch ein Zettel mit maximal 3 Stichpunkten mit jeweils nicht mehr als 15 Wörtern, mit denen die Idee der Armee skizziert wird. Ein gutes Konzept zeichnet sich dadurch aus, dass man nicht viel Worte verlieren muss. Mit maximal 45 Wörtern kann man schlecht Dual-Lash,Kyborg erklären. Und keine Jury liest sich eine Din-A-4 Seite Hintergrund durch. Die Bewertung muss ja zügig vonstatten gehen.

Dies ist die subjektivste Kategorie und der wahrscheinlichste Kandidat, der von Powergamer gestrichen wird. Bewertet wird der rein subjektive Eindruck, ob die Liste danach aussieht, ob sie nur aufs Gewinnen ausgelegt wurde oder um eine Geschichte zu erzählen (Anm.: auch hier wird die Subjektivität durch Masse und Normieren wieder objektiviert). Die Gestaltung der Armee kann hierbei durchaus eine Rolle spielen.

Es wird das Verhältnis zwischen offensichtlicher Spielstärke und erkennbarem Thema bewertet. Die tatsächliche Spielstärke wird auf dem Schlachtfeld ermittelt. Hier entscheidet nur, ob man der Armee auch so schon ansieht, dass sie rein auf Effektivität ausgelegt wurde. Ist ein Thema schon beim bloßen Hinsehen erkennbar, oder erst, wenn man sich 2 Seiten Hintergrund durchgelesen hat? Die technische Bemalqualität spielt bei der Bewertung keine Rolle, aber sehr wohl die Stimmigkeit der Bemalung und der Umbauten. Passt die Bemalung zum Thema, das dargestellt wird. Das fängt bei White Scars an, die auch wirklich weiß sein sollten und hört bei der imperialen Sturmarmee auf, bei der jeder imperiale Soldat rennend umgebaut ist.

Wieder wird der Spieler-Jury eine Skala mit auf den Weg gegeben:

Es ist keinerlei Thema erkennbar, aber eigentlich alles wurde auf maximale Effektivität getrimmt
-> es findet sich keine Auswahl, die nicht maximiert wäre, aber würde grob einem Thema folgen, wenn da nicht einige völlig unpassende Auswahlen wären
-> ein Thema ist erkennbar und es wurden auch einige Kompromisse zu Lasten der Spielstärke eingegangen, insgesamt ist die Liste aber maximiert
-> ein Thema ist klar erkennbar und durchgehend umgesetzt, die Liste ist vielleicht spielstark, aber es springt einem nicht ins Gesicht.
-> die Armeeliste ist wild zusammengewürfelt, völlig ineffektiv und ein Thema ist auch nicht richtig erkennbar
-> die Liste hat unmissverständlich ein Thema, das konsequent umgesetzt wurde, es wurden einige Nachteile in Kauf genommen, die Gestaltung der Figuren unterstützt das Thema
-> das Thema der Armee wurde in allen Bereichen konsequent umgesetzt: Armeeliste und Figuren sind wie aus einem Guss, spielstark ist die Liste dadurch eindeutig nicht mehr
-> die Liste ist ein kleines Juwel, man erfasst das Thema durch einen einzigen Blick auf die Armee, alle Umbauten zielen darauf ab und gewinnen tut man mit der Armee nur aus Versehen

5. Innovations Wertung
Die Wertung wird von der Orga im Vorfeld des Turniers durchgeführt und beurteilt wie sehr sich die Armeeliste von den gängigen Turnierarmeen unterscheidet. Um jedem Planungssicherheit zu geben, sammelt die Orga z.B. durch einen gw-fanworld Thread alle typischen Turnierarmeevarianten und veröffentlicht die vollständige Liste vor Abgabetermin. Je mehr sich die Armee in Einheitenauswahl und Ausrüstung von den ausgetrampelten Pfaden entfernt, desto mehr Punkte gibt es. Die Spielstärke wird ebenso wenig berücksichtigt wie der Hintergrund.

6. Hintergrunds Wertung
Die Wertung wird von der Orga im Vorfeld des Turniers durchgeführt und beurteilt, wie sehr die Armee einem Hintergrund entspricht, der auch im offiziellen Universum existiert. Selbst geschriebener Hintergrund zählt nicht, da er nicht bewertbar ist. Es gibt zu jeder Armee aber eine generische Variante mit der sich solche Eigenkreationen abdecken lassen (Anm.: Extrembeispiele wie Total Conversion Themenarmee sehen hier natürlich alt aus, aber der Spieler kann diese Kategorie ja streichen und bekommt bei Power vs. Thema umso leichter Punkte). Der Spieler muss auf der Armeeliste vermerken, nach welchem Armeeschema er bewertet werden möchte und die Armee muss entsprechend bemalt sein.

Zu jeder Armeevariante gibt es eine Tabelle mit Einheiten (das können auch Ausrüstungsvarianten sein wie z.B. Fernkampffex/Nahkampffex, 10er SpaceMarine Trupp/5-9er space Marine Trupp), die besonders typisch für die Armee sind und die eher selten sind. Auch hier hilft die Community sicher gerne, den erheblichen Aufwand abzumildern, was zudem auch die Transparenz erhöht.

Beispiel Eldar: Iyanden, Biel Tan, Saim Hann, Alaitoc

Ulthwe:
typisch: Eldrad, Farseer ohne Jetbike, Warlocks ohne Jetbike, Gardisten, Jetbikes, Vyper, Kampfläufer, Plattformen
normal: Fahrzeuge, Farseer/Warlocks auf Jetbike, Dark Reaper, Autarch, Avatar, Maugan Ra, Dark Reaper, Wraithguard/-lord
untypisch: Aspektkrieger, Yriel, Phönixkönige

generische Eldar:
typisch: Gardisten, Asuryans Jäger, Farseer, Autarch
normal: alles sonstige
untypisch: Warpspinnen, Speere des Khaine, Harlequine, Yriel, Eldrad


Je mehr typische Einheiten vorhanden sind, desto besser. Und je mehr untypische, desto schlechter. Generische Armeen neigen dazu, wenig typische und untypische Einheiten zu haben, entsprechend schwer ist es, damit besonders gut (aber auch schlecht) abzuschneiden. Das ganze System ist nicht mathematisch nachvollziehbar. Die Orga vergibt die Punkte immer noch nach eigenem Sachverstand. Es können auch kleinere Kriterien eine Rolle spielen, wie z.B. ganz viele 5er Einheiten in einer Ultramarine-Armee. Aber die Tabellen sollen sowohl der Orga als aus den Spielern weitestgehend Sicherheit geben. Die Orga hat klare Bewertungskriterien und die Spieler können sich selbst grob ausmalen, wie gut sie abschneiden.

(Anm.: man kann diese Kategorie auch nach modifiziertem DarkPro System vergeben lassen. Damit das funktionieren kann und man nicht das Turnierheft mit den Tabellen zu jeder Armee überladen wird, muss jeder Spieler die passende Tabelle auf seine Armeeliste oder eine Extraseite packen.)

Andere Bewertungen
für was es Pokale gibt, ob es eine Fairplay-Wertung gibt, ob es eine Schönste-Armee Wahl gibt, wie man ein etwaiges Quiz einbindet, wie man die Tie-Breaker-Regelung bei den Generalspunkten und die Missionen und Punktzahl gestaltet, lasse ich offen

Beispiel: Fiktiver Turnierablauf:

Ich will mit einer Ulthwe Liste teilnehmen.

Dazu schreibe ich flink eine Liste und reiche sie ein, damit ich schonmal eine Meinung einholen kann. Ein Orga-Juror schaut da rüber und teilt mir mit, dass die Liste bei der Innovationswertung nur 6 Punkte bekommt, weil es eine typische Mecheldar-Liste ist. Bei der Hintergrundsbewertung würde ich immerhin 16 Punkte bekommen, da ich nur Einheiten benutze, die typisch oder normal für Ulthwe sind. Mir ist klar, dass nach der Umrechnung dieser 6 bzw. 16 Punkte nur 2-3 bzw. 7-8 Turnierpunkte entsprechen. Wenn die Konkurrenz schwach ist, vielleicht auch etwas mehr. Ich überlege, ob ich die Liste nochmal modifizieren will oder die Innovationskategorie streiche. Da ich aber befürchte, bei der Power vs. Thema Bewertung ebenfalls nicht so gut wegzukommen, weil die Liste defintiv optimiert ist und ich mich nicht drauf verlassen will, dass das Mech-Eldar Thema mit Ulthwe Farbschema gut ankommt, entscheide ich mich dafür, die Liste umzuschreiben. Ich reiche nun eine Ulthwe-Gardisten-Fußlatscha Liste ein – ohne Avatar ;-). Ich streiche die Progamer-Kategorie, weil ich damit eh kein Massaker hinbekomme und mir bei den Softscores jeweils mindestens fünf Punkte verspreche.

Die Orga bewertet die Liste nun in voller Mannstärke. Ich bekomme bei der Innovation jeweils dreimal 16 Punkte, Fußlatscha ohne Avatar sind mittlerweile ja selten. Die anderen beiden Juroren geben nur 12 Punkte, aber da sie im Schnitt knausriger mit den Punkten sind und auch alle anderen Listen schlechter abschneiden, ist das durch die Normierung egal. Ich lande in der Rangliste auf dem 14. Platz, das entspricht 8 Punkten. Bei der Hintergrundswertung hab ich nicht so großes Glück. Da auch ganz viele andere Spieler hintergrundgetreue Armeen eingereicht haben, bekomme ich zwar viele Punkte, lande aber trotzdem nur auf dem 21. Platz. Die Konkurrenz war einfach noch etwas besser. Ich bekomme nur 7 Punkte. Davon weiß ich aber noch nichts.

Einen Monat später habe ich bei der Auslosung beim ersten Spiel etwas Pech und trete gegen eine knallharte Bossbikaliste an und kassiere naturgemäß ein Massaker. Das gibt dem Orkspieler nochmal zwei Zusatzpunkte, weil er an der Progamer-Wertung teilnimmt. Auch beim nächsten Spiel habe ich Pech. Ich trete gegen eine weitere gemaxte Liste an, die im ersten Spiel unglücklich verloren hat. Mein Rat rettet mir den Tag und ich gewinne knapp. Da ich keine Progamer-Wertung habe, ist mir das egal, Hauptsache gewonnen. Ich habe jetzt 20 Generalspunkte. Ich kann also im dritten Spiel so gut wie unmöglich gegen eine weitere gute Liste mit Progamer-Wertung antreten, denn hätte diese auch nur einen überlegenenen Sieg errungen, hätte sie ja 21 Punkte. Ich spiele stattdessen gegen eine weiche Liste und gewinne.

Es kommt noch die Mal/Style-Bewertung. Die Malwertung geht dank der Skala recht flott. Einzig bei einer Armee gibt es Probleme, weil sie nicht richtig ins Schema passt. Sie ist zwar extrem gut bemalt, aber absolut keine Einheit passt zur nächsten. Nichtmal die Bases sind gleich. Wir einigen uns auf einen Wert im unteren mittleren Bereich. Bei der Power vs. Thema Bewertung gibt es mehr Diskussionen. Aber nachdem wir unsere Bewertungen nochmal durchgegangen sind und korrigiert haben, sind wir uns zumindest sicher, dass unsere Bewertungen die richtige Relation haben.

Am Abend werden die Softscores bekannt gegeben. Das ist Gesprächsthema Nummer 1 bei der Strandparty. Einige Spieler ärgern sich, weil sie die falsche Kategorie gestrichen haben und anders besser dran gewesen wären. Die Orga muss sich einiges anhören, aber da ja der ganze Abend Zeit ist und alle Spieler direkt ne Antwort bekommen, lassen sich die meisten beruhigen. Einigen Spielern muss das mit dem Normieren erklärt werden, weil sie denken, dass bei Ihnen was falsch gerechnet wurde. Ich habe auch in den anderen beiden Softscorebereichen gut abgeschnitten und nochmal 15 Punkte erhalten. Damit liege ich mit meinen 30 Punkten bei den Softscores recht weit vorne, und kann mich hemmungslos dem Alkohol hingeben.

Das erste Spiel am nächsten Morgen ist wieder gegen eine fluffige Liste und ich gewinne trotz Kater mein drittes Spiel, wenn auch knapp. Damit habe ich jetzt 60 Generalspunkte und die werden im letzten Spiel mit den Softscores addiert. Ich habe also 90 Punkte und muss damit gegen einen der Spitzenspieler spielen. Ich trete gegen Jaq Draco an und werde von seiner fiesen fiesen Powergamer-Liste abgezockt und falle damit ins Mittelfeld zurück.
 
Zuletzt bearbeitet:
Hört sich interressant an, würde gerne mal ein Turnier damit sehen/spielen und dann weiss man mehr.
Vor allem würde ich gerne die Liste mit allen Armeebewertungen sehen. Ich dneke das es sehr viel und sehr schwer ist hier alles zu erfassen, vor allem wenn Leute z.B. ihr eigenes Weltenschiff haben und einen eigenen Hintergrund geschrieben haben. Aber poste doch mal die Gliederung der Armeen.
 
Das ganze soll übrigens nur ein offen gehaltener Vorschlag sein, so eine Art Ideensammlung. Man kann da noch sehr viel anders machen. Z.B. andere Kategorien, eine zweite Malkategorie, die nach festen Kriterien arbeitet, etc.



@ Sagatarius:

Es sollen nicht alle Armeen erfasst werden, sondern nur die, die auch im Hintergrund existieren. Das sind bei Eldar eben nur die 6 Varianten: generisch, Saim Hann, Ulthwe, Iyanden, Biel Tan und Alaitoc. Hat man ein eigenes Weltenschiff muss man die generische Liste nehmen. Es kann nur der Hintergrund bewertet werden, den es auch offiziell gibt. Ansonsten schreibt sich jeder einfach den Armeehintergrund so zusammen, den er braucht um seine Bartliste zu rechtfertigen.


Um einen Ausgleich zu schaffen, gibt es ja extra mehrere Kategorien. Wenn man sein eigenes Weltenschiff hat, das einen so extremen Hintergrund hat, dass es in der Hintergrund - Kategorie nach dem generischen Schema abgestraft wird, streicht man die Kategorie (nach dem System weiß man ja vorher, dass man aller Wahrscheinlichkeit nach abgewatscht werden wird). Wenn es dann auch bei der Power vs. Thema Kategorie abgestraft wird, dann muss man wahrscheinlich einsehen, dass die Liste zwar toll zu seinem eigenen Hinterrgund passt, aber andere Leute diesen Hintergrund nicht als besonders stimmig wahrnehmen.
 
@Vovin: auch von mir vielen dank

ich habe das ganze mehr oder minder genau gelesen (einiges sicherlich nur grob überflogen, wird aber nochmal genauer gelesen) - einige ideen hatte ich selbst in minimal anderer form schon, andere waren neu. vieles ist sicher nützlich, einiges mMn nicht umsetzbar.
z.b. die vorherige rückmeldung mit begründung ist eher schwierig. wir alle arbeiten nebenbei und das reine kontrollieren die listen, geben dann auch eine rückmeldung dass alles ok ist. ich kann mir aber sehr gut vorstellen (bzw kenne das von vielen turnieren) dass spieler sich ungerecht bewertet fühlen (mich eingeschlossen 😉) und dann das diskutieren anfangen. wenn jeder spieler eine individuelle rückmeldung bekommt warum er hier oder da nicht genug punkte bekommt, werden ~25-30% davon zurückmosern und versuchen einen zu überzeugen das die liste doch viel mehr punkte bekommen müsste.
wo ich dir aber vollkommen zustimme ist, das das ganze transparenter werden muss. für paint wird das ganze recht problemlos gehen, style ist da etwas schwieriger.
 
Den Ansatz finde ich gut, auch die Ausführung ist lobenswert. Persönlich habe ich mit der Bewertung nur ein Problem hinsichtlich der Gerechtigkeit:
1. Warum kriegt ein Spieler mit aufwendig ausgearbeitetem Hintergrund viel weniger Stylepunkte als ein Spieler, der sich unkreativ an Ultwe hält?
2. Warum gibt bei der Bemalwertung ein einheitliches Farbschema Punkte, wenn das gegen viele Codices spricht (Eldar Aspektkrieger; Chaos Dämonen und Chaos zusammengewürfelte Allianzen, die offziell die häufigeren Armeen ausmachen)?
3. Innovations-Wertung: Ein Spieler denkt sich eine innovative neue Armee aus. Mit der ist er dann sehr erfolgreich auf Turnieren, die Liste wird von den Gegnern und anderen Turnierteilnehmern imitiert, in Foren gepostet und verbreitet und etabliert sich irgendwann als eine Standardaufstellung. Macht das die Liste des Spielers jetzt weniger innovativ? Oder impliziert das, dass dieser Spieler sich jedes halbe Jahr eine neue Armee aufbauen und bemalen soll (so lange dauert der Vorgang des kopierens in etwa)?

Gut möglich, dass du diese Punkte in dem System willigend in Kauf nimmst. Klar, kein System ist perfekt. Allerdings stören mich als Spieler solche Ungereimtheiten, und ich hab dadurch etwas weniger Spaß an einem Turnier.
 
Gute Einwände.

zu 1. Das ist eine Abwägungssache. Aber sobald man eigenen Hintergrund zulässt, bedeutet das instant: selbst die bärtigste Armee wird in der Kategorie volle Punkte bekommen. Magua hatte ja mal einen Thread, der gezeigt hat, dass man im Prinzip alles irgendwie erklären kann. Und es gibt kein funktionierendes System, dass solche Bogus-Hintergründe von echten Liebhaber-Stücken unterscheiden kann.
Spieler mit einem ausgearbeiten Hintergrund, der vom üblichen abweicht, werden ja in den Kategorien Innovation und Power vs. Style belohnt. Ich denke, solche Hobbyisten müssen sich, wenn man das Gesamtsystem betrachtet, überhaupt keine Sorgen machen. Wenn man diese eine Kategorie nimmt, vielleicht, aber deshalb gibt es ja die Axt, um eine Kategorie zu killen
zu 2. mit einheitlich meine ich nicht, dass jedes Modell das gleiche Farbschema hat. Du hast recht, dass man das nochmal klarer formulieren muss. Die Armee sollte aber wie aus einem Guß wirken. Das kann man auch mit einer Eldararmee mit Aspektkriegern in Schreinfarben hinbekommen (weiß ich aus eigener Erfahrung). Ich hab auf Turnieren schon echt grausige Sachen gesehen: ein paar GD-würdige Einheiten und der Rest zusammengewürfelter Schrott. Desweiteren ist das genau der Grund, warum diese Skala nur ein Anhaltspunkt für die Jury sein soll, weil man einfach nicht jeden Einzelfall berücksichtigen kann.
zu 3. Das liegt ja nunmal in der Natur der Sache, dass Innovation etwas sehr vergängliches ist. Die Bewertung sorgt dafür, dass auch frische Ideen eingebracht werden und Spieler seltener mit kopierten Listen antreten. Wenn ich in dem einen Jahr ne Hammeridee habe und damit alles abziehe und sogar viele Innovationspunkte bekomme, weil es keiner bis dahin etablierten Turnieramree ähnelt, dann kann ich zurecht stolz auf mich sein. Wenn das dann 10 andere Spieler kopieren und nächstes Jahr mit der gleichen Liste antreten, gibt es für alle wenig Innovationspunkte. Das ist in dem Fall zwar blöd für den "Erfinder", aber es gibt keine Copyrights auf Listen. Wenn er mehrmals mit der gleichen Liste antritt, kann man das ja kaum noch innovativ nennen. Und man muss auch bedenken, wie solche Armeelisten auf den "Index" kommen. Das wird vorher von der Orga öffentlich gemacht. Wenn ein einzelner Spieler eine erfolgreiche Liste hat, dann wird das kaum ausreichen. Wenn sich da aber ein halbes Dutzend Spieler mit mehr oder weniger der gleichen Liste tummelt, dann sieht das anders aus.


Nochmal was ganz grundsätzliches, was man bei dem System begreifen muss, was ich auch erklärt habe (ich weiß, ist ein langer Text): man kann bei jeder einzelnen Kategorie Beispiele konstruieren, die ungerechterweise durchfallen oder ungewollte Nebenwirkungen ergeben. Man muss aber das Gesamtsystem sehen. Und da wird es nach meiner Erkenntnis weit schwieriger solche Extrembeispiele zu finden. In aller Regel ist es so, dass eine Armee, die in allen Stylebereichen durchfällt, auch wirklich kaum als fluffig zu bezeichnen ist.
 
Zuletzt bearbeitet:
- Ergebnisse, wie 12 Moloche, die den Stylepreis absahnen, untergraben das komplette System und vermitteln völlig zu Recht den Eindruck, dass hier ein Mechanismus am Werk ist, der im besten Fall willkürlich ist und im schlechtesten Fall Betrug. Transparenz muss her.
Hey, den Typen kenn ich so gut wie gar nicht. Wie kommt der überhaupt in "mein" Team? Ich habe lediglich seine Gedanken, die auf der AL standen, gelesen, jemanden erkannt, der die noch die heilige Zahl Khornes im HInterkopf hatte und dann fertig. Unabhängig davon habe wohl auch 3 weitere Judges, von denen nur einer diesen Spieler kannte, fast genau gleich gewertet.
Der Nachteil ist der erhöhte Aufwand. Die Vorteile sind aber weit größer. Zu jeder Kategorie kann man weit verbindlichere Angaben machen, wie bewertet wird. Es erhöht die Transparenz gewaltig. Zudem macht es auch das Bewerten an sich einfacher. Man kann auch viel besser dosieren, zu was für Armeelisten man die Spieler hinleiten will. Vor allem können sich die Speiler darauf einstellen.

Wenn man z.B. ein System hat, dass Dopplungen bestraft, werden z.B. Themenarmeen schlecht bewertet, die auf eine kleine Bandbreite an Trupps setzen. Das sollte aber nicht sein. Bei einer Teilung der Kategorie Style würden diese Listen dann in jeweils einer durchfallen, in den anderen aber glänzen.
Da gebe ich Dir 100% Recht. Solche Beschränkungssysteme finde ich persönlich sehr langweilig. Ob man nach (altem) SM-Codex nun 4 StuKas im HQ hat oder 4 in Elite kommt auf gleiche heraus. Ein Imp mit Schlagkraft brauch ( nach altem Codex) keine 2 HQs, sondern lieber 3 fette Panzer im U. Wenn ich nun mal gerne 5 lausige Vespiden, 3 Piranha und einen Pathfindertrupp haben möchte, brauche ich nun mal 3 Slots, spiele ich 120 Dark Eldar im Standard ist das nett - aber auch sehr hart.
Noch wichtiger wird diese Unterteilung bei System wie DarkProphecy, bei der Spielergruppen bewerten. Dort kann es ganz schnell passieren, dass die eine Gruppe vor allem nach Spielstärke beurteilt, die andere hingegen nach Dopplungen und eine dritte wiederum nur nach Hintergrundtreue. Das ist einer der Gründe, warum das System nicht funktioniert.
Ursprünglich sollte Jeder jeden bewerten - und dadurch auch die Kommunikation fördern.
Gebt den Spielern bei den Softscores eine Möglichkeit, eine der Kategorien aus der Wertung herauszunehmen. Das schwächt das Problem ab, dass Themenarmee oder jeweils ein anderer Armeetypus ungewollt abgestraft wird. Diese Möglichkeit kommt aber nicht nur den Stylespielern zugute,
Den Spielern VOR dem Turnier ein "Handicap" zu geben, was die Wertung angeht, finde ich eine sehr geile Idee! 50Gen-30-Paint-20 Style für den Maler, 80-10-10 für den Moscher etc...
Also nur Mut dazu, auch wenn der Necronspieler über Kategorie A motzt und der Eldarspieler über Kategorie B.
Leider motzen einige lauter als welche, die zufrieden sind. Und wer am lautesten schreit, den schenkt man Gehör.
Wenn hier mehr Konkurrenz herrscht, weckt das den Ehrgeiz hier mehr aus seiner Armeeliste herauszuholen. Softscores werden turnierfähiger.
Wenn jede "Note" nur einmal vergeben werden kann, wird das funktionieren - aber die Hinteren würden dann fluchen.
Online-Abstimmung gehen (wäre aber defintiv eine interessante Alternative – ich geh aber nicht drauf ein, da Freder das schon kategorisch ausgeschlossen hat).
Ich denke, der Aufwand des Hinterherrennens hinter den ALs ist das Problem dabei. Wenn das fair zugehen soll, muessen alle Leute ihre AL zu einem bestimmten Zeitpunkt abgegeben haben UND alle müssen richtig viele Spieler bewerten. Bei mir hat es schon bei nicht so vielen Leuten recht lange gedauert, sich alle ALs einer Fraktion anzusehen, sie miteinander zu vergleichen, nochmal zu gucken und dann abzuwägen.
Wenn ich schon so sehe, dass vielen Leuten Punkte nur durch das nicht rechtzeitige Einsenden der AL flöten gehen (und die sich dann noch beschweren), obwohl der Termin seit Monaten bekannt ist, dann bezweifle ich stark, dass es so funktioniert.
Keinen Plan, weshlab wir das nicht beibehalten haben. War wohl schon besoffen oder im Diss-Stress...

Soviel zu Teil 1. Mehr später.
 
Hey Vovin!

Ich bin begeistert und werde das System mit unserer Exterminatus-Bochum-Crew für unser zweitägiges Novemberturnier mal diskutieren.

Das Ergebnis teile ich Dir dann mit.

Etwas, das mir sofort sehr gut gefällt:
Das Ranking für die Stylepunkte (also echte Konkurrenz)

...und über "Mut zur..." musste ich dann auch lächeln. 😀
 
jeder Spieler, der das Geld bereits überwiesen hat (!!), darf vor dem Abgabetermin eine vorläufige Liste einreichen. Ein Teil der Jury bewertet die Liste grob und teilt dem Spieler die ungefähre Punktzahl und eine kurze Begründung mit. Der Spieler kann danach eine modifizierte oder neue Liste einreichen.
Dann kommen die Leute auf die Idee "bei Nichtgefallen Geld zurück...". Täusch Dich da nicht. Der Aufwand ist einfach zu groß, den eine ehrenamtliche Orga damit hat. Es wird dann wieder zu Diskussionen kommen und hin- und her geschachert und gefragt. Die Leute, die dann in einem Umfeld wohnen und ggf. die Orga kennen, bekommen dann auf Grund besserer Infos und häufigerem Nachfragens mehr Punkte und dann geht das Gemecker aus dem Süden gleich wieder los...
Es wird das Verhältnis zwischen offensichtlicher Spielstärke und erkennbarem Thema bewertet.
Das ist mit den vielen neuen Codizes und Regeln und Modell´hier-Modell-da nicht wirklich einfacher geworden.
sammelt die Orga z.B. durch einen gw-fanworld Thread alle typischen Turnierarmeevarianten und veröffentlicht die vollständige Liste vor Abgabetermin.
Auhauerha. Wer liest sich das dann alles durch? Ist ja auch nur was für die Geeks vom Dienst.
Turnierheft mit den Tabellen zu jeder Armee überladen wird
Man reiche mir das Turnierbuch. Vol. 1-4....
Ein Orga-Juror schaut da rüber und teilt mir mit, dass die Liste bei der Innovationswertung nur 6 Punkte bekommt, weil es eine typische Mecheldar-Liste ist.
Das könnte ein Knackpunkt werden. Nicht alle haben den gleichen "Geschmack". Wenn einer nur Eldar-Listen checkt, dann könnte das im externen Vergleich mit allen Listen nachher etwas hinken. Manche mögen Mecheldar, andere nicht.
Sie ist zwar extrem gut bemalt, aber absolut keine Einheit passt zur nächsten.
Ist bei Eldar (Biel Tan) möglicherweise etwas dumm als Beispiel. Deine (und auch meine) Eldar würden da wieder passen.

Fazit:
Finde ich gut bis sehr gut. Der Aufwand ist jedoch weit größer. Herzlichen Glückwunsch zum 40k-Doktor... und da wir nur 4 Leute in der Orga sind: Willkommen in der **NM 2010**-Orga!!!
 
Hier einmal das Zustandekommen der gewichteten Gruppenbewertung für die Interessierten eben etwas transparenter gestaltet:

Mal ein Beispiel: 5 Spieler werden von 3 Gruppen auf einer Skala von 0 bis 20 bewertet

Gruppe 1 bewertet Spieler 1-5: 4/6/12/12/18
Gruppe 2 ist strenger: 0/2/10/12/16
und Gruppe 3 traut sich nicht so richtig, extreme Wertungen zu vergeben: 7/8/10/10/13

nach der Normierung (und einer Rückskalierung auf 0-20 um es vergleichbar zu machen) erhält man gerundet:

Gruppe 1: 4/6/11/11/17
Gruppe 2: 4/6/11/13/16
Gruppe 3: 4/7/11/11/17


Gruppe 1: 4/6/12/12/18

arith. Mittelwert: 10.4
Stdabweichung: Sqrt(123.2)=11.1

(Ergebnisse minus Mittelwert) dividiert durch Stdabweichung:
-0.58/-0.4/0.15/0.15/0.68

Normierung: (Ergebnis oben)*10 + 10

gewichtetes Ergebnis: 4/6/11/11/17
gegenüber der Ausgangswertung: 4/6/12/12/18

Minimale Abweichung.

Interessanter ist Gruppe 2:


Gruppe 2: 0/2/10/12/16
arith. Mittelwert: 8
Stdabweichung: Sqrt(184)=13.56 (wichtige Zahl😉 )

(Ergebnisse minus Mittelwert) dividiert durch Stdabweichung:
-0.58/-0.44/0.15/0.29/0.59

renormiertes Ergebnis: 4/6/11/13/16
gegenüber der alten Werung: 0/2/10/12/16

Hier hat sich eine Menge getan - und zwar besonders im unteren Bereich, wo die harte Wertung extrem abgeschwächt wurde.



Schauen wir mal, was in zwei Extremfällen passieren würde:

Gruppe Fieß: 0/0/0/0/20 (das ist der teameigene Spieler)
arith. Mittelwert: 4
Stdabweichung: Sqrt(320)=17.89

(Ergebnisse minus Mittelwert) dividiert durch Stdabweichung:
-0.22/-0.22/-0.22/-0.22/0.89

renormiertes Ergebnis: 8/8/8/8/19
gegenüber der alten Werung: 0/0/0/0/20

Funktioniert wunderbar😉

Gruppe Lieb: 18/19/20/20/20
arith. Mittelwert: 19.4
Stdabweichung: Sqrt(3.2)=1.79

(Ergebnisse minus Mittelwert) dividiert durch Stdabweichung:
-0.78/-0.22/0.33/0.33/0.33

renormiertes Ergebnis: 2/8/13/13/13
gegenüber der alten Werung: 18/19/20/20/20

Au backe - der Arme, dessen Armee nicht ganz den Standart der anderen Armeen erreichte...



Solange die Streuung der Wertungen groß ist, werden alle Ergebnisverteilungen etwas verweicht (... gesmoothed...😉 ), wobei weder extrem gute noch extrem schlechte Punktezahlen rauskommen werden.

Wenn aber alle Armeen relativ ähnlich bewertet werden (geringe Streuung), und eine nach oben oder unten stark abweicht, wird diese Abweichung durch eure Normierung deutlich verstärkt.

Bsp: 10/10/10/10/11 wird zu
8/8/8/8/19

Hmm..... da muß man aufpassen und darauf vertrauen, das die Gruppen automatisch mit einer hohen Streuung werten. Ansonsten können sie das auch taktisch nutzen, um eine Liste nach oben zu schießen...
________________________________________________________
Meiner Meinung nach ist das System eigentlich ziemlich gut, wenn auch ziemlich aufwendig. Besonders Zeitaufwendig - die Eingabe und Auswertung von

50 Spielern -> 10 Bewertungsgruppen -> jede Gruppe wird durch 3 andere bewertet -> 30 Bewertungslisten je 5 Zahlen -> 150 Zahlen

dauert bestimmt schon einiges... dafür müßt ihr die Wertung rechtzeitig machen und dann einen, am besten 2 Leute mit Laptops schon für einige Zeit abstellen. Aber es sollte durchführbar sein.

Man sollte aber bedenken, das es bei diesem System niemand auf die vollen 20 Stylepunkte schaffen wird, während jemand, der leider ein mittelmäßiger Painter in einer Supergruppe - oder einer Gruppe mit geringer Streuung! - ist, auf jeden Fall die Arschkarte hat und nur 1-2 Punkte bekommt.


Nebenbei, Standartabweichung bei 5 Datenpunkten ist... uaaaa.... 😉 Vielleicht kann man die Normierung etwas anders anlegen.

Ihr geht bei dieser Bewertung auch implizit davon aus, dass alle Listengruppen gleichgut sind - wenn eine Gruppe 5*20 vergibt führt das zur gleichen gewichteten Wertung wie eine Gruppe, die 5*0 Punkte vergibt.
Das ist eine etwas komische Annahme.... das System ist kompliziert, aber es hat vielleicht doch noch ein paar Schwachstellen.

Vielleicht fällt uns ja noch was besseres ein - der Mittelwert der Gruppenwertung sollte nicht so eine große Bedeutung haben.

Alt:
Gruppe 1: 4/6/12/12/18
Gruppe 2: 0/2/10/12/16
Gruppe 3: 7/8/10/10/13

Gewichtet:
Gruppe 1: 4/6/11/11/17
Gruppe 2: 4/6/11/13/16
Gruppe 3: 4/7/11/11/17

Mittelwert der gewichteten Einzelwertungen:
Gruppe ges: 4/6/11/12/17

Einfach addiert und Mittelwert der Einzelwertungen gebildet: (also ohne Rechenaufwand)
Gruppe ges: 4/5/11/11/16

Ist das so viel schlechter?
 
Zuletzt bearbeitet:
Ach ja, wenn 4 der Bewertungen von jeweils 3 Gruppen gemacht werden, sind das ja knapp 600 zu digitalisierende Zahlen... man, das wird bestimmt Spaß machen! 😉

Allein dafür solltet ihr immer bei den Bewertungen zu einer Gruppe nur ein ungewichtetes Mittel der Einzelwertungen aus 3 bewertenden Gruppen nehmen - das könnte man noch im Kopf und muß dann deutlich weniger tippen.

Da bekommt der Begriff Mathhammer eine ganz neue Bedeutung😉

______________________


Insgesammt find ich die Überlegungen aber GENIAL. Und absolut lohnenswert. Und fair, da alles transparent ist und ich die Möglichkeit habe, eine der Wertungen (bei mir wär das z.B. immer die Bemalwertung, weil ich einfach unglaublich ungeschickt mit dem Pinsel bin) rauszunehmen.

Allein die Vorstellung, den Hintergrund meiner Gruppe verteidigen zu müssen, find ich klasse!
 
Ach ja, wenn 4 der Bewertungen von jeweils 3 Gruppen gemacht werden, sind das ja knapp 600 zu digitalisierende Zahlen... man, das wird bestimmt Spaß machen!
greets%20%286%29.gif
Barcode-Scanner und Wahlomat....
 
Fazit:
Finde ich gut bis sehr gut. Der Aufwand ist jedoch weit größer. Herzlichen Glückwunsch zum 40k-Doktor... und da wir nur 4 Leute in der Orga sind: Willkommen in der **NM 2010**-Orga!!!
Haha, ich wollt doch mitspielen! Obwohl das eventuell ein Geschmäckle hätte, wenn wirklich einige meiner Ideen übernommen werden sollten. Verdammt, was hab ich getan!!! Würd mich natürlich geehrt fühlen und überleg mirs, falls es ernst gemeint war.

@ Mordur
Nur zu. Wär cool, wenns ein paar neue Impulse bei den Softscores geben würde.

@ Freder:
Dann kommen die Leute auf die Idee "bei Nichtgefallen Geld zurück...". Täusch Dich da nicht. Der Aufwand ist einfach zu groß, den eine ehrenamtliche Orga damit hat. Es wird dann wieder zu Diskussionen kommen und hin- und her geschachert und gefragt. Die Leute, die dann in einem Umfeld wohnen und ggf. die Orga kennen, bekommen dann auf Grund besserer Infos und häufigerem Nachfragens mehr Punkte und dann geht das Gemecker aus dem Süden gleich wieder los...
Jap, kann gut sein, dass das zu sehr aus Spielerperspektive gedacht war.

Das ist mit den vielen neuen Codizes und Regeln und Modell´hier-Modell-da nicht wirklich einfacher geworden.
Jup. Da müsste man vielleicht nochmal drüber nachdenken. Ist ja, wie gesagt, die subjektivste Kategorie. Die Leitlinien fürs Bewerten müssten sehr klar sein.

Auhauerha. Wer liest sich das dann alles durch? Ist ja auch nur was für die Geeks vom Dienst.
Gibt aber Planungssicherheit. Ich denke, das zusammentragen wäre nicht das Problem. Das wären maximal 30-40 Armeetypen, wenn überhaupt. Und veröffentlichen würde ich das auf der Webseite und nicht im Heft. Die Regeln funktionieren ja auch ohne diese Liste. Es ist ja nur eine Orientierung für die Spieler.

Man reiche mir das Turnierbuch. Vol. 1-4....
Jap, so würds aussehen. Aber auch hier würde sich die Webseite anbieten.

Ist bei Eldar (Biel Tan) möglicherweise etwas dumm als Beispiel. Deine (und auch meine) Eldar würden da wieder passen.
HAt vip-user schon zu Recht angekreidet. Man sollte klarstellen, dass es vor allem um Stil geht. D.h. ob die Armee trotz diverser Aspekte wie ein ganzes aussieht, oder wie der Ausverkauf von cmon-Restposten.

@ Ossa:
Danke für Deinen extrem wichtigen Beitrag.

1. Es werden jeweils 9 Armeen von einer Gruppe bewertet, bzw. sogar alle Armeen von einem Juror und nicht 5. Die 5 waren nur jeweils ein Beispiel. Damit kann man annähernd davon ausgehen, dass die einzelnen Gruppen normalverteilt sind, wenn das komplette Teilnehmerfeld normalverteilt ist. Das deckt sich auch mit meinen Beobachtungen.
2. Im Turnier müssen in der Tat 600 Werte in eine excel Tabelle eingetragen werden. Das war in den letzten Jahren aber auch der Fall. Ich glaub die Orga hat schon immer mit einem Laptop gearbeitet. Ansonsten würde ich mich vor dem Rechengenie verbeugen, der das alles handschriftlich gemacht hat. Und ob Excel dann einfach nur addiert, oder ne vollkommen wilde Formel benutzt, macht im Zeitalter von 45nm-Prozessoren kein Unterschied mehr. Von daher hat sich vom Aufwand für die Orga nichts verändert, außer das bißchen Programmieren im Vorfeld des Turniers.
3. Einfach nur den Mittelwert auszurechnen, wird nicht ganz ausreichen. Erstens sollen ja 100 Spieler in eine Reihenfolge gebracht werden. Da sind die Nachkommastellen durchaus nützlich. Außerdem ist meiner Erfahrung nach nicht, dass die Bewertungsgruppen ganz unterschiedlich zusammengesetzt sind, das größere Problem, sondern dass die Juroren-Gruppen total unterschiedliche Maßstäbe anlegen.
4. Richtig manipulieren kann man bei Dark Pro nicht, weil man ja als Gruppe bewertet. Und wenn, dann konnte man bsiher vielleicht bei einer Armee 1-2 Punkte heruasfeilschen. Um das aber bei einem System mit Normierung zu erreichen, muss man schon gewaltig an den Werten drehen. Es reicht nicht, einfach ein paar Punkte mehr zu vergeben.

5. Es ist aber super, dass Du auf die Problematik mit geringer Streuung hingewiesen hast. Ich werde etwas drüber nachdenken und morgen auf Arbeit, wo ich etwas Leerlauf habe, eventuell ein paar Simulationen durchführen, wie gravierend das ist. Ansonsten tun es natürlich auch andere Verfahren, solnage sie noch erklärbar bleiben. Ein Art der Normierung wird mMn aber gebraucht, da es sonst zuviel ausmacht, ob man von 3 knausrigen Gruppen oder nur einer bewertet wird. Aber ich nehme den Einwadn ernst. Vielleicht finde ich ja noch eine elegantere Lösung. Ich werde jetzt aber nicht weiter argumentieren, weil ich beim Lernen bin. Eigentlich hatte ich mir eh vorgenommen nur auf Arbeit zu antworten und mich abends nicht vom Lernen abzulenken, aber das ist ja schonmal gründlich in die Hose gegangen :lol: