Данный пост — перевод восьмой статьи из курса лекций «Принципы игрового баланса» за авторством профессионала и преподавателя Яна Шрайбера. Переводы предыдущих лекций вы можете посмотреть по ссылке.
Чтение/Игры
Смотри «дополнительные материалы» в конце этой публикации.
На этой неделе
Одна из причин моей любви к игровому балансу заключается в том, что различные его аспекты связаны со всевозможными сторонами разработки игр. Когда мы рассматривали псевдослучайные числа, мы были в опасной близости к программированию. На прошлой неделе мы увидели, как визуальный дизайн уровня может быть использован в качестве поощрения игрока, давая ему ощущение продвижения, что является частью гейм-дизайна, но относится уже скорее к графике. На этой неделе мы с вами добрались до сфер, где дизайн пересекается с бизнесом.
На этой неделе я собираюсь рассмотреть две темы: статистика и количественные показатели. Для тех из вас, кто незнаком с этими понятиями, «количественные показатели» — это всего лишь измерения, то есть мы что-либо измеряем или отслеживаем в вашей игре; рейтинги игроков и рекорды по очкам – пожалуй, самые известные из количественных показателей, так как они доступны игрокам, но мы можем использовать множество других скрытых показателей, чтобы улучшить дизайн наших игр. Когда мы снимаем множество показателей, когда мы делаем множество измерений, сами по себе они ничего нам не дают, пока мы их не рассмотрим и не проанализируем с целью что-либо узнать. «Статистика» — это лишь набор инструментов, которые мы используем для получения полезной информации из количественных показателей. И хотя мы сначала собираем показатели, а потом применяем статистику для их анализа, я собираюсь обсудить сначала статистику, потому что неплохо сперва ознакомиться с инструментами, а потом уже решать, какие данные отбирать.
Статистика
Люди, которые никогда не занимались статистикой, представляют её точной наукой. Это математика, математика чёткая и ясная, следовательно, вы всегда будете находить правильные ответы. На самом же деле, всё гораздо запутаннее, и вы убедитесь сами, что гейм-дизайнеры (и статистики) спорят о базовых принципах статистики даже больше (если такое вообще возможно), чем о базовых принципах системного дизайна.
Что такое статистика, и чем она отличается от теории вероятности?
В теории вероятности, вам дан набор случайных событий и сказано в точности, насколько они случайны и какова природа этой случайности, а ваша задача – постараться предсказать, как будут выглядеть данные, когда весь этот механизм случайности будет запущен. В статистике всё, в некотором смысле, наоборот: здесь перед вами сначала предстают данные, а вы пытаетесь выяснить природу случайности, которая эти данные породила.
Вероятности и статистику объединяет одна очень важная вещь: никаких гарантий. Вероятность может вам сказать, что шанс выбросить на 1К6 определённый номер равняется 1/6. Но она не говорит вам, какие номера выпадут, если вы действительно бросите кость. Так же и статистика может из множества бросков сделать вывод, что вероятно, здесь имеет место равномерное распределение, с 95% достоверностью, но есть пятипроцентный шанс, что вы ошибаетесь. И этот шанс никогда не будет нулевым.
Статистический инструментарий
Так как мы с вами не претендуем на диплом магистра статистики, я ограничусь тем, что скажу: помимо рассматриваемых в этом курсе статистических инструментов существует ещё множество прочих. То, что здесь представлено – всего лишь минимум, который по моему мнению необходим каждому гейм-дизайнеру, и может пригодиться при анализе количественных показателей его игр.
Среднее значение:
Когда кто-то просит вас назвать «среднее» значение, то, как правило, имеется в виду среднее арифметическое (мне известны два вида средних значений, и, наверное, существуют ещё несколько, мне неизвестных). Чтобы получить среднее арифметическое из множества значений, вы складываете их, а затем делите получившееся на количество этих значений. Это что-то вроде ожидаемого значения в теории вероятности, за тем лишь исключением, что вы его рассчитываете основываясь на реально произошедших бросках, а не на теоретически сбалансированном наборе таких бросков. Расчёт среднего арифметического невероятно полезен; оно даёт вам приблизительное ожидаемое значение чего-либо в игре. Вы можете рассматривать среднее значение как вычисление ожидаемого значения методом Монте-Карло, только используете вы не компьютерную симуляцию, а реальные данные тестирований.
Срединное значение:
Это ещё один вид среднего значения. Чтобы найти его, возьмите все свои значения, расположите от самого маленького до самого большого, а затем выберите то, которое находится в середине. Например, если у вас есть пять значений, то третье будет срединным. (Если у вас чётное количество значений, то срединное будет не одно, их будет два, и вам надо будет найти среднее арифметическое этих двух – это так, вдруг вам было интересно). Само по себе срединное значение не так уж полезно, но если его сравнить со средним арифметическим, оно может много сказать вам о том, есть ли в ваших данных перекос в большую или меньшую сторону, или же они симметричны. Например, в США срединное значение дохода домохозяйства ниже среднего арифметического, а это, по сути, означает, что у нас много людей, которые зарабатывают понемногу, и есть небольшое количество людей, которые зарабатывают огромные деньги, поднимая среднее значение дохода. Если срединная оценка в классе ниже, чем средняя, это значит, что большинство ребят отстают, и есть один или два блестящих умника, которые поднимают показатели (хотя гораздо чаще бывает наоборот – большинство учеников учится на «хорошо», но всегда есть один лентяй, который получает единицы и тянет средние показателивниз). Если вы делаете нечто вроде рейтинга по очкам и замечаете, что срединное значение намного ниже среднего, это скорее всего значит, что небольшое количество ваших игроков просто неприлично хорошо играют и зарабатывают тонны очков, а все остальные – простые смертные – ближе к срединному значению.
Среднеквадратическое отклонение:
В обычной беседе такое выражение будет звучать достаточно заумно, чтобы вы показались знатоком математики. А рассчитывается оно следующим образом: вы берёте каждый из своих показателей, вычитаете его из среднего значения, возводите результат в квадрат, складываете все получившиеся значения и делите их на общее количество показателей, а потом из этой суммы извлекаете квадратный корень. По причинам, которые вам совсем не обязательно знать, в результате всех этих манипуляций вы получаете результат, который показывает разброс ваших данных. По сути, две трети ваших данных находятся в пределах одного среднеквадратического отклонения от среднего значения, и почти все данные укладываются в рамки двух среднеквадратических отклонений, так что величина вашего СО в конце концов зависит от величины вашего среднего значения. Среднее значение 50 при среднеквадратическом отклонении 25 – разброс большой, среднее значение 5 000 при среднеквадратическом отклонении 25 – разброс маленький. Относительно большое среднеквадратическое отклонение означает, что ваши данные разбросаны где попало, тогда как малое значение СО означает, что ваши данные плотно сгруппированы.
Примеры
Для примера, давайте рассмотрим две случайные переменные: 2К6, и 1К11+1. Как мы уже говорили, когда обсуждали вероятность, в обоих случаях вы будете получать числа от 2 до 12. Но природа их очень отлична: 2К6 сгруппированы ближе к центру, тогда как результаты 1К11+1 распределяются равномерно. Статистике вообще-то нечего тут добавить, но давайте предположим, что я бросил 2К6 тридцать шесть раз и получил каждое из значений по одному разу, и я бросил 1К11 одиннадцать раз и получил каждое значение по разу… Что более, чем невероятно, но это даёт нам возможность использовать статистических инструментарий для анализа вероятностей.
Среднее арифметическое для обоих случаев равно 7, следовательно, если вы пытаетесь сбалансировать какое-либо из этих чисел в игре, вы можете использовать 7 в качестве ожидаемого значения. Что же разброс? Срединное тоже равно 7 для обоих случаев, а значит, получит значение выше или ниже семи вы можете с равной вероятностью (и это логично, ведь обе кости симметричны). Между тем, вы заметите, что среднеквадратические отклонения будут сильно отличаться: для 2К6 значение СО приблизительно 2,5, а значит в большинстве случаев будет выпадать результат между 5 и 9, для 1К11+1 значение СО приблизительно 3,5 – следовательно, вы будете получать результат, лежащий между 4 и 10 примерно с той же частотой, что и результат от 5 до 9 для 2К6. И ничего тут, казалось бы, такого, пока вы не начнёте бросать кости.
Возьмём другой пример: допустим, вы рассматриваете время, за которое тестеры проходят первый уровень туториала в видеоигре, которую вы разрабатываете. Вы стремитесь к тому, чтобы на это уходило 5 минут. Вы находите среднее арифметическое, равное пяти минутам, срединное значение, равное шести минутам и среднеквадратическое отклонение, которое равно двум минутам. О чём это нам говорит? Большинство людей проходит первый уровень за время от 3 до 7 минут, что может быть как хорошо, так и плохо, в зависимости от того, насколько игрок контролирует уровень. Но в большинстве игр туториал должен быть очень стандартным, линейным игровым опытом, поэтому такой разброс кажется огромным. Ещё один повод задуматься – высокое срединное значение, которое означает, что большинству людей нужно больше пяти минут на прохождение, и лишь немногие проходят через уровень очень быстро и снижают среднее значение. С одной стороны, это хорошие новости – в том смысле, что никто не проходит уровень по 4 часа (иначе бы среднее значение было гораздо выше срединного!), но с другой стороны, они могут оказаться и плохими – в том смысле, что некоторые игроки могли случайно найти какой-то обходной путь или эксплойт, или они просто пропускают вступительный диалоги или ещё что-то делают, из-за чего могут потом в недоумении застрять на втором уровне.
И тут мы извлекаем ещё один урок: статистика сообщает нам, что что-то происходит, но она не говорит нам, почему это происходит, а иногда объяснений может быть несколько. Это как раз тот случай, где статистику часто используют неправильно, или даже просто-напросто злоупотребляют ею, когда находят одно-единственное логичное объяснение для полученных данных и игнорируют саму возможность существования других объяснений. В данном случае, мы не можем знать почему срединное значение меньше среднего и что это значит в контексте гейм-дизайна… Но мы могли бы потратить немного времени на размышления и поиски всех возможных ответов, а затем мы могли бы собрать ещё данные, которые помогли бы нам определиться, какой из них верен. Например, если вы опасаетесь, что игроки проскакивают вступительный диалог, вы могли бы дополнительно к общему измерить время, которое тратится на его прочтение. Сегодня мы ещё вернёмся к этому понятию дизайна показателей.
Здесь и третий урок: я вам не сказал, сколько тестеров я наблюдал, чтобы получить эти данные! Чем больше вы проводите тестов, тем точнее окончательный анализ. Если у вас было только три теста – тогда все попытки как-то предсказать общие тенденции при помощи этих цифр бесполезны. Если бы у вас было несколько тысяч тестов – было бы куда лучше. (Сколько тестов необходимо для того, чтобы анализ был достаточно качественным? Зависит от того, что понимать под «достаточно качественным». Чем больше тестов – тем вы можете быть увереннее, но стопроцентной уверенность у вас не будет никогда, сколько бы тестов вы ни проводили. Люди, сделавшие статистику своей профессией, оперируют понятием «доверительный интервал», в котором они дают вам диапазон значений, а потом говорят, что они уверены на 95%, будто действительное значение на самом деле будет в таких-то пределах. Во всём этом гораздо больше тонкостей, чем большинству из нас потребуется в дизайнерской работе каждый день).
Статистические выбросы
Если у вас есть группа данных с небольшим количеством всплесков или провалов – значений, которые гораздо больше или меньше среднего, — это так называемые статистические выбросы. Так как они сдвигают среднее значение далеко от срединного, если ваше среднее и срединное значение сильно отличаются, скорее всего виноваты статистические выбросы.
Когда вы проводите статистический анализ, вы можете задуматься, что делать с выбросами? Включать ли их в расчёты? Или игнорировать? Отнести ли их отдельно в особую группу? Как и с большинством других вещей – зависит от обстоятельств.
Если вы пытаетесь определить обычные модели игры, как правило, лучше не обращать на выбросы внимания, потому что они по определению – сильные отклонения от нормы. Если вы рассматриваете крайние случаи, тогда вы их не только оставляете, но и внимательно рассматриваете: например, вы пытаетесь проанализировать различные рекорды по очкам, чтобы знать, как отображать их в рейтинге, вы должны понимать, что верхние строчки в списке будут занимать как раз пиковые значения.
В любом случае, если у вас есть статистические выбросы, обычно стоит рассмотреть их подробнее, чтобы выяснить, что случилось. Возвращаясь к нашему предыдущему примеру о времени прохождения уровня, если большинство игроков проходят туториал за время от 5 до 7 минут, но вы заметили небольшое количество тестеров, которые прошли его за 1-2 минуты, это значит, что они наши какой-то обходной путь или эксплойт, и вам надо разобраться, как так вышло. Если же большинство управляется за 5-7 минут, а одному игроку понадобилось полчаса, это, по-видимому, значит, что он просто поставил игру на паузу и где-то бродил всё это время, или же ему так понравилось в этой песочнице, что он просто забавлялся и ему не было дела до продвижения – как бы то ни было, скорее всего, этим одним результатом можно пренебречь. Но если таких людей трое или четверо (всё рано в подавляющем меньшинстве), вам стоит следить за ситуаций далее, ведь может случиться, что некая малая группа людей будет сталкиваться в игре с проблемами… или это игроки, которым очень-очень понравилась какая-то вещь в туториале: такое тоже полезно узнать (пригодиться в дизайне последующих уровней).
Рабочая выборка
Вот ещё одна из причин, по которой вас ваша статистика может пойти наперекосяк: всё зависит от того, что и кого вы отобрали для работы.
Я уже упоминал одну из самых распространённых проблем – недостаточно большая выборка. Чем больше у вас данных, тем лучше. Вот вам пример: когда-то, когда я регулярно играл в Magic: TheGathering, мне довелось собирать колоду для друга – я не мог поучаствовать в турнире, зато у него получалось. Чтобы определить, подходящее ли у меня соотношение земель к заклинаниям, я перетасовал колоду, сдал первый круг и сыграл несколько ходов понарошку, чтобы увидеть, хватает ли мне всего. Я такое проделывал много раз, доходя почти до дна колоды, и в зависимости от того, было у меня слишком много или слишком мало земель, я добавлял или убирал их, перетасовывал карты и повторял процедуру. На тот момент мне казалось, что это отличный способ на глазок прикинуть, сколько мне нужно земель. Но так уж случилось, что я не заметил, что земли были очень равномерно распределены по колоде, а не собраны в группы, так что под конец мне стало казаться, что всё в порядке… я всё считал и считал. После турнира, на котором моего друга разнесли в пух и прах, он мне поведал, что ему постоянно не хватало земель, и когда мы прошлись по колоде и всё пересчитали, оказалось, что земель было всего 16 на колоду из 60 карт! Друг меня выбранил, и поделом. Проблема же заключалась в том, что я пытался анализировать количество земель статистическими методами, но размер выборки был слишком мал, чтобы дать какие-либо значимые результаты.
Вот ещё один пример: допустим, вы создаёте игру, ориентированную на рынок казуалок. Все в вашей команде разработчиков поиграли в игру, чтобы иметь какие-то базовые данные о том, как долго проходится каждый уровень и насколько он сложен. Проблема: люди, сыгравшие в игру, вероятно, не относятся к казуальным игрокам, так что они не являются репрезентативной рабочей выборкой вашей целевой аудитории. Я уверен, что когда-нибудь такое случалось.
Пример поновее: поговаривают, что в True Crime: Hong Kongиздатели из Activisionякобы потребовали, чтобы разработчики изменили пол главного персонажа с женского на мужской, так как их фокус-группа отдала предпочтение мужскому персонажу. Проблема: фокус-группа была составлена полностью из мужчин, или же вопросы были изначально так искажены теми, кто их составлял, чтобы продвинуть нужную им идею, а не выяснить истинное положение вещей. В Activision, конечно,всё это отрицают, но тема всё равно активно обсуждается во всём игровом сообществе… и дело не только в роли женщин в играх, а ещё и в использовании фокус-групп и статистики в гейм-дизайне. Такие вещи наблюдаются повсеместно, особенно в большой политике, где у множества людей есть свои личные интересы, и они готовы извратить результаты исследования и статистические методы, лишь бы доказать то, что им выгодно.
По сути, когда вы собираете данные тестирований, вам следует приложить все усилия, чтобы собрать тестеров, которые как можно ближе к вашей целевой аудитории, и вам следует провести как можно больше тестирований, чтобы отфильтровать все случайные помехи. Качество вашего анализа зависит от качества исходных данных!
И даже если вы пользуетесь статистикой «честно», всё равно существуют проблемы, с которыми сталкивается каждый дизайнер, в зависимости от разрабатываемой игры.
— Когда дело касается видеоигр, вы отданы на милость программистов, и с этим ничего нельзя поделать. Именно программисты вынуждены тратить своё время на написание кода для сбора показателей, которые вы запрашиваете. Время на программирование всегда ограничено, так что подчас вам придётся выбирать между тем, чтобы команда программистов воплощала механизм сбора данных… или воплощала собственно те игровые механики, которые вы разработали. И это при условии, что за вас не решил издатель или продюсер. В некоторых компаниях проще, в некоторых – сложнее, но так бывает, что сбор количественных показателей занимает то же место, что и аудио, локализация и тестирование – то есть задачи, которые откладываются до последнего, когда уже поздно что-то менять в лучшую сторону.
— Что до настольных игр – вы на отданы на милость тестеров. Чем больше вы соберёте данных, тем лучше, само собой. Но в действительности, видеоигра может быть выпущена в бета-версии и получить сотни и тысячи прохождений, тогда как с настольными играми, если оценивать всё реалистично, удастся сделать лишь малую толику этого при тестировании вживую. Чем меньше выборка, тем ненадёжнее данные тестирований.
— Для любой игры вам необходимо очень чётко знать заранее, что именно вы будете измерять и с какой точностью. Если вы проведёте несколько сотен тестирований, и лишь потом осознаете, что вам необходимо собрать данные об определённом состоянии игры, которые вы до этого не отслеживали, вам придётся проводить все тесты снова. Единственное, что вы можете с этим поделать – смириться с тем, что, как и сам дизайн, тестирование и сбор данных – процессы цикличные, и учитывать это при составлении графика работ.
— Кроме того, необходимо помнить, что независимо от разновидности игры очень, очень просто случайно всё спутать и получить неверный ответ – прямо как с вероятностями.В отличие от вероятности, в данной ситуации не проводится так много проверок работоспособности для того, чтобы неправильные числа выглядели неправильно, так как согласно определению вы не всегда точно знаете, что ищете или какого ответа ожидаете.Поэтому нужно действовать осторожно и использовать каждый возможный метод, чтобы провести независимую проверку полученных чисел.Также лучше представить себе заранее, какими могут быть вероятные результаты вашего анализа и что они будут из себя представлять.
Корреляция и причинность
В конечном счёте одна из наиболее распространенных ошибок, связанных со статистикой, это ситуация, когда вы замечаете своего рода корреляцию между двумя величинами.
Корреляция значит, что при увеличении одной величины, кажется, что вторая величина также увеличивается (положительная корреляция) или уменьшается (негативная корреляция).Хорошо, если вы и вправду найдёте корреляцию, но очень часто предполагают, что только потому, что две величины взаимосвязаны, одна является причиной другой, а этого нельзя утверждать исходя только из статистики.
Рассмотрим пример. Представим себе, что играя в Пуэрто-Рико, вы замечаете сильную положительную корреляцию между выигрышем и покупкой здания Фабрики, предположим, что в 95 играх из 100 победитель купил Фабрику.Естественно предположить, что Фабрика обладает суперсилой и поэтому вы выигрываете. Но без дополнительной информации такой вывод делать нельзя. Ниже приведены другие выводы, которые также будут верны, исходя из этих данных:
— Возможно всё как раз наоборот, выигрыш обусловливает покупку Фабрики. Это звучит странно, но, может быть, идея заключается в том, что Фабрика помогает игроку, который уже выигрывает, то есть не Фабрика обусловливает выигрыш, а лидерская позиция по какой-либо причине обусловливает покупку Фабрики.
— Или, возможно, что-то иное является причиной этих двух событий: выигрыша и покупки Фабрики. Может быть какая-то покупка в начале игры приводит игрока к покупке Фабрики и та же покупка в начале игры способствует выигрышу, таким образом, Фабрика — это только показатель, а не основная причина.
— Или эти два события могут быть не взаимосвязаны, а ваша выборка не достаточно большая для того, чтобы закон больших чисел вступил в действие.На самом деле мы постоянно сталкиваемся с этим явлением в массовой культуре, когда две вещи, которые очевидно не связаны между собой, всё равно считаются взаимосвязанными, например, футбольный матч команды Вашингтон Редскинз предсказывает результаты следующих выборов президента в США, или осьминог предсказывает победителя Кубка мира по футболу, или сурок, если увидит свою тень, предсказывает ещё долгую зиму.Как мы уже знаем благодаря изучению вероятности, если взять много случайных величин, то можно заметить повторяющиеся схемы; с одной стороны, это могут быть последовательности, которые не похожи между собой, но с другой стороны, если взять множество сборок данных, возможно, некоторые из них будут случайным образом взаимосвязаны.Если вы мне не верите, попробуйте бросить несколько раз две отдельные игральные кости и затем посчитать корреляцию между этими числами, могу поспорить, что она не будет равна нулю!
Статистика в Excel
Хорошие новости: хотя здесь используется большое количество математических формул, вам на самом деле не нужно их знать. Excel сделает всё за вас, она содержит все эти формулы. Ниже приведены некоторые полезные формулы:
— СРЕДНЕЕ ЗНАЧЕНИЕ (AVERAGE): считает среднее значение для выбранного диапазона ячеек. Вы также могли бы использовать СУММИРОВАТЬ (SUM) ячейки и затем разделить результат на количество ячеек, но СРЕДНЕЕ ЗНАЧЕНИЕ легче.
— СРЕДИННОЕ ЗНАЧЕНИЕ (MEDIAN): как вы уже могли догадаться, считает срединное значение для выбранного диапазона ячеек.
— СРЕДНЕКВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ (STDEV): считает среднеквадратическое отклонение для выбранного диапазона ячеек.
— КОРРЕЛЯЦИЯ (CORREL): вы указываете два диапазона ячеек, не один, и между двумя подборками данных подсчитывается корреляция.Например, вы можете создать две колонки, первую с финальными результатами игры, а вторую с результатами после первого хода, выполненного каждым из игроков, и таким образом, посмотреть влияют ли результаты в начале игры на её итог (если это так, возможно, где-то в игре есть положительная обратная связь). Коэффициентом корреляции при использовании функции CORREL в Excel может быть число от -1 (полная негативная корреляция) до 0 (не взаимосвязаны) и до +1 (полная позитивная корреляция).
Есть ли хорошие новости?
Я уже так много рассказал о том, как можно использовать статистику неправильно, что вам, наверно, уже интересно, полезна ли она для чего-нибудь. Ответ: да, полезна.Если у вас есть вопрос, на который вы не можете ответить интуитивно, и он требует математического расчёта вашей кривой затрат и прогресса, вы сможете сделать полезные выводы с помощью статистики… если зададите правильные вопросы, и если соберёте правильные данные.
Приведу пример случая, когда статистика очень пригодилась при разработке игры.Я работал в компании, которая разрабатывала онлайн игру, и мы обнаружили, что количество игроков и число сыгранных партий стали уменьшаться, потому что некоторое время мы не выпускали обновлений. (Это было ожидаемо. Я заметил, что при отсутствии обновлений, онлайн игра теряет примерно половину основных игроков приблизительно каждые 6 месяцев, по крайней мере, исходя из моего опыта.)
Но мы не ожидали следующего: как-то раз одному из наших разработчиков стало скучно, и он создал бота для проведения викторины, небольшой кусочек кода, который заходил на сервер под своим собственным игровым аккаунтом, рассылал вопрос викторины каждые пару минут, а затем анализировал чат игроков на предмет правильного ответа.
И эта викторина пользовалась популярностью, как бы глупо и просто это не было, потому что представляла собой недолгий мгновенный каузальный игровой опыт.
А теперь главный вопрос: что произошло с игроками и что произошло с самой игрой, с той игрой, в которую игроки должны были по идее играть (в которой они бы заходили в чат, чтобы найти с кем посоревноваться, перед тем как их бы отвлек бот с викториной)?
Некоторым игрокам очень нравился бот с викториной. Им было чем заняться между партиями.Другие терпеть не могли бота с викториной, они утверждали, что им было сложнее найти игроков для партии, потому что все, кто был на тот момент в игре, были слишком заняты тем, что отвечали на глупые вопросы викторины вместо того, чтобы играть в игру. Кто был прав?Интуиция в данном случае нам не помогла, потому что интуиция подсказывала всем по-разному.Также не подходил вариант прислушаться к игрокам, потому что та группа игроков, которая высказывала своё мнение, была ориентирована на одно направление, а возможности опросить тех, кто не высказывал своё мнение, не было.Также не подходила возможность использовать математический расчёт, потому что бот с викториной не был частью игры, не говоря уже о кривой затрат. Можно ли было ответить на этот вопрос с помощью статистики? Конечно, и мы так и поступили!
Это было довольно просто и не требовало детального анализа. Нужно посчитать количество всех входов в игру за день. Затем посчитать количество сыгранных партий.
Так как на нашем сервере и таксохранялся каждый вход в игру, выход и начало игры, у нас уже были эти данные, и всё, что нам нужно было сделать, это провести простой анализ, чтобы определить, как эти величины изменились с течением времени.Как и ожидалось, с момента последнего релиза все показатели постепенно уменьшались, но, вообще-то, бот с викториной способствовал заметному повышению количества входов в игру и числа партий.Оказалось, что игроки заходили в игру и играли с ботом в викторину, но пока они находились в игре, они также играли партии друг с другом!Это был вывод, к которому было бы невозможно прийти каким-то определённым способом, без анализа точных данных.И так мы выучили нечто очень важное для онлайн игр: лучше, когда онлайн много игроков, которые взаимодействуют друг с другом… даже если они взаимодействуют нестандартным способом.
Количественные показатели
Ниже приведена общая закономерность, существующая в художественных и творческих направлениях, особенно таких как археология или сохранение памятников материальной культуры, или психология, или медицина, где нужна определенная доля интуиции, но в тоже время есть “правильный ответ” или “лучший способ” что-либо сделать. Прогрессия выглядит примерно следующим образом:
- Практикующие специалисты рассматривают свою область как “гуманитарную науку”, но особо ничего не знают о лучших принципах и практиках. Со временем они поймут, как всё работает, но в основном путем проб и ошибок.
- Кто-то создаёт технологию, которая, похоже, с помощью алгоритма решит множество проблем. Практикующие специалисты радуются: «Наконец-то, мы занимаемся точной наукой! Больше никаких догадок!»Большинство молодых специалистов отказывается от “старых методов” и с радостью встречает “науку”, как способ решить все проблемы, существующие в их области. Тем временем “старая гвардия” видит в этом угрозу тому, как они работали всё это время и проявляет скептицизм.
- Когда технологию долго используют, её ограничения становятся очевидными. Практикующие специалисты понимают, что в их действиях всё равно присутствует таинственный эмоциональный элемент и что до того дня, когда техник сможет ответить на все вопросы, ещё намного дольше, чем изначально казалось.Когда люди перестают доверять своим инстинктам, многих охватывает разочарование, потому что теоретически технологии способны на большее, но люди не хотят доверять современным технологиям, потому что они ещё не настолько хорошо работают.Сторонники изменений признают, что это решение не оказалось панацеей, как они того ожидали; “старая гвардия” признаёт, что всё же в этом решении намного больше полезных моментов, чем они изначально предполагали. Все обнимаются и мирятся.
- В итоге специалисты действуют по схеме: изучают, что можно сделать с помощью компьютерных алгоритмов, а для чего необходимо креативное мышление человека, в результате область развивается, потому что объединяет в себе лучшее из двух направлений.Но изучение того, какие задачи лучше, чтобы выполнял человек, а какие компьютер, представляет собой процесс обучения, который занимает определённое количество времени.
Кажется, что на данный момент геймдизайн находится только в начале второго этапа.
Всё чаще и чаще мы слышим, как люди рассказывают, основываясь на своём опыте, почему количественные показатели и статистический анализ спасли их компанию.
Мы слышим о ММО, которые самостоятельно могут решить свои проблемы с игровым балансом — изучая модели поведения игроков — ещё до того момента, как игроки научатся использовать эти проблемы в своих интересах.Мы слышим о том, как в компании Zynga изменили цвет шрифта с красного на розовый, что способствует экспоненциальному росту количества переходов по ссылке с целью попробовать поиграть в другие игры.Появились целые компании, цель которых помочь разработчикам собрать и проанализировать количественные показатели.В индустрии растёт число приверженцев количественных показателей, и я предполагаю, что по крайней мере одна компания, которая при разработке геймдизайна будет полностью полагаться на количественные показатели, к тому времени, когда все эти идеи пересмотрят, потерпит неудачу, и очень сильную, потому что будет настолько увлечена числами, что забудет, что на самом деле в игру играют люди, которые хотят развлечься, что не подлежит непосредственному измерению. Возможно, этого и не случится. Я раньше ошибался.
Во всяком случае, кажется, что на данный момент есть три точки зрения по поводу использования количественных показателей:
— Модель компании Zynga: геймдизайн практически полностью выполняется на основе количественных показателей. Нравится вам это или нет, 60 миллионов активных игроков в месяц смеялись над вашим слабым геймдизайном, основанном на интуиции.
— Восстание против модели компании Zynga: количественные показатели легко неправильно понять, ими легко манипулировать, и поэтому они опасны и приносят больше вреда, чем пользы.Если вы измерите активность игроков и определите, что большинство игроков чаще всего пользуется экраном авторизации, чем каким-либо другим внутриигровым действием, это не значит, что в игру нужно добавить больше экранов авторизации, основываясь на предубеждении, что если игрок выполняет какое-либо действие, то это весело и интересно.Если вы разрабатываете геймдизайн при помощи количественных показателей, вы ставите себя в рамки и вынуждены создавать такие игры, которые могут быть созданы опираясь исключительно на количественные показатели, в результате вы отказываетесь от множества действительно интересных жанров видео игр.
— Умеренное использование количественных показателей: количественные показатели имеют свою область применения, они помогут определить наиболее успешные моменты в игре. С их помощью вы сможете сделать хорошую игру немного лучше, они помогут исследовать другие возможности геймдизайна.Но у интуиции также есть своя область применения, иногда нужно исследовать неизведанную территорию, чтобы определить, что относится к главным успехам игры, а это невозможно только с помощью количественных показателей, потому что иногда необходимо сделать игру немного хуже в одном аспекте, прежде тем как сделать её намного лучше в другом, а количественные показатели исключают эту возможность.
Подумайте об этом немного и решите для себя, какова ваша точка зрения, как геймдизайнера. Какая точка зрения у геймдизайнеров, с которыми вы работаете в одной команде (если вы работаете с другими геймдизайнерами в одной команде)?
Сколько измерять?
Предположим, вы хотите использовать количественные показатели в вашей игре, чтобы у вас была возможность провести статистический анализ с целью улучшения баланса в игре.Какие количественные показатели вы будете использовать, то есть, что именно будете измерять?
Я знаю, что есть две точки зрения. Согласно первой точке зрения сохранять нужно всё, что возможно, всё записывать и позже исследовать.Идея заключается в том, что лучше собрать слишком много информации и в итоге не использовать её, чем не собрать часть критически важной информации и тогда нужно будет переделывать все тесты.
Согласно второй точке зрения подход “сохраняйте всё” неплох в теории, но на практике у вас будет либо масса лишней информации, в которой нужно будет найти иголку в стоге сена чего-то полезного, либо, возможно, ещё хуже, вы исследуете множество собранных данных настолько внимательно, что найдёте всевозможные корреляции и взаимосвязи, которые на самом деле не существуют.Если вы будете следовать такой точке зрения, вам лучше заранее подумать, что нужно для следующего тестирования игры и соответственно, измерять только требуемые показатели, тогда вы не запутаетесь, если позже рассмотрите не те показатели и придёте к неправильным выводам.
И снова, подумайте, какова ваша точка зрения по данному вопросу.
Лично я полагаю, что многое зависит от того, какими ресурсами вы располагаете.Если вы и ещё несколько ваших друзей разрабатываете маленькую коммерческую игру на Flash, скорее всего, у вас нет времени интенсивно заниматься глубинным анализом данных, поэтому вам лучше заранее подумать, какая информация вам пригодится, а если позже у вас возникнет вопрос, для ответа на который вам будут необходимы какие-то данные, которые вы до этого времени не сохраняли, вы можете добавить больше количественных показателей.Если же вы работаете в большой компании с командой актуарных статистиков, которым больше нечем заняться, кроме как весь день искать корреляции данных, то, конечно, вы можете с головой уйти в корреляции данных и, вероятно, найдете, много всего интересного, о чём раньше бы и не подумали.
Какие специфические величины измерять?
Это всё хорошо, но когда мы говорим “собирайте только те данные, которые вам нужны” или “собирайте всё, что возможно”, ни одна из этих идей не является реальным дизайном. В какой-то определённый момент вам нужно будет уточнить, что именно измерять.
Как и собственно игровой дизайн, количественные показатели — это проблема второго порядка.Большая часть информации, которую вы хотите узнать о игре, не может быть измерена на прямую, поэтому нужно понять какую величину, которая тесно взаимосвязана с интересующей вас информацией, вы можете измерить.
Пример: как измерить интерес
Давайте рассмотрим пример. У вас есть однопользовательская игра на Flash и вы хотите знать интересно ли в неё играть, но интерес измерить нельзя.Что взаимосвязано с интересом, но можно измерить?Например, игроки играют в течение продолжительного времени или проходят игру и открывают все достижения или возвращаются и играют несколько партий (особенно если переигрывают даже после того, как выиграли) — все эти величины можно измерить.Помните, что это не идеальная корреляция, возможно, игроки возвращаются в игру по какой-то другой причине, например, если вы добавили в игру механику портящегося урожая, которая наказывает игроков, если они не заходят в игру или существует какая-либо иная причина.Но по крайней мере мы можем предположить, что если игрок продолжает играть, скорее всего, для этого есть хоть какая-то причина, и будет полезным это знать.Важно то, что если много игроков перестают играть в вашу игру на каком-то определённом этапе и не возвращаются в игру, это говорит о том, что должно быть этот этап неприятный и из-за этого, возможно, игроки покидают игру. (Или если этап, на котором они перестали играть, был окончанием игры, возможно, им очень понравилась игра, но они прошли её и теперь больше не играют, а вы не создали возможность для того, чтобы играть дальше, когда игра пройдена. Поэтому всё зависит от того, когда этот этап наступает.)
Модели поведения игроков очень важны, потому что такие факторы, как играют ли люди, как часто они играют и как долго играют (будем надеяться) связаны с тем, насколько им нравится игра.Что касается игр, в которые нужно заходить регулярно (например, типичная игра в Facebook), для них двумя ключевыми словами, которые мы часто слышим, являются количество активных уникальных пользователей в месяц (КАУПМ, English: MAU — Monthly Active Uniques) и количество активных уникальных пользователей в день (КАУПД, English: DAU — Daily Active Uniques).Важно, что это активные пользователи, чтобы не посчитать больше игроков, чем на самом деле есть, принимая в расчёт старые аккаунты, которыми уже не пользуются, потому что не играют в игру.Также важно, чтобы это были уникальные пользователи, потому что если есть один очень увлечённый игрой парень, который заходит в FarmVille десть раз в день, это не значит, что его можно посчитать за десять игроков.Сейчас вы, скорее всего, думаете, что количество активных уникальных пользователей в месяц и количество активных уникальных пользователей в день являются эквивалентами, и чтобы получить КАУПМ, нужно просто взять КАУПД и умножить примерно на 30, но в реальности это две разные величины, всё зависит от того, насколько быстро ваши игроки перегорят (то есть, будут ли заходить в игру одни и те же игроки изо дня в день).Поэтому если вы разделите КАУПМ на КАУПД, то получите некоторую информацию о том, сколько в вашей игре новичков и сколько постоянных игроков.
Предположим, у нас есть действительно увлекательная игра с небольшим количеством игроков, только 100 игроков, но все игроки заходят в игру по крайней мере один раз в день.В данном случае КАУПМ будет 100 и среднее КАУПД также будет 100, делим КАУПМ на КАУПД и получаем 1.Теперь предположим, что у вас есть игра, в которую люди играют только один раз, но отдел маркетинга работает хорошо и каждый день в игре появляется 100 новых игроков, но сыграв один раз, они покидают игру.В данном случае среднее КАУПД всё равно будет 100, но КАУПМ будет примерно 3000, делим КАУПМ на КАУПД и получаем примерно 30.Таким образом, результатом деления КАУПМ на КАУПД будет число от 1 (для игры, в которой каждый игрок очень лоялен) до 28, 30 или 31, в зависимости от месяца (для игры, в которую играют только один раз).
Спешу предупредить: расчёты многих количественных показателей, например, тех, которые предоставляет Facebook, могут выполняться разными способами, поэтому полученные результаты не всегда можно сравнивать.Например, на одном вебсайте я видел список лучших 100 приложений с самым низким соотношением КАУПМ к КАУПД равным 33 целых сколько-то десятых, что должно быть совершенно невозможно, поэтому очевидно, что где-то напутали с числами (может быть, для КАУПД взяли одни дни, а для КАУПМ другие или что-то в этом роде).Кроме того, иногда эти показатели выражают в процентах, отображая средний показатель; какой процент ваших игроков заходит в игру в какой-то определённый день, который должен быть равен минимум примерно 3,33% (1/30 ваших игроков за месяц заходит в игру каждый день) до 100% (все ваши игроки за месяц заходят в игру каждый день).Чтобы получить процент нужно разделить КАУПД на КАУПМ (вместо того, чтобы делить КАУПМ на КАУПД) и умножить на 100.Поэтому если на сайте с аналитикой вы увидите такие показатели, сначала убедитесь в том, что вы знаете, как они рассчитывались, чтобы в итоге не сравнивать совершенно разные вещи.
Почему важно знать эти показатели? Во-первых, если много игроков постоянно заходят в игру, скорее всего, это значит, что у вас хорошая игра.Во-вторых, это значит, что вероятность заработать деньги от этой игры выше, потому что в вашу игру играют одни и те же люди изо дня в день… это похоже на ситуацию, когда у вас есть магазин с витриной и если один раз кто-нибудь подойдет и будет разглядывать витрину, возможно, он ничего и не купит, но если кто-нибудь приходит каждый день “просто посмотреть”, скорее всего, в итоге он что-нибудь купит.
Часто используется другой вид количественных показателей, особенно популярен на порталах с играми на Flash, игрокам предлагают оценить игру (часто это система рейтинга с пятью звёздами).В теории мы ожидаем, что у игры с высокими рейтингами будет также хорошее соотношение КАУПМ к КАУПД, то есть, что эти два показателя взаимосвязаны.Я не знаю, есть ли на данный момент исследования, которые занимаются этим вопросом, хотя мне было бы интересно узнать результаты этих исследований, но если бы мне нужно было угадать, я бы предположил, что эти показатели взаимосвязаны в определённой мере, но не сильно.Игроки, проставляющие рейтинги, не являются репрезентативной выборкой, во-первых, обычно у них уже сложившееся мнение, иначе они бы не стали оценивать игру (правда, мне всегда были очень интересны опросы общественного мнения, в которых указывается, что, например, 2% респондентов сказали, что у них отсутствуют мнение по этому вопросу… скажите, кто звонит на платную линию общественного опроса, чтобы сказать, что у него отсутствуют мнение по этому вопросу?), таким образом, в то время как реальное качество, наверно, соответствует гауссовой кривой, у вас будут преобладать рейтинги с 5 звёздами и 1 звездой, а не с 3 звёздами, а это не те результаты, которых вы бы ожидали, если бы все оценили игру честно.Также возникает вопрос, что является важнее: мнение игрока или его реальная модель поведения в игре; если игрок заходит в игру каждый день несколько месяцев подряд, но оценивает её в 1 звезду из 5, что это значит?Или если игрок признаёт, что он даже не играл в игру, но всё равно оценивает её в 4 звезды из 5 основываясь… я не знаю… на её репутации или другом факторе?Также часто игроки оценивают игру не в тот момент, когда активно играют, а только (обычно) после того как доиграют, возможно, это немного искажает рейтинги (в зависимости от того, почему они перестали играть).Поэтому, наверно, лучше обращать внимание на модель поведения игрока, а не на то, как он оценил игру, особенно если эту оценку игрок поставил не во время игры и не из игры.
Я рассказал о видео играх, на самом деле большая часть из сказанного характерна для онлайн игр.Соответствующие характеристики для настольных игр менее чёткие, но по сути вам, как геймдизайнеру, нужно видеть выражение лиц и позу людей, когда они играют, чтобы понять в какой момент они увлечены игрой, а когда им скучно или они расстраиваются.Можно посмотреть, как это взаимосвязано с определенными событиями в игре или позициями на игровом поле.Конечно, вы можете попробовать основываться в своей работе на интервью с игроками, но это опасно, потому что игроки плохо запоминают подобные моменты (и даже если запоминают, не каждый игрок будет с вами абсолютно честен).Что касается видео игр, которые не требуют подключения в Интернету, вы также можете собрать количественные показатели с помощью моделей поведения игроков, но если вы куда-либо загружаете количественные показатели, вам обязательно нужно очень чётко сообщить об этом вашим игрокам соответственно правилам соблюдения конфиденциальности информации.
Еще один пример: измерим сложность
Сложность для игрока, как и интерес, практически невозможно измерить непосредственно, но что вы можете измерить, как это прогресс – или его отсутствие. Количественные показатели прогресса будут разными в зависимости от вашей игры.
В играх, в которых присутствуют задачи, для решения которых необходимы определенные навыки, например, в ретро-аркадах, вы можете измерить такие вещи: сколько времени требуется игроку для прохождения каждого уровня, сколько раз они теряют жизнь на каждом уровне, и, что еще более важно, где и как они теряют эту жизнь. После того, как вы соберете эту информацию, вы мгновенно увидите, где в вашей игре самые сложные точки, и есть ли где-либо ненамеренные пики в вашей кривой сложности? Я знаю, что Valve делает это для своих шутеров от первого лица, и что у них даже есть инструмент визуализации, который не только отображает всю эту информацию, но и показывает её прямо на карте уровня, так что создатели сразу видят, где игроки «погибают» чаще всего. Интересно то, что, начиная с Half-Life 2 Episode 2, они предоставили игрокам возможность загружать файлы и отправлять отчеты об игре в реальном времени на их серверы, и они размещают количественные показатели прямо на своем сайте (что, возможно, помогает с вышеупомянутыми вопросами приватности, потому что игроки сразу видят, что загружается и как это используется).
И еще один пример: посчитаем игровой баланс
А что, если вместо этого вы хотели бы знать, насколько ваша игра честна и сбалансирована? Это тоже не то, что можно просто так взять и измерить. Тем не менее, вы можете измерить любой показатель, касающийся любого игрока, предмета или действия в игре, и это расскажет вам многое о балансе в игре, а также об относительном балансе стратегий, предметов и всего прочего.
Предположим, что вы разрабатываете стратегию, где каждый игрок может предпринять за ход одно из четырех действий, и вы можете каким-то образом отследить положение игрока при помощи цифр. Вы можете записать каждый ход и действие, которое предпринимает игрок, и то, как это соответственно влияет на его положение в игре.
Или, допустим, это коллекционная карточная игра, где игроки создают свои собственные колоды, или файтинг, где выбираются бойцы, или стратегия в реальном времени, где нужно выбрать фракцию, или ММО, или настольная РПГ, где на выбор предоставляются раса и класс. Что вы можете отследить здесь, так это наиболее и наименее популярные выборы, а также то, какие варианты действительно помогают выиграть. Обратите внимание, что это не всегда одно и то же; иногда большая, яркая и очень круто выглядящая штука, которая всем нравится из-за броскости и легкости в использовании, легко проигрывает менее известной, но от этого не менее действенной стратегии опытного игрока. Иногда для того, чтобы доминирующие стратегии проявили себя во всей красе, требуются десятки тысяч сыгранных партий; карта Necropotence в Magic:The Gathering почти не использовалась в игре в течении приблизительно полугода после релиза, пока лучшие игроки не сообразили, как её применять – а всё потому, что у нее были очень сложные и непонятные эффекты… Но, как только люди начали с ней экспериментировать, они обнаружили, что это одна из самых сильных карт в игре. Так что и популярность, и помощь в выигрыше – полезные количественные показатели.
Если какой-то элемент в игре используется намного чаще, чем вы ожидали, это определенно сигнализирует о потенциальной проблеме в игровом балансе. Также это может означать, что по каким-то причинам этот элемент очень нравится вашей аудитории – например, в фэнтези-игре вы можете очень удивиться, обнаружив, что большинство игроков предпочитают Эльфов Людям, не обращая внимания на игровой баланс… ну, или может быть, вы не очень удивитесь. Популярность может быть знаком того, что определенный игровой элемент намного интереснее прочих, и иногда вы можете добавить его к другим классам, персонажам и т.д., чтобы сделать игру интересней в целом.
Если элемент используется меньше, чем ожидалось, это может означать, что он слишком слабый или слишком дорогой. Также это может значить, что он неинтересный, даже если эффективный. Или что его слишком сложно использовать, у него высокая кривая обучения по сравнению с остальными элементами игры, так что игроки не начинают сразу же с ним экспериментировать (что может быть опасно, если вы полагаетесь на своих тестеров, если они отложат какие-то вещи в вашей игре и не будут их тестировать).
У количественных показателей есть другие применения помимо игровых элементов. Например, один из вариантов – измерение асимметрии начала игры, типичный пример – преимущество (или наоборот) первого игрока. Соберите данные по соответствию рассадки игроков и конечных результатов. Это часто имеет место в профессиональных играх и видах спорта; например, если я не ошибаюсь, статистики вычислили, что преимущество домашнего поля в American Football составляет приблизительно 2,3 очка, и, в зависимости от того, где вы совершаете первый ход в Go, преимущество составляет от 6,5 до 7,5 очков (в данном случае половина очка используется для того, чтобы избежать результат вничью). Статистика по турнирам Settlers of Catanпоказала весьма незначительное преимущество игры вторым в партию на четырех игроков, буквально в несколько сотых процента; обычно мы бы откинули этот факт, как случайное отклонение, но количество сыгранных игр придает этим цифрам некий вес.
Один последний пример: посчитаем деньги
Если вы и в самом деле пытаетесь заработать денег, продав вашу игру – целиком или же часть ее – то, в конце концов, это и есть одна из ваших главных забот. Есть люди, для которых это самая главная забота: они бы предпочли создать игру, которая хорошо окупается, но при этом совершенно неинтересная, чем потрясающую, интересную и новую игру, которая будет «широко известна в узких кругах» (просто эвфемизм для провалившейся, но не заслуживавшей этого, игры). Другие гейм-дизайнеры предпочли бы сделать игру прежде всего интересной, так что вам нужно решить, с какой вы стороны баррикад… потому что, если вы сами не знаете, однажды кто-то решит за вас.
Так или иначе, деньги – это то, о чем создателям любой коммерческой игры стоит хоть немного беспокоиться, так что этот вопрос упускать из вида не стоит. Продажи игры в некотором смысле покажут вам, насколько хорошо вы справились с дизайном игры. Также они продемонстрируют, какое влияние оказали такие факторы, как рыночная конъюктура, успех на рынке, вирусное распространение и т.д.
Для игр, что традиционно продаются онлайн или в розницу, это довольно типичная диаграмма: большие объемы продаж в день релиза, которые постепенно уменьшаются по экспоненте, пока продажи не станут настолько маленькими, что смысла продавать игру уже не будет. Если вы разрабатываете онлайн-игру, вам не нужно волноваться о количестве экземпляров, или об объеме места, занимаемого игрой на полках, так что вы можете поработать над ней чуть дольше. Тут-то и становится ясна идея «длинного хвоста” – потому что эта кривая выглядит так, будто у нее есть маленький хвостик справа. В этом случае необходимо опасаться подводных камней, которые иногда появляются, и того, что вызвало их появление – сами по себе такие штуки обычно не происходят.
К сожалению, это означает, что показатели продаж для традиционных моделей сбыта совершенно бесполезны для гейм-дизайнеров. Мы видим единственную диаграмму, которая совмещает множество количественных показателей, и получаем ответную реакцию только после выпуска игры. Если эта игра – одна из серии, то эта диаграмма более полезна, так как дает возможность увидеть, как цифры продаж менялись от игры к игре, и как менялась игровая механика, так что, если игра резко поменялась в каком-то аспекте и продажи из-за этого радикально поднялись или упали, мы получаем пищу для размышлений.
Если же вы выпускаете онлайн-игру, например, ММО, или игру на флэш-портале, или на Фейсбуке, схема может немного отличаться: объем продаж сначала невысок (высок, если вы предварительно поработали над маркетингом), затем, если игра хорошая, он увеличивается по мере работы сарафанного радио, так что, по сути, это та же диаграмма, но немного растянутая по времени. Отличная новость по поводу такого вида релиза: вы можете управлять диаграммой продаж в реальном времени. Внесите изменения в игру сегодня, отмечайте изменения в продажах до конца недели, и продолжайте модифицировать игру по ходу действия. Поскольку у вас пошаговые дополнения, которые как-то влияют на продажи, вы получаете постоянный отклик на малейшие изменения, который выражается в количестве денег, приносимых вашей игрой. Тем не менее, следует помнить, что ваша игра существует не в вакууме: зачастую есть множество внешних факторов, которые могут повлиять на продажи. К примеру, бьюсь об заклад, что, если произошло какое-то крупное стихийное бедствие, о котором трубят газеты по всему миру, у большинства игр на Фейсбуке упадет посещаемость, так как люди будут читать новости. Так что, если игровая компания внесла небольшое изменение в игру накануне разлива нефти в Мексиканском заливе и заметила внезапный спад активности в той области, создатели, если они не следят за реальным миром, могут ошибочно решить, что изменение было плохим.
В идеале вам нужно бы устранить эти факторы, чтобы вы знали, что именно измеряете, контролируя внешние факторы. Один из способов сделать это (который работает не всегда): одновременно предоставить две версии игры разным игрокам, и затем сравнить две группы. Важно, чтобы вы выбирали игроков случайно (и не давали, к примеру, одну версию владельцам давно зарегистрированных аккаунтов, а другую – новым игрокам). Разумеется, если в двух группах сам игровой процесс будет различаться, это неизбежно вызовет гнев некоторых игроков, особенно, если одной из групп достанется несбалансированная версия, которую нужно будет доработать. Так что такое лучше делать с вещами, которые на баланс не повлияют: к примеру, рекламными баннерами, текстами всплывающих информационных диалогов, заставками, цветами или внешним видом иллюстраций в игре, и тому подобными штуками. Или, если уж менять игровой процесс, то так, чтобы это было понятно и очевидно для игроков: например, присоединить случайным образом игрока к какой-либо фракции (как в World of Warcraft при регистрации игрок выбирает сторону – Альянс или Орду, только тут это будет происходить случайно), и заставить их воевать между собой, вплетя этот факт в предысторию игрового мира, так что будет абсолютно естественно, если у двух сторон версии игры будут в чем-то различаться. Не могу привести примеров игр, в которых создатели действительно провернули этот трюк, но было бы интересно на это посмотреть.
В играх, где игроки могут либо играть бесплатно, либо платить – а это включает в себя условно-бесплатное программное обеспечение, микро-транзакции и большинство других видов моделей платежей для онлайн-игр – вы можете следить не только за количеством пользователей в вашей игре, или за тем, сколько в целом вы зарабатываете денег, но также и за тем, откуда эти деньги приходят, основываясь на данных по каждому пользователю. Это очень значительный фактор, но существует множество тонкостей, которые тоже необходимо учитывать.
Во-первых, что такое «игрок»? Если у некоторых пользователей несколько аккаунтов (с вашего разрешения или нет), или если в системе есть старые, «спящие» (неиспользуемые) аккаунты, то, будете ли вы считать их игроками или нет, повлияет на все ваши расчеты. Обычно компании заинтересованы в том, чтобы считать доходы от уникальных активных пользователей, потому как владельцы «спящих» аккаунтов деньги обычно не тратят, а одного пользователя с несколькими аккаунтами нужно считать одним игроком, даже если он вкладывает средства в каждый из своих аккаунтов.
Во-вторых, есть разница между теми игроками, которые играют в вашу игру бесплатно и вообще не собираются ни за что платить, и между теми, кто регулярно тратит деньги в игре. Представьте себе игру, на которой вы зарабатываете очень много денег притом, что платят за нее очень немного людей. Это значит, что вы создали действительно отличную игру, которая хорошо привлекает и удерживает бесплатных игроков и, что, как только пользователей удается убедить тратить деньги, они тратят их, и много. Но одновременно это значит, что у вас проблемы с «заманиванием» — вам сложно заставить игроков заплатить в первый раз. Значит, вам нужно подумать о стимуле, который побудит пользователей заплатить немного (для начала). А теперь представьте другую игру, где большинство игроков платят, но платят немного. Это уже другая проблема, суть которой заключается в том, что ваша платежная система отпугивает игроков, или что вы, как минимум, недостаточно стимулируете их тратить больше денег – вы будто бы достигаете определенного потолка платежей в какой-то точке. Возможно, в итоге вы получаете равное количество денег в обоих случаях, но решать эти задачи нужно по-разному.
Обычно разница между ними обозначается двумя аббревиатурами, которые сейчас у всех на слуху: ARPU (средняя выручка на одного пользователя) и ARPPU (средний доход с одного платящего пользователя). Как по мне, лучше бы их называли игроками, а не пользователями, но не я эти термины придумал.Как бы то ни было, в первом случае, когда меньшинство платит, когда большинство играет бесплатно, ARPPU будет очень высоким, а во втором – очень низким, даже если ARPU одинаково для обоих игр.
Разумеется, общее число игроков тоже необходимо принимать в расчет, а не только считать его средним показателем. Если ваши показатели ARPU и ARPPU очень высоки, но ваша база игроков составляет всего лишь несколько тысяч, хотя должно быть несколько миллионов, тогда, возможно, это проблема маркетинга, а не гейм-дизайна. Это зависит от того, что происходит с вашей базой с течением времени, и от того, где вы находитесь в этом «хвосте» кривой продаж. Так что эти три вещи – продажи, ARPU и ARPPU – могут дать вам необходимую информацию о том, в чем заключается проблема: в представлении игры (то есть предложении попробовать поиграть в нее), заманивании (в том, чтобы заставить заплатить за нее в первый раз) или в удержании (в том, чтобы заставить игроков снова и снова возвращаться к игре). И, когда вы преодолеете эти проблемы внесенными в игру изменениями и дополнениями, вы неоднократно сможете провести параллели между определенными изменениями в механике игры и возросшими продажами.
Еще стоит обратить внимание на график взаимозависимости времени и денег для среднего пользователя. Сколько люди платят вам в тот день, когда только заводят аккаунт? А что насчет следующего дня, и следующего за ним? Видите – сначала денег очень много, а потом пользователи платят все меньше? Вы видите нисходящую кривую, когда пользователи сначала играют бесплатно, потом платят в первый раз – и много, а потом платят все меньше и меньше, пока не начинают снова играть бесплатно? Или восходящую, когда игроки платят немного, потом – чуть больше, и больше, и тут – бам! – и они вообще перестают играть? Регулярные маленькие выплаты или традиционные модели с «длинным хвостом»? Что это говорит вам о том, насколько вы вознаграждаете постепенный прогресс игроков?
Просматривая информацию о своих доходах, не забудьте о такой статье, как «расходы». Есть две статьи расходов: предоплата за разработку и текущие траты. Первые – это разработки новых функций игры, в число которых входят как «удачные» (т.е. те, которые повышают доход), так и «неудачные», которые вы пробуете применить и затем отказываетесь от них. Вам необходимо помнить, что соотношение удачных-неудачных функций не будет равным, так что вам придется принять некую часть неудачных идей как часть расходов на разработку удачных (это разновидность так называемых «невозвратных издержек», о которых мы говорили на 6 неделе, когда говорили о ситуационном балансе). Текущие расходы – это, например, стоимость трафика, серверов и службы поддержки, и эти расходы имеют обыкновение расти с увеличением числа игроков. Поскольку обычно цель любого бизнеса – это увеличить свою прибыль (то есть заработанные деньги без учета потраченных), а не доходы (то есть просто полученные деньги), вы точно захотите учесть все вышеперечисленное, если вы пытаетесь оптимизировать свои ресурсы разработки.
Небольшое предостережение (ох, кажется, я много таких предостережений раздаю на этой неделе): статистика хороша для анализа прошедших событий, но, если вы пытаетесь предсказать с её помощью будущее, всё намного сложнее. К примеру, у только что выпущенной и очень популярной игры может быть кривая, которая выглядит как поднимающаяся по экспоненте. Так и тянет предположить, особенно, если условия очень подходят под экспоненциальную функцию, что так будет продолжаться и дальше. Но здравый смысл подсказывает, что так вечно продолжаться не может: людей на Земле ограниченное количество, так что, если ваша кривая экспоненциально растет быстрее, чем увеличивается прирост населения, рано или поздно показатели упадут. Кривые роста в деловой сфере обычно не экспоненциальны, они представляют собой так называемые «S-образные» кривые: начинаются они как экспоненциально поднимающиеся кривые, и постепенно переходят в логарифмически (т.е. медленно) поднимающиеся кривые, которые со временем начинают опускаться или выравниваться. Многие инвесторы совершают грубую ошибку, путая S-образную кривую с экспоненциально поднимающейся, пример (более или менее) мы могли наблюдать лет десять назад – пузырь доткомов. Незаконные схемы-пирамиды зачастую тоже проходят через такую кривую, с тем лишь исключением, что, достигая высшей точки “S”, они обычно рушатся.
Немного о морали
И вот уже второй раз этим летом, говоря об игровом балансе, я поднимаю вопрос профессиональной этики. Странно, когда мы упоминаем о ней в беседах о прикладной математике, не так ли? Тем не менее…
Моральная часть вопроса в том, что многие из этих показателей обращают внимание лишь на поведение пользователей, но игнорируют переменную, добавленную (или убранную) из их жизней. Создатели некоторых игр, особенно на Facebook, которые наиболее эффективно стали применять количественные показатели, также обвиняются (некоторыми людьми) в том, что, используя известные изъяны человеческой психологии, они грубо манипулируют игроками, заставляя их играть против своей воли и платить реальные деньги. Конечно, это утверждение звучит абсурдно, если доводить его до крайности, потому что игры считаются чем-то по существу добровольным, так что сама идея игры, «держащей нас в качестве заложников», кажется странной. С другой стороны, в любую игру, в которую вы играли достаточно продолжительное время, вы эмоционально вкладывались, и у этих эмоций есть денежный эквивалент. Если вам кажется глупым мое утверждение о том, что игра «заставляет» вас тратить деньги, подумайте вот о чем: предположим, все ваши сохраненные игры я поместил в одну папку. Может быть, они у вас были на консольных картах памяти или жестких дисках. Некоторые могут быть на жестких дисках ПК. Если это онлайн-игры, вы их «сохраняли» где-то на серверах компаний-производителей. А затем предположите, что я угрожаю уничтожить все эти игры… но не волнуйтесь, я всего лишь заменю аппаратное обеспечение. Таким образом, вы получите бесплатную замену вашим жестким дискам, и картам памяти, и чистые аккаунты всех онлайн-игр, на которые вы подписаны, и так далее. И, предположим, что я спросил бы вас, сколько бы вы мне заплатили, чтобы я этого не делал. Бьюсь об заклад, если бы вы об этом подумали, то поняли бы, что точно заплатите, а причина кроется в том, что эти игры вам дороги! Вернемся к сути проблемы: если бы одна из этих игр угрожала удалить все ваши сохранения, если вы не купите и не скачаете какой-нибудь загружаемый контент, вы бы как минимум задумались о покупке… и не потому, что вам нужен этот контент, а потому, что не хотите терять свои сохранения.
Честно говоря, все игры так или иначе манипулируют игроками, точно так же, как книги, фильмы и другие средства массовой информации, чтобы мы хотя бы ненадолго им поверили (существует даже особый термин – «сценическая вера» / «suspension of disbelief»). У большинства людей проблемы с этим не возникает: они воспринимают опыт, полученный в играх, как дополнение к своей жизни; игры позволяют им прожить отдельную маленькую жизнь, в отличие от других занятий, на которые они могли потратить время.
Но, точно так же, как и кривые сложности, разница между добавленной и убранной переменными непостоянна, она различается у всех людей. Именно поэтому существуют такие вещи, как MMO, которые дарят миллионам игроков еще одну жизнь, но, с другой стороны, разрушают жизни меньшинства: люди теряют семью и брак в погоне за очередным уровнем, а некоторые играют так увлеченно, что игнорируют базовые потребности организма и в один прекрасный момент просто падают на клавиатуру и умирают.
Вопрос следующий: насколько далеко мы можем зайти в стремлении получить прибыль от пользователей, или, как минимум, заставить их играть, прежде чем перейдем моральные границы… особенно, когда вся разработка игры держится на количественных показателях денег от игроков. И я снова прошу вас подумать о том, на чьей вы стороне, потому что, если вы не знаете – однажды это решение примет тот, кто знает.
Если вы сейчас работаете над игрой…
Как вы могли догадаться, я попрошу вас – неважно, какую игру вы сейчас разрабатываете – спросить себя, какие на вопросы гейм-дизайна можно ответить, используя количественные показатели:
— На какие вопросы гейм-дизайна (особенно те, которые имеют отношение к гейм-балансу) у вас нет ответа в данный момент? Составьте список.
— На какие из этих вопросов можно ответить в процессе тестирования, сбора количественных показателей и их анализа?
— Из оставшегося списка выберите один вопрос, который, по-вашему, наиболее важен для игрового процесса. Подумайте, какие показатели вы хотите применить, и как именно вы будете использовать статистику, делая выводы. Что именно вы можете увидеть? Что будет означать увиденное? Заранее позаботьтесь о том, чтобы вы знали, как интерпретировать полученные данные.
— Если вы создаете видеоигру, удостоверьтесь, что она так или иначе сохраняет нужную вам информацию. Если же это настольная игра, проведите тестирование игрой и начинайте измерять!
Домашнее задание
Оно скорее будет информацией для размышления, нежели практическим экспериментом, потому что я не смог придумать ни единого способа заставить вас собирать количественные показатели по игре, которая даже не ваша.
Выберите любимый игровой жанр. Это может быть шутер от первого лица, стратегия в реальном времени, коллекционная карточная игра, настольная РПГ, еврогейм или любая другая. Затем выберите образец жанра, который вы считаете классическим, с которым вы хорошо знакомы, и, желательно, который у вас есть.
Представьте себе, что вы получили права на ремейк (не сиквел) этой игры и практически не собираетесь менять ключевую механику игры – только внести небольшие изменения ради игрового баланса. Думайте об этом, как о версии «2.0» оригинала. Возможно, в каких-то аспектах вы как дизайнер уже чувствуете, что игра несбалансирована… но давайте предположим, что вы просто хотите это доказать.
Составьте план количественных показателей. Предположите, что у вас есть команда тестеров, или другие существующие данные по игре с изначального релиза, так что всего лишь нужно попросить эти данные и потом проанализировать их. Составьте список:
— На какие вопросы по игровому балансу, на которые можно ответить с помощью статистического анализа, вам нужны ответы?
— Какие количественные показатели вы бы использовали для каждого вопроса? Ничего страшного, если кое-где они совпадут, если вы будете использовать одни и те же показатели для нескольких вопросов.
— Какой анализ вы бы провели на ваших показателях, чтобы получить ответы на свои вопросы? Иными словами, что бы вы сделали с данными (взяли бы средние и срединныезначения и среднеквадратические отклонения или искали бы корреляции)? Если вы задаете «да-нет» вопросы, как бы выглядели ваши ответы «да» и «нет» после анализа данных?
Дополнительные Ресурсы
Если вам было мало чтения на этой неделе, вот несколько ссылок. Большую часть статьи я написал под впечатлением от этого:
http://chrishecker.com/Achievements_Considered_Harmful%3F
и этого:
http://chrishecker.com/Metrics_Fetishism
В этом году на GDC гейм-дизайнер Крис Хекер произнес отличную речь под названием «Достижения признаны вредоносными», в которой говорил о различных видах количественных показателей – к примеру, о Достижениях, которые мы используем для оценки и вознаграждения деятельности игрока в игре, — и о том, почему это может или не может быть не такой уж хорошей идеей. Во второй статье идет речь о том, что Крис называет «фетишем на количественные показатели», и о том, почему не стоит полностью полагаться только на КП, а не на здравый смысл.
Это статья на Gamasutra, которая цитирует выступлениедиректора студии Playfish Джеферсона Валадареса на GDC Europe. В этом выступлении он предлагает разделять ситуации, для выхода из которых необходимо использовать количественные показатели, и те, для которых нужны непосредственно навыки гейм-дизайнера.
http://www.lostgarden.com/2009/08/flash-love-letter-2009-part-2.html
Гейм-дизайнер Дэн Кук пишет многих преимуществах количественных метрик при разработке Flash-игр.
http://www.gamasutra.com/features/20070124/sigman_01.shtml
Эта статья написана тем же парнем, который написал «Волосы в носу орка», на этот раз он дает краткое руководство для начинающих по вопросу использования количественных показателей, а не вероятности.
19/10/2015 в 17:18
Не знаю, как сообщить об ошибке, но: «срединное значение на так уж полезно».
20/10/2015 в 09:59
Большое спасибо. Поправил.