Что такое сплит эксперимент и зачем оно необходимо
A/B проверка являет собой метод проверки нескольких либо дополнительных вариантов веб-страницы, дизайна, сообщения, элемента действия, поля ввода, email-сообщения, рекламного объявления а также другого веб блока. Главная цель состоит в задаче, для того чтобы понять, какая вариант результативнее функционирует при реальном использовании. Без опоры на догадок плюс оценочных мнений задействуется тест в рамках живой группы пользователей, когда первая часть видит формат A, и тестовая — вариант B.
Этот принцип дает возможность формировать выводы на базе информации, а не личных вкусов а также единичных выводов. Внутри аналитических публикациях, в том числе 1вин, регулярно подчеркивается, поскольку A/B эксперимент особо ценно там, когда малые корректировки способны воздействовать в отношении действия аудитории: переходы, оформления профилей, заполнение форм, длину изучения, удержание, покупки, оформления подписок а также прочие целевые шаги. Метод помогает проверить, действительно ли именно правка усиливает 1win эффект.
Каким образом функционирует сплит тестирование
Механизм A/B эксперимента достаточно несложен. На первом этапе выбирается объект, какой требуется протестировать. Это способен оказаться headline, цвет кнопки, последовательность секций, сообщение сообщения, логика поля ввода, изображение, стоимость, формат предложения или расположение целевого действия. После этого создаются как минимум два версии: исходный а также обновленный. Вслед за этим поток пользователей распределяется между ними по предварительно определенным правилам.
Первая группа посетителей сохраняет возможность получать старую версию, тогда как другая видит измененную. Инструмент собирает сведения про действиях каждой группы а также сравнивает показатели. Когда вариант B показывает лучший результат на фоне нужном количестве данных, его можно запускать. Если разницы не наблюдается либо обновленная страница показывает себя хуже, правка отклоняется. Именно в данной логике как раз заключается реальная ценность проверки: такой метод помогает тестировать предположения до момента окончательного 1вин внедрения.
Для чего необходимо А/Б проверка
А/Б эксперимент нужно с целью сокращения неясности. В веб платформах даже малая особенность способна влиять на понимание дизайна. Один заголовок имеет шанс быть яснее иного, краткая анкета может проходиться чаще длинной, и заметно более заметная CTA имеет шанс повысить объем нажатий. Если не использовать проверки подобные решения часто сохраняются гипотезами.
Эксперимент позволяет улучшать платформу шаг за шагом. Без необходимости масштабной реконструкции целого сайта а также приложения допустимо оценивать точечные объекты плюс фиксировать реальный результат. Такой подход снижает вероятность неудачных правок, сберегает время и средства и позволяет собирать данные касательно поведении посетителей. С течением периодом команда 1 win формирует не случайный комплект суждений, но модель проверенных подходов.
Какие элементы допустимо тестировать
Тестировать допустимо почти что любой блок, что воздействует в отношении реакции пользователя. Чаще в большинстве случаев тестируют headline-блоки, вторичные заголовки, призывы на действию, надписи CTA-элементов, поля оформления аккаунта, расположение блоков, изображения, страницы продуктов, очередность действий, фильтры, меню, визуальные блоки, сообщения, письма плюс маркетинговые креативы. Важно, чтобы отобранный блок был связан с определенной точной метрикой.
Когда задача заключается в увеличении заполненных заявок, разумно проверять форму, текст рядом с этого блока, объем полей и выразительность CTA. Если необходимо повысить длину изучения, имеет смысл проверять навигацию, модули подсказок, внутрисайтовые переходы а также построение страницы. Чем прямее связь 1win между корректировкой плюс целью, настолько ценнее эффект тестирования.
Проверяемая идея как основа теста
Любой корректный сплит проверка начинается на основе предположения. Проверяемая идея показывает, какое изменение рассматривается, из-за чего оно имеет шанс воздействовать в отношении результат плюс какой результат должен поменяться. Например, допустимо предположить, что уменьшение заявки создания профиля снизит число отказов, так как что посетителю нужно будет значительно меньше усилий с целью завершения процесса.
Хорошая проверяемая идея не может казаться чрезмерно общей. Формулировка типа «улучшить раздел удобнее» не помогает измерить результат. Намного более точный вариант: «если заменить объемный формулировку кнопки с помощью краткий плюс конкретный, число кликов повысится, так как что ожидаемый результат окажется яснее». Эта идея непосредственно 1вин указывает объект теста, основание плюс метрику.
Базовая плюс экспериментальная выборки
На уровне А/Б тестировании контрольная часть просматривает первоначальный формат, и проверочная — обновленный. Подобное деление необходимо для честного сравнения. Когда просто заменить версию затем сопоставить результаты перед и после изменения, результат способен стать неточным вследствие сезонности, рекламной нагрузки, смены потоков трафика, новостей, технических ошибок а также иных сторонних условий.
Параллельный показ разных вариантов уменьшает воздействие случайных обстоятельств. Обе группы остаются в близкой среде: тот же плюс же же период, те идентичные потоки пользователей, похожие устройства и общий фон. Поэтому расхождение по метриках с 1 win повышенной степенью вероятности соотносится именно с данным корректировкой, а не столько с посторонними внешними обстоятельствами.
Какие именно показатели используются внутри A/B проверках
Показатель — это число, согласно чему измеряется итог проверки. Выбор критерия строится от цели проверки. Ради страницы с размещенной заявкой существенны отправки форм, для торговой площадки — переносы в заказ плюс транзакции, для медиаресурса — длина изучения и период просмотра, для аппа — регистрации, запуски, возвращаемость плюс дальнейшие 1win активности.
Существенно различать основную и вспомогательные метрики. Главная показывает, ради какой цели проводится тест. Вспомогательные позволяют понять сопутствующие эффекты. В частности, изменение элемента действия имеет шанс усилить переходы, но ухудшить результативность следующих действий. Из-за этого разумно оценивать не только лишь по стартовый шаг, а также еще на последующее поведение: окончание формы, возвраты, отказы, проблемы и итоговую эффективность действия.
Статистическая достоверность
Статистическая достоверность демонстрирует, в какой степени вероятно, что наблюдаемая расхождение в паре решениями не оказывается случайной. Когда конкретный формат незначительно превосходит второй по итогам нескольких десятков единиц визитов, такой результат еще не означает преимущество. В условиях небольшом объеме сведений итог имеет шанс резко измениться, если 1вин аудитория станет шире.
С целью корректного заключения требуется значительное объем данных. Насколько ниже ожидаемая дельта среди вариантами, тем самым значительнее наблюдений потребуется накопить. Если изменение должна повысить результат всего на малое число %, тесту потребуется значительно больше длительности и трафика. Математическая достоверность помогает не делать выносить преждевременные решения по базе нестабильных изменений.
Размер выборки и длительность проверки
Размер аудитории сказывается на качество итога. Если эксперимент получает слишком ограниченный объем посетителей, результаты способны быть сомнительными. К примеру, малое число лишних кликов в одной аудитории имеют шанс казаться словно рост, но на значительном масштабе станут нормальной колебанием. Следовательно до момента запуском полезно оценивать, какое количество посетителей 1 win а также конверсий необходимо с целью подтверждения гипотезы.
Длительность проверки тоже получает важность. Слишком быстрый период проверки может не отражать отличия в паре рабочими и выходными днями, дневной по времени и поздней реакцией, отличающимися каналами посещений. Как правило эксперимент должен включать целый период действий аудитории. При этом условии чрезмерно долгий период проверки также неоптимален, если внешние факторы успевают существенно поменяться.
Зачем не стоит менять проверку в течение время работы
Распространенная из типичных ошибок — вносить корректировки в проверку после старта. Если внутри процессе эксперимента поменять сообщение, сегмент, интерфейс, условия показа или задачу, данные смешаются. В таком случае станет непросто понять, что конкретно воздействовало по части результат. Эксперимент потеряет прозрачность, и выводы окажутся ненадежными 1win.
Перед старта необходимо определить предположение, версии, метрики, разбивку пользователей и критерии окончания. После запуска желательно не нужно вмешиваться при отсутствии критичной необходимости. Если найдена неточность внутри запуске или служебный проблема, лучше закрыть тест, починить проблему а также запустить новый тест, вместо того чтобы пробовать объяснять испорченные данные.
Параллельное тестирование нескольких изменений
В отдельных случаях возникает стремление проверить за один раз ряд правок: новый заголовок, другую кнопку, укороченную заявку и обновленный расположение секций. Этот метод способен дать суммарный результат, однако не сможет объяснит, какой точно блок воздействовал по части показатель. В случае если новая вариация выиграла, будет неочевидно, что повлияло сильнее прочего.
Для корректной сравнения чаще всего корректируют один важный объект за 1вин раз. В случае если необходимо проверить несколько вариаций, задействуется мультивариантное сравнение. Такой метод труднее, предполагает значительного трафика и корректной интерпретации. Для многих целей A/B проверка на основе конкретной понятной гипотезой обеспечивает более чистый плюс практичный эффект.
Сценарии сплит проверки на уровне интерфейсе
На уровне дизайнах сплит тестирование часто задействуется с целью оптимизации ясности шагов. Например, получается сопоставить пару версии формы: длинную с большим количеством элементов ввода и короткую с минимальным сокращенным набором данных. В случае если краткая форма увеличивает объем завершенных созданий аккаунтов без одновременного ухудшения ценности форм, ее можно оценивать более эффективной.
Другой случай — проверка надписи CTA. Общая надпись имеет шанс стать не такой ясной, относительно точное название действия. Кроме того сравнивают расположение CTA-элементов, очередность смысловых секций, оформление 1 win hint-элементов, наличие индикатора прогресса, формат отображения предупреждений а также количество этапов внутри сценарии. Отдельный такой объект воздействует по части степень того, в какой степени легко выполнить заданное шаг.
A/B эксперимент внутри контенте
В материалах проверка дает возможность выяснить, какие именно headline-блоки, описания, схемы плюс форматы лучше удерживают вовлечение. Можно сравнивать отличающиеся вступления, объем контента, порядок объяснений, добавление перечней, подачу карточек, описание выгод или стиль раскрытия непростой темы. Вместе с этом сценарии существенно измерять не только исключительно нажатия, однако также дальнейшее взаимодействие.
Заголовок имеет шанс повысить количество переходов, однако в случае если контент не будет соответствует интересам, увеличится доля быстрых выходов. Поэтому контентные эксперименты нужны чтобы учитывать ценность контакта: период чтения, скролл, переходы на уровне сайта, возвращения плюс завершение заданных результатов. Хороший результат — представляет собой не лишь привлечение внимания, а совпадение запроса а также содержания.
сплит эксперимент внутри email-кампаниях
Внутри почтовых рассылках обычно сравнивают темы рассылок, название автора, стартовые строки, момент доставки, размер сообщения, место элементов действия плюс формулировки предложений. Один сегмент подписчиков видит первую вариацию письма, второй сегмент — другую. Вслед за рассылкой анализируются просмотры, переходы, unsubscribes, жалобы а также следующие события внутри сайте.
Необходимо не нужно сводить анализ метрикой open rate. Заголовок рассылки может быть заметной а также получать внимание, однако в случае если формулировка не соответствует содержанию, клики плюс лояльность могут уменьшиться. Из-за этого полезный тест рассылки измеряет цельную последовательность: открытие, клик, поведение сразу после перехода плюс отклик получателей касательно рассылку.