Stosować testy A/B czy testy wielowymiarowe? Na które się zdecydować?

Jed­nym z głów­nych celów mar­ke­tin­gow­ców, bada­czy, pro­jek­tan­tów oraz wła­ści­cie­li stron inter­ne­to­wych jest „prze­ko­na­nie” swo­ich użyt­kow­ni­ków do wyko­na­nia okre­ślo­nej akcji na stro­nie.

W celu zapro­jek­to­wa­nia stro­ny, któ­ra będzie sprzy­ja­ła wyko­ny­wa­niu pożą­da­nych akcji, nie­zbęd­ne jest wpro­wa­dze­nie pro­ce­su opty­ma­li­za­cji. Pozwa­la on wyło­nić naj­bar­dziej efek­tyw­ną wer­sję.

Aby tego doko­nać, z pomo­cą przy­cho­dzą nam dwa rodza­je testów:

  • Testy A/B,
  • Testy wie­lo­wy­mia­ro­we.

Na począ­tek wyja­śnie­nie czym róż­nią się oby­dwa rodza­je testów.

Testy A/B

Testy A/B pole­ga­ją na bada­niu sku­tecz­no­ści dwóch róż­nych wer­sji stro­ny (wer­sja A oraz wer­sja B). Róż­nią­cym ele­men­tem może być:

Tekst zachę­ca­ją­cy do zaku­pów:

A: „Naj­ta­niej w sie­ci”
B: „Naj­lep­sze ofer­ty”

Spo­sób przed­sta­wie­nia naj­waż­niej­sze­go call-to-action:

A: zwy­kły odno­śnik tek­sto­wy
B: przy­cisk

Zmia­na lay­outu stro­ny:

A: jed­na kolum­na
B: dwie kolum­ny

 

Ruch na bada­nej stro­nie dzie­lo­ny jest loso­wo po 50% na każ­dą z wer­sji, a następ­nie mie­rzo­na jest sku­tecz­ność każ­dej z nich, czy­li poziom osią­gnię­cia zało­żo­ne­go celu. Celem w tym wypad­ku może być wyso­ki współ­czyn­nik kon­wer­sji reje­stra­cji, zapi­su do new­slet­te­ra, czy też niski współ­czyn­nik odrzu­ceń.

Może­my oczy­wi­ście testo­wać wię­cej niż dwie wer­sje. Wów­czas bada­jąc sku­tecz­ność wer­sji A, B oraz C, ruch na stro­nie jest odpo­wied­nio dzie­lo­ny odpo­wied­nio na trzy czę­ści.

W takich testach inte­re­su­je nas ogól­ny wpływ danej wer­sji na poziom osią­gnię­te­go celu.

 

Test A/B

Testy wielowymiarowe

Testy wie­lo­wy­mia­ro­we opie­ra­ją się na tej samej zasa­dzie co testy A/B – spraw­dza­my, któ­ra bada­na wer­sja stro­ny inter­ne­to­wej jest bar­dziej sku­tecz­na.

Ten rodzaj testów jest jed­nak nie­co bar­dziej skom­pli­ko­wa­ny. Bada­niu pod­da­wa­nych jest wię­cej niż jeden ele­ment (zmien­na) pod­czas jed­ne­go testu, np.:

  • kolor przy­ci­sku (zie­lo­ny, czer­wo­ny) jako jed­na zmien­na, oraz
  • wiel­kość przy­ci­sku (więk­szy, mniej­szy) jako dru­ga zmien­na.

Test pole­ga na spraw­dze­niu sku­tecz­no­ści każ­dej moż­li­wej kom­bi­na­cji (w tym wypad­ku czte­rech) i zba­da­niu któ­ra z nich daje naj­lep­szy efekt.

Test wielowymiarowyPrzy­kład zasto­so­wa­nia

Wyobraź­my sobie stro­nę z for­mu­la­rzem reje­stra­cji. Znaj­du­ją się na nim dwa ele­men­ty (zmien­ne), któ­re chce­my pod­dać bada­niu:

Kolor przy­ci­sku (3 wer­sje):

- zie­lo­ny,
– poma­rań­czo­wy,
– fio­le­to­wy.

Tekst nad for­mu­la­rzem zachę­ca­ją­cy do reje­stra­cji (2 wer­sje):

- „Dar­mo­wa reje­stra­cja”,
– „Zare­je­struj się w 5 sekund”

 

Następ­nie roz­dzie­la­ny jest ruch na stro­nie rów­no pomię­dzy każ­dą moż­li­wą kom­bi­na­cję (6) tych dwóch zmien­nych.

Ten rodzaj testów wyma­ga posia­da­nia więk­sze­go ruchu na stro­nie, aby wyni­ki testów moż­na było uznać za zna­czą­ce. Wyni­ka to z licz­by moż­li­wych kom­bi­na­cji, jakie otrzy­mu­je­my. Im wię­cej posia­da­my kom­bi­na­cji, tym dłu­żej zaj­mu­je nam uzy­ska­nie zna­czą­cych danych z bada­nia.

Pamię­taj, że mówiąc o zna­czą­cym ruchu, nie mam na myśli tyl­ko ruchu na całej witry­nie, ale przede wszyst­kim na bada­nej stro­nie. A więc upew­nij się, że testu­jesz stro­nę, któ­ra fak­tycz­nie jest czę­sto odwie­dza­na przez użyt­kow­ni­ków.

Pod­czas uru­cho­mie­nia testu wszyst­kie warian­ty są ze sobą porów­ny­wa­ne oraz wszyst­kie zmien­ne są porów­ny­wa­ne w kon­tek­ście ich wystę­po­wa­nia z inny­mi zmien­ny­mi. W tym wypad­ku zna­cze­nie ma nie tyl­ko to, któ­ra wer­sja jest naj­bar­dziej korzyst­na, ale rów­nież któ­re ele­men­ty stro­ny odgry­wa­ją naj­więk­szą rolę w osią­gnię­ciu zamie­rzo­ne­go celu. Dzię­ki temu mamy jasny obraz, któ­re ele­men­ty są naj­bar­dziej odpo­wie­dzial­ne za okre­ślo­ne wyni­ki.

Dla powyż­sze­go przy­kła­du może się oka­zać, że kolor przy­ci­sku nie ma aż tak duże­go zna­cze­nia, nato­miast naj­więk­szy wpływ na kon­wer­sję reje­stra­cji ma tekst znaj­du­ją­cy się nad for­mu­la­rzem.

 

Co w takim razie wybrać?

Zanim roz­pocz­niesz opty­ma­li­za­cję swo­jej stro­ny, zde­cy­duj naj­pierw, któ­rą meto­dą chcesz się posłu­żyć i któ­ra będzie dla cie­bie lep­sza.

 

Zale­ty testów A/B:

  • pro­ste w pro­jek­to­wa­niu,
  • dane otrzy­mu­je­my szyb­ciej niż w przy­pad­ku testów wie­lo­wy­mia­ro­wych,
  • moż­li­wość bada­nia więk­szych, cza­sem istot­niej­szych zmian na stro­nie lub w jej tre­ści,
  • nie wyma­ga­ją posia­da­nia duże­go ruchu na stro­nie.

Zale­ty testów wie­lo­wy­mia­ro­wych:

  • dostar­cza­ją cen­nych infor­ma­cji, w któ­rą stro­nę kie­ro­wać nasze dzia­ła­nia zwią­za­ne z wpro­wa­dza­niem zmian,
  • wycią­gnię­te wnio­ski z jed­ne­go testu (w nie­któ­rych przy­pad­kach) moż­na zasto­so­wać w kon­tek­ście innych pod­stron,
  • dostar­cza­ją infor­ma­cji, któ­re zmien­ne (czy­li któ­re ele­men­ty na stro­nie) mają naj­więk­szy wpływ na zacho­wa­nia użyt­kow­ni­ków (zarów­no pozy­tyw­ny jak i nega­tyw­ny),
  • wyma­ga­ny więk­szy ruch ozna­cza dokład­niej­sze dane sta­ty­stycz­ne.

 

Przykład w podejściu między testem A/B a testem wielowymiarowym

Bada­my stro­nę, na któ­rej użyt­kow­ni­cy doko­nu­ją zaku­pu kon­ta Pre­mium roz­sze­rza­ją­ce­go moż­li­wo­ści ofe­ro­wa­nej przez nas usłu­gi.

Do obec­nej wer­sji stro­ny two­rzy­my dodat­ko­we dwie wer­sje nagłów­ka (wer­sja A – ory­gi­nał, wer­sja B, wer­sja C).  Sto­su­je­my meto­dę A/B. Po zakoń­cze­niu testu, oka­zu­je się, że wygra­ła nowa wer­sja B.

W następ­nym kro­ku (zastę­pu­jąc nowy nagłó­wek wer­sją B), bada­niu zosta­je pod­da­ny kolor przy­ci­sku (obec­ny przy­cisk zie­lo­ny oraz dodat­ko­wo wer­sja nie­bie­ska B i wer­sja poma­rań­czo­wa C). Wyni­ki testu poka­zu­ją, że wygra­ła wer­sja A, czy­li ory­gi­nal­ny przy­cisk zie­lo­ny.

Efek­tem naszych dwóch testów jest stro­na skła­da­ją­ca się z nowe­go nagłów­ka B oraz ze sta­re­go zie­lo­ne­go przy­ci­sku.

Testy A/B nie bada­ją wza­jem­ne­go oddzia­ły­wa­nia poszcze­gól­nych ele­men­tów na stro­nie. A więc nie mie­li­śmy oka­zji spraw­dzić wszyst­kich kom­bi­na­cji ele­men­tów. Moż­li­we, że naj­bar­dziej sku­tecz­ną kom­bi­na­cją oka­za­ła­by się kom­bi­na­cja: sta­ry nagłó­wek A + nowy przy­cisk C (lub jaka­kol­wiek inna).

Teraz wyobraź­my sobie, że w grę wcho­dzą jesz­cze dodat­ko­we zmien­ne takie jak tekst na przy­ci­sku (2 wer­sje), iko­na kon­ta pre­mium (4 wer­sje) oraz tło (3 wer­sje) W efek­cie daje nam to:

3 x 3 x 2 x 4 x 3 = 216  kom­bi­na­cji!

Wów­czas testy wie­lo­wy­mia­ro­we poka­zu­ją naj­lep­szą kom­bi­na­cję lub wyklu­cza­ją te, któ­re nie przy­no­szą żad­ne­go pozy­tyw­ne­go efek­tu.

 

Podsumowując

Zale­ty każ­de­go z testów dają nam wska­zów­ki, któ­ry test aktu­al­nie będzie nam potrzeb­ny i któ­ry dostar­czy nam lep­szych danych. Czę­sto przy mniej­szych witry­nach w zupeł­no­ści wystar­cza­ją testy A/B, aby dowie­dzieć się, na jaką wer­sję użyt­kow­ni­cy reagu­ją lepiej.

 

Źró­dło:

http://www.cmswire.com/cms/customer-experience/optimizing-the-web-experience-ab-testing-multivariate-testing-or-both-020835.php

http://blog.hubspot.com/blog/tabid/6307/bid/30556/The-Critical-Difference-Between-A-B-and-Multivariate-Tests.aspx

5 odpowiedzi
  1. Marta Kozłowska
    Marta Kozłowska says:

    Do tej pory korzy­sta­łam z http://unbounce.com/ (dobre do testo­wa­nia lan­ding page) – moż­li­wość wyko­rzy­sta­nia JS oraz CSS.
    Po stwo­rze­niu kil­ku wer­sji, może­my dowol­nie defi­nio­wać jaki % ruchu zosta­nie przy­dzie­lo­ny do każ­dej z nich (np. wer­sja A – 50%, B – 25%, C-25%).

    Inne dobre narzę­dzie to https://www.optimizely.com/ – moż­li­wość zmia­ny lay­outu naszej ist­nie­ją­cej stro­ny (rów­nież moż­na wyko­rzy­stać JS oraz CSS, ale nie jest to koniecz­ne)

    W obu przy­pad­kach usta­la­my cel, czy­li kon­wer­sję cze­go chce­my badać.

    Oprócz tego w dużym stop­niu korzy­sta­łam z wła­sne­go zbu­do­wa­ne­go przez zespół pro­jek­to­wy narzę­dzia.

    Odpowiedz
  2. Itzen.pl
    Itzen.pl says:

    Oso­bi­ście pro­po­nu­ję zacząć testo­wa­nie od testów A/B – łatwiej zacząć, szyb­ciej moż­na obser­wo­wać efek­ty – dzię­ki temu nie znie­chę­ci­my się trud­no­ścią w roz­po­czę­ciu testo­wa­nia. Potem stop­nio­wo moż­na zwięk­szać licz­bę kom­bi­na­cji i wyj­dą nam testy wie­lo­wy­mia­ro­we.
    Co do testów w Google Ana­ly­tics – bar­dzo dobrze dzia­ła­ją – cie­ka­we jest sto­so­wa­nie meto­dy dyna­micz­ne­go przy­dzie­la­nia ruchu dla testo­wa­nych wer­sji w zależ­no­ści od osią­ga­nych efek­tów – dzię­ki temu stro­na, któ­ra lepie kon­wer­tu­je otrzy­mu­je więk­szy ruch czy­li szyb­ciej otrzy­mu­je­my wyni­ki.

    Odpowiedz

Odpowiedz

Want to join the discussion?
Feel free to contribute!

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *