Stosować testy A/B czy testy wielowymiarowe? Na które się zdecydować?

Jed­nym z głów­nych celów mar­ke­tin­gow­ców, bada­czy, pro­jek­tan­tów oraz wła­ści­cie­li stron inter­ne­to­wych jest „prze­ko­na­nie” swo­ich użyt­kow­ni­ków do wyko­na­nia okre­ślo­nej akcji na stro­nie.

W celu zapro­jek­to­wa­nia stro­ny, któ­ra będzie sprzy­ja­ła wyko­ny­wa­niu pożą­da­nych akcji, nie­zbęd­ne jest wpro­wa­dze­nie pro­ce­su opty­ma­li­za­cji. Pozwa­la on wyło­nić naj­bar­dziej efek­tyw­ną wer­sję.

Aby tego doko­nać, z pomo­cą przy­cho­dzą nam dwa rodza­je testów:

  • Testy A/B,
  • Testy wie­lo­wy­mia­ro­we.

Na począ­tek wyja­śnie­nie czym róż­nią się oby­dwa rodza­je testów.

Testy A/B

Testy A/B pole­ga­ją na bada­niu sku­tecz­no­ści dwóch róż­nych wer­sji stro­ny (wer­sja A oraz wer­sja B). Róż­nią­cym ele­men­tem może być:

Tekst zachę­ca­ją­cy do zaku­pów:

A: „Naj­ta­niej w sie­ci”
B: „Naj­lep­sze ofer­ty”

Spo­sób przed­sta­wie­nia naj­waż­niej­sze­go call-to-action:

A: zwy­kły odno­śnik tek­sto­wy
B: przy­cisk

Zmia­na lay­outu stro­ny:

A: jed­na kolum­na
B: dwie kolum­ny

 

Ruch na bada­nej stro­nie dzie­lo­ny jest loso­wo po 50% na każ­dą z wer­sji, a następ­nie mie­rzo­na jest sku­tecz­ność każ­dej z nich, czy­li poziom osią­gnię­cia zało­żo­ne­go celu. Celem w tym wypad­ku może być wyso­ki współ­czyn­nik kon­wer­sji reje­stra­cji, zapi­su do new­slet­te­ra, czy też niski współ­czyn­nik odrzu­ceń.

Może­my oczy­wi­ście testo­wać wię­cej niż dwie wer­sje. Wów­czas bada­jąc sku­tecz­ność wer­sji A, B oraz C, ruch na stro­nie jest odpo­wied­nio dzie­lo­ny odpo­wied­nio na trzy czę­ści.

W takich testach inte­re­su­je nas ogól­ny wpływ danej wer­sji na poziom osią­gnię­te­go celu.

 

Test A/B

Testy wielowymiarowe

Testy wie­lo­wy­mia­ro­we opie­ra­ją się na tej samej zasa­dzie co testy A/B – spraw­dza­my, któ­ra bada­na wer­sja stro­ny inter­ne­to­wej jest bar­dziej sku­tecz­na.

Ten rodzaj testów jest jed­nak nie­co bar­dziej skom­pli­ko­wa­ny. Bada­niu pod­da­wa­nych jest wię­cej niż jeden ele­ment (zmien­na) pod­czas jed­ne­go testu, np.:

  • kolor przy­ci­sku (zie­lo­ny, czer­wo­ny) jako jed­na zmien­na, oraz
  • wiel­kość przy­ci­sku (więk­szy, mniej­szy) jako dru­ga zmien­na.

Test pole­ga na spraw­dze­niu sku­tecz­no­ści każ­dej moż­li­wej kom­bi­na­cji (w tym wypad­ku czte­rech) i zba­da­niu któ­ra z nich daje naj­lep­szy efekt.

Test wielowymiarowyPrzy­kład zasto­so­wa­nia

Wyobraź­my sobie stro­nę z for­mu­la­rzem reje­stra­cji. Znaj­du­ją się na nim dwa ele­men­ty (zmien­ne), któ­re chce­my pod­dać bada­niu:

Kolor przy­ci­sku (3 wer­sje):

- zie­lo­ny,
– poma­rań­czo­wy,
– fio­le­to­wy.

Tekst nad for­mu­la­rzem zachę­ca­ją­cy do reje­stra­cji (2 wer­sje):

- „Dar­mo­wa reje­stra­cja”,
– „Zare­je­struj się w 5 sekund”

 

Następ­nie roz­dzie­la­ny jest ruch na stro­nie rów­no pomię­dzy każ­dą moż­li­wą kom­bi­na­cję (6) tych dwóch zmien­nych.

Ten rodzaj testów wyma­ga posia­da­nia więk­sze­go ruchu na stro­nie, aby wyni­ki testów moż­na było uznać za zna­czą­ce. Wyni­ka to z licz­by moż­li­wych kom­bi­na­cji, jakie otrzy­mu­je­my. Im wię­cej posia­da­my kom­bi­na­cji, tym dłu­żej zaj­mu­je nam uzy­ska­nie zna­czą­cych danych z bada­nia.

Pamię­taj, że mówiąc o zna­czą­cym ruchu, nie mam na myśli tyl­ko ruchu na całej witry­nie, ale przede wszyst­kim na bada­nej stro­nie. A więc upew­nij się, że testu­jesz stro­nę, któ­ra fak­tycz­nie jest czę­sto odwie­dza­na przez użyt­kow­ni­ków.

Pod­czas uru­cho­mie­nia testu wszyst­kie warian­ty są ze sobą porów­ny­wa­ne oraz wszyst­kie zmien­ne są porów­ny­wa­ne w kon­tek­ście ich wystę­po­wa­nia z inny­mi zmien­ny­mi. W tym wypad­ku zna­cze­nie ma nie tyl­ko to, któ­ra wer­sja jest naj­bar­dziej korzyst­na, ale rów­nież któ­re ele­men­ty stro­ny odgry­wa­ją naj­więk­szą rolę w osią­gnię­ciu zamie­rzo­ne­go celu. Dzię­ki temu mamy jasny obraz, któ­re ele­men­ty są naj­bar­dziej odpo­wie­dzial­ne za okre­ślo­ne wyni­ki.

Dla powyż­sze­go przy­kła­du może się oka­zać, że kolor przy­ci­sku nie ma aż tak duże­go zna­cze­nia, nato­miast naj­więk­szy wpływ na kon­wer­sję reje­stra­cji ma tekst znaj­du­ją­cy się nad for­mu­la­rzem.

 

Co w takim razie wybrać?

Zanim roz­pocz­niesz opty­ma­li­za­cję swo­jej stro­ny, zde­cy­duj naj­pierw, któ­rą meto­dą chcesz się posłu­żyć i któ­ra będzie dla cie­bie lep­sza.

 

Zale­ty testów A/B:

  • pro­ste w pro­jek­to­wa­niu,
  • dane otrzy­mu­je­my szyb­ciej niż w przy­pad­ku testów wie­lo­wy­mia­ro­wych,
  • moż­li­wość bada­nia więk­szych, cza­sem istot­niej­szych zmian na stro­nie lub w jej tre­ści,
  • nie wyma­ga­ją posia­da­nia duże­go ruchu na stro­nie.

Zale­ty testów wie­lo­wy­mia­ro­wych:

  • dostar­cza­ją cen­nych infor­ma­cji, w któ­rą stro­nę kie­ro­wać nasze dzia­ła­nia zwią­za­ne z wpro­wa­dza­niem zmian,
  • wycią­gnię­te wnio­ski z jed­ne­go testu (w nie­któ­rych przy­pad­kach) moż­na zasto­so­wać w kon­tek­ście innych pod­stron,
  • dostar­cza­ją infor­ma­cji, któ­re zmien­ne (czy­li któ­re ele­men­ty na stro­nie) mają naj­więk­szy wpływ na zacho­wa­nia użyt­kow­ni­ków (zarów­no pozy­tyw­ny jak i nega­tyw­ny),
  • wyma­ga­ny więk­szy ruch ozna­cza dokład­niej­sze dane sta­ty­stycz­ne.

 

Przykład w podejściu między testem A/B a testem wielowymiarowym

Bada­my stro­nę, na któ­rej użyt­kow­ni­cy doko­nu­ją zaku­pu kon­ta Pre­mium roz­sze­rza­ją­ce­go moż­li­wo­ści ofe­ro­wa­nej przez nas usłu­gi.

Do obec­nej wer­sji stro­ny two­rzy­my dodat­ko­we dwie wer­sje nagłów­ka (wer­sja A – ory­gi­nał, wer­sja B, wer­sja C).  Sto­su­je­my meto­dę A/B. Po zakoń­cze­niu testu, oka­zu­je się, że wygra­ła nowa wer­sja B.

W następ­nym kro­ku (zastę­pu­jąc nowy nagłó­wek wer­sją B), bada­niu zosta­je pod­da­ny kolor przy­ci­sku (obec­ny przy­cisk zie­lo­ny oraz dodat­ko­wo wer­sja nie­bie­ska B i wer­sja poma­rań­czo­wa C). Wyni­ki testu poka­zu­ją, że wygra­ła wer­sja A, czy­li ory­gi­nal­ny przy­cisk zie­lo­ny.

Efek­tem naszych dwóch testów jest stro­na skła­da­ją­ca się z nowe­go nagłów­ka B oraz ze sta­re­go zie­lo­ne­go przy­ci­sku.

Testy A/B nie bada­ją wza­jem­ne­go oddzia­ły­wa­nia poszcze­gól­nych ele­men­tów na stro­nie. A więc nie mie­li­śmy oka­zji spraw­dzić wszyst­kich kom­bi­na­cji ele­men­tów. Moż­li­we, że naj­bar­dziej sku­tecz­ną kom­bi­na­cją oka­za­ła­by się kom­bi­na­cja: sta­ry nagłó­wek A + nowy przy­cisk C (lub jaka­kol­wiek inna).

Teraz wyobraź­my sobie, że w grę wcho­dzą jesz­cze dodat­ko­we zmien­ne takie jak tekst na przy­ci­sku (2 wer­sje), iko­na kon­ta pre­mium (4 wer­sje) oraz tło (3 wer­sje) W efek­cie daje nam to:

3 x 3 x 2 x 4 x 3 = 216  kom­bi­na­cji!

Wów­czas testy wie­lo­wy­mia­ro­we poka­zu­ją naj­lep­szą kom­bi­na­cję lub wyklu­cza­ją te, któ­re nie przy­no­szą żad­ne­go pozy­tyw­ne­go efek­tu.

 

Podsumowując

Zale­ty każ­de­go z testów dają nam wska­zów­ki, któ­ry test aktu­al­nie będzie nam potrzeb­ny i któ­ry dostar­czy nam lep­szych danych. Czę­sto przy mniej­szych witry­nach w zupeł­no­ści wystar­cza­ją testy A/B, aby dowie­dzieć się, na jaką wer­sję użyt­kow­ni­cy reagu­ją lepiej.

 

Źró­dło:

http://www.cmswire.com/cms/customer-experience/optimizing-the-web-experience-ab-testing-multivariate-testing-or-both-020835.php

http://blog.hubspot.com/blog/tabid/6307/bid/30556/The-Critical-Difference-Between-A-B-and-Multivariate-Tests.aspx

5 odpowiedzi
  1. Marta Kozłowska
    Marta Kozłowska says:

    Do tej pory korzy­sta­łam z http://unbounce.com/ (dobre do testo­wa­nia lan­ding page) – moż­li­wość wyko­rzy­sta­nia JS oraz CSS.
    Po stwo­rze­niu kil­ku wer­sji, może­my dowol­nie defi­nio­wać jaki % ruchu zosta­nie przy­dzie­lo­ny do każ­dej z nich (np. wer­sja A – 50%, B – 25%, C-25%).

    Inne dobre narzę­dzie to https://www.optimizely.com/ – moż­li­wość zmia­ny lay­outu naszej ist­nie­ją­cej stro­ny (rów­nież moż­na wyko­rzy­stać JS oraz CSS, ale nie jest to koniecz­ne)

    W obu przy­pad­kach usta­la­my cel, czy­li kon­wer­sję cze­go chce­my badać.

    Oprócz tego w dużym stop­niu korzy­sta­łam z wła­sne­go zbu­do­wa­ne­go przez zespół pro­jek­to­wy narzę­dzia.

    Odpowiedz
  2. Itzen.pl
    Itzen.pl says:

    Oso­bi­ście pro­po­nu­ję zacząć testo­wa­nie od testów A/B – łatwiej zacząć, szyb­ciej moż­na obser­wo­wać efek­ty – dzię­ki temu nie znie­chę­ci­my się trud­no­ścią w roz­po­czę­ciu testo­wa­nia. Potem stop­nio­wo moż­na zwięk­szać licz­bę kom­bi­na­cji i wyj­dą nam testy wie­lo­wy­mia­ro­we.
    Co do testów w Google Ana­ly­tics – bar­dzo dobrze dzia­ła­ją – cie­ka­we jest sto­so­wa­nie meto­dy dyna­micz­ne­go przy­dzie­la­nia ruchu dla testo­wa­nych wer­sji w zależ­no­ści od osią­ga­nych efek­tów – dzię­ki temu stro­na, któ­ra lepie kon­wer­tu­je otrzy­mu­je więk­szy ruch czy­li szyb­ciej otrzy­mu­je­my wyni­ki.

    Odpowiedz

Odpowiedz

Want to join the discussion?
Feel free to contribute!

Odpowiedz na „Marta KozłowskaAnuluj pisanie odpowiedzi

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *