Przewidywanie oglądalności telewizyjnych kampanii reklamowych Co obejrzą miliony? Przewidywanie oglądalności telewizyjnych kampanii reklamowych
Agenda Specyfika prognozy w oparciu o dane telemetryczne Parę słów o przeszłości Diagnoza potrzeb i oczekiwań Model predykcyjny Wyniki weryfikacji modelu: Globalnie Dla kampanii reklamowych
Prognozowanie na podstawie TAM Prognozy „twarde”: Prognozujemy realne stany i procesy np. wielkość sprzedaży, produkcji, zmiany wskaźników ekonomicznych Prognozy „miękkie”: Wnioskujemy o populacji na podstawie zmierzonych stanów próbki np. preferencje wyborcze, deklaracje przyszłej konsumpcji W celu przedstawienia specyfiki prognozowania w oparciu o dane telemetryczne na potrzeby tej prezentacji podzieliliśmy prognozy na twarde i miękkie w kontekście charakteru danych na podstawie których powstaje prognoza oraz możliwości jej weryfikacji. Dwa typu prognoz różnicuje dostępność, dokładność i zakres danych wykorzystywanych do stworzenia prognozy oraz ją weryfikujących. Dane o sprzedaży dotyczą nazwijmy to całej populacji a propos, której badacz formułował prognozę Badacz odwołuje się do twardych, realnych danych charakteryzujących zjawisko i w oparciu o te same twarde dane weryfikuje jakość prognozy W przypadku miękkiego podejścia wnioskujemy per analogiam o właściwościach populacji. Choć w przypadku prognoz wyników wyborczych mamy do czynienia z twardą weryfikacją w czasie wyborów W przypadku prognozowania na podstawie danych telemetrycznych możemy mówić o pewnej wypadkowej „miękkiego” i „twardego” prognozowania. Z jednej strony wnioskujemy o populacji na podstawie próbki a z drugiej weryfikujemy jakość prognozy o twarde dane dotyczące próbki. W przypadku prognozowania w oparciu o TAM można mówić o podwójnym zapośredniczeniu: prognozujemy wyniki badania a nie weryfikowalne w sposób twardy stany i procesy rzeczywistości zakładamy, że prognoza wyników badania przy zachowaniu jego reprezentatywności jest tożsama z prognozą rzeczywistości Prognozujemy zachowanie 4 000 reprezentatywnych dla populacji uczestników badania telemetrycznego
Przeszłość Dwa nurty bazujące na danych: O zachowaniach widowni w przeszłości z uwzględnieniem jej charakterystyk demograficznych tzw. Social-Based Techniques Określających podobieństwo atrybutów programów tzw. Content-Based Techniques Próbowano rozwiązać problem predykcji oglądalności stosując wiele różnych metod statystycznych: skalowanie wielowymiarowe, regresja liniowa lub nieliniowa, analiza czynnikowa, sieci neuronowe, szeregi czasowe ... Założenie tzw. Case-Based Reasoning SBT i CBT są próbami predykcji startującymi z dwóch przeciwstawnych aczkolwiek powiązanych ze sobą stron rzeczywistości telewizyjnej czyli: podaży zawartości programowej i popytu na nią widzów. CBT – Podejście zakładające, że podobne programy w kontekście tzw. contentu lub opisane podobnymi charakterystykami bądź słowami kluczowymi będą oglądane podobnie. SBT – Podejście zakładające, że widzowie o określonych charakterystykach (przynajmniej demograficznych) będą dokonywali podobnych wyborów w przyszłości. Celem większości z prób podejmowanych w przeszłości była predykcja widowni programów telewizyjnych a ich piętą Achillesa skupianie się na estymacji zachowań widzów zagregowanych do określonych grup celowych, co z jednej strony zawężało stosowalność modelu predykcyjnego a z drugiej zmniejszało jego skuteczność w związku z istniejącą w obrębie grup celowych heterogenicznością.
Trudności i wyzwania W związku ze stopniem skomplikowania rzeczywistości telewizyjnej efektywny model predykcyjny powinien być wypadkową metod statystycznych i wiedzy eksperckiej końcowego użytkownika Oczekiwania odbiorców nie kończą się na otrzymaniu raportu zawierającego estymacje wielkości widowni pozycji z ramówek stacji dla pewnych grup docelowych Liczba czynników, które muszą być uwzględnione w modelu predykcyjnym jest olbrzymia. Sytuacja zmienia się dynamicznie powodując dezaktualizację wypracowanych modeli wraz ze zmianami ramówek stacji.
Odbiorcy, ich potrzeby i oczekiwania Zainteresowani: Domy mediowe, nadawcy telewizyjni, domy sprzedaży Przedmiotem zainteresowania są estymacje widowni bloków reklamowych Oczekiwania: Przejrzystość, elastyczność i łatwość stosowania modelu Możliwość kontrolowania każdego z etapów procesu estymacji Dokładność, precyzja estymacji wielkości widowni oraz jej struktury demograficznej Możliwość wprowadzenia zmian przez końcowego użytkownika Estymacja widowni w oparciu o nie zagregowane dane dotyczące zachowania poszczególnych panelistów Krótki czas całego procesu My w oparciu o zdefiniowane potrzeby klienta poszliśmy o krok dalej skupiając się na estymacji widowni bloków reklamowych.
Cel agencji badawczej Czym dysponujemy? Czego potrzebujemy? Baza danych o sposobie oglądania telewizji dla 4000, reprezentatywnych dla populacji osób od 1997 roku Ramówki i cenniki stacji telewizyjnych publikowane z wyprzedzeniem Czego potrzebujemy? Informacji o wielkości widowni pozycji programowych z jeszcze nie wyemitowanej ramówki Jak to osiągnąć? Połączenie dwóch podejść: „S-B T” + „C-B T” Cel agencji badawczej: Opracowanie modelu teoretycznego Ewaluacja metody pod kątem oczekiwań klientów Zaimplementowanie metody spełniającej oczekiwania Przekazanie klientom narzędzia pozwalającego na wykorzystanie ich unikalnego „know-how” w czasie samodzielnej pracy Punktem wyjścia do opracowania metody była konstatacja czym dysponujemy i czego potrzebujemy. Baza zawiera informacje o tym jaką widownię miały konkretne pozycje w ofercie stacji oraz jak swój czas przeznaczony na oglądanie telewizji pomiędzy te pozycje dzielili paneliści. Rozwiązaniem jest połączenie podejścia SBT i CBT pozwalające na kontrolę 2 stron: wnioskowania na podstawie podobieństwa programów oraz na podstawie zakładanego podobieństwa wyborów widzów o określonych charakterystykach demograficznych.
Proces estymacji Przyszła ramówka i cennik stacji Ramówka i cennik stacji w wybranym okresie historycznym Etap I Etap II Etap III Etap IV Etap V Zestaw reguł wyszukujących i łączących podobne do siebie bloki reklamowe Przyszła ramówka stacji z wstępną estymacją widowni Interwencja użytkownika Założyliśmy i to założenie zaimplementowaliśmy następnie w narzędziu udostępnionym użytkownikom że, proces estymacji składa się z 5 przedstawionych kroków: Prezentowane kolorem czerwonym etapy pozwalają na wykorzystanie wiedzy eksperckiej końcowego użytkownika w ramach zaproponowanego przez agencję badawczą modelu Te 5 etapów to: Dostęp do ramówki i cennika stacji Wybór odpowiedniego okresu historycznego Ustalenie zestawu reguł, dzięki którym pewne emisje z przeszłości staną się podstawą do estymowania widowni Wygenerowanie wstępnych estymacji dla listy bloków reklamowych z przyszłej ramówki Sprawdzenie wielkości widowni listy i dokonanie ewentualnych zmian Przyszła ramówka stacji z ostateczną estymacją widowni
Metoda obserwacyjno - probabilistyczna Wyszukujemy w historycznej ramówce bloki jak najbardziej podobne do bloków z przyszłej ramówki. Kryteria podobieństwa określane są przez użytkownika Dostępne kryteria zgodności: Kanał emisji, typologia programowa, czas emisji, dzień tygodnia emisji, typ bloku reklamowego, nazwa programu, dowolna informacja opisująca blok dodana przez użytkownika itp.. Zdecydowana większość bloków reklamowych z przyszłej ramówki ma przynajmniej jeden swój odpowiednik historyczny Najważniejszym składnikiem całego procesu (poza oczywiście wiedzą ekspercką końcowego użytkownika) jest zestaw reguł łączących bloki reklamowe. Zakładamy że bloki z przeszłości podobne do bloków w przyszłości pod względem określonych charakterystyk będą miały podobną widownię. Kluczem było umożliwienie definiowania reguł kierujących łączeniem bloków w sposób możliwie jak najbardziej intuicyjny i efektywny. Procesem wyszukiwania i łączenia podobnych bloków zawiaduje zestaw unikalnych reguł stworzonych przez użytkownika. Reguły te mogą być działać globalnie na wszystkie bloki ramówek bądź selektywnie na ich wskazaną przez użytkownika część.
Metoda obserwacyjno - probabilistyczna Bloki reklamowe z przyszłej ramówki Bloki reklamowe z przeszłości Zestaw automatycznie aplikowanych, hierarchicznie uporządkowanych reguł Reguła I Reguła II ... Reguła N Proces można przedstawić następująco... Każda z reguł składa się z określonego przez użytkownika zestawu kryteriów zgodności, reguły są uporządkowane hierarchicznie Każdy historyczny blok reklamowy przypisany blokowi z przyszłej ramówki sprawdzany jest pod kątem czasu jaki każdy panelista poświęcił na jego oglądanie Relacja między wagą panelisty, czasem jaki poświęcił na oglądanie bloku reklamowego i długością tego bloku daje nam informację o wielkości widowni każdej minuty przyszłego bloku GRP = średnia waga panelisty x (czas oglądania / długość trwania bloku)
Metoda obserwacyjno - probabilistyczna Dzięki estymacji zachowań każdego z panelistów indywidualnie, możliwa jest dowolna agregacja danych, czyli zdefiniowanie absolutnie każdej grupy docelowej. Użytkownik ma możliwość pracy z wykorzystaniem wszystkich zmiennych używanych podczas planowania kampanii reklamowej: GRP, RCH, OTS, CPP etc. Użytkownik nie musi opierać się w pracy na danych dla grupy docelowej dla której przeprowadzono proces estymacji
Efekt procesu estymacji Każdy blok jest opisany statystykami pozwalającymi użytkownikowi na całkowitą kontrolę nad wstępnie wygenerowanymi estymacjami Użytkownik może „wymusić” inne niż wynikające z zastosowanych reguł połączenie historycznych i przyszłych bloków reklamowych a także zmienić wielkość GRP oraz profil widowni
Reguły Instytutu Badawczego Reguły Domu Mediowego + Sezonowość Weryfikacja modelu Korelacja r Pearsona z danymi rzeczywistymi Target Universe Reguły Instytutu Badawczego Reguły Domu Mediowego Reguły Domu Mediowego + Sezonowość W 45+ Ci, CD 2 876 000 0,88 0,89 0,92 All 16-49 19 005 000 0,90 0,91 W 16-49 9 189 000 0,87 M 30-59 CD 4 925 000 0,86 M 16-49 9 816 000 All 18-34 10 117 000 W 20-49 CD Ci>50 2 473 000 0,85 W 25-49 + K 4-14, BCD 2 538 000 0,79 0,81 0,83 All 20-39 edu+,Ci>100, CD 2 003 000 0,75 0,77
Weryfikacja modelu
Weryfikacja modelu
Weryfikacja modelu Polsat TVN TVP2 TVP1 Doba – interwał godzinny
Weryfikacja modelu Polsat TVN TVP2 TVP1 Doba – interwał godzinny
Weryfikacja modelu Polsat TVN TVP2 TVP1 Doba – interwał godzinny
Porównanie GRP kampanii „Ketoprom” 4-29.IX.2006 0,6% 1,7% 4,1% 3,5% TG: W 20-49 CD Ci>50
Porównanie GRP kampanii „Sami Swoi” 1-10.IX.2006 1,5% 7,8% 11,1% 7,2% 0,7% TG: All 16-49
Porównanie GRP kampanii „Media Markt Notebook HP” 28-29.IX.2006 0,3% 18,7% 7,6% 2,8% 31,7% TG: M 30-59 CD
Porównanie Zasięgu kampanii „Ketoprom” 4-29.IX.2006 %RCH GRP TG: W 20-49 CD Ci>50
Porównanie Zasięgu kampanii „Sami Swoi” 1-10.IX.2006 %RCH GRP TG: All 16-49
Porównanie Zasięgu kampanii „Media Markt Notebook HP” 28-29.IX.2006 %RCH GRP TG: M 30-59 CD
Podsumowanie Powstało: efektywne i elastyczne narzędzie predykcyjne, zaimplementowane w oprogramowaniu, sprawdzone w czasie planowania kampanii reklamowych Błąd predykcji minimalizowany nawet do 2% (średnia dla czterech największych stacji) Wysoka korelacja (do 0,92) między danymi rzeczywistymi a estymowanymi Różnica między planowanym GRP% a rzeczywistym zminimalizowana nawet do 0,3% Wysoka zbieżność estymowanych i rzeczywistych krzywych zasięgu
Dziękujemy za uwagę Piotr Borusiewicz Universal McCann Michał Szczepankiewicz AGB Nielsen Media Research