Wracamy do tematu GIGO i tego jak pozyskać dobre dane. Czym jest i jak powstaje taki stan pisałem w poprzedniej części GIGO – jak pozyskać dobre dane I. Sytuacja w której musimy zmierzyć się z danymi co do których jest bardzo duże ryzyko ich kiepskiej jakości zazwyczaj spotyka nas nagle i dotyczy rzeczy, z którymi na co dzień nie mamy zbyt wiele do czynienia. Może do być analiza, którą trzeba przygotować na jednorazową okazję np. przeniesienie działalności firmy do innej lokalizacji albo zapotrzebowanie na analizę wynikającą z sytuacji kryzysowej. Tak się składa, że w obecnym czasie sytuacji kryzysowych nam nie brakuje. Zagrożona jest często sytuacja finansowa firm, dostępność kadry, problemy techniczne i ograniczenia sanitarne. Ten ostatni przykład posłuży nam właśnie do omówienia sobie problemu z jakością danych.
Realny problem jak pozyskać dobre dane

Wyobraźmy sobie taką sytuację – pracujemy w firmie prowadzącej sieć restauracji na terenie całego kraju. Restauracje niedawno zostały otwarte dla klientów, sytuacja finansowa jest trudna, obrót mały, a zysku przez jakiś czas jeszcze nie będzie. Dodatkowo doszły nowe koszty i ograniczenia. Konieczność dezynfekcji stolików i innych powierzchni. Praca w maseczkach, zachowanie większej higieny i mniejsza wydajność pracy. Każda restauracja została zaopatrzona w odpowiedni zestaw płynów dezynfekujących i maseczek. Koszt tego działania był znaczący dla firmy, a już niektóre restauracje zgłaszają zapotrzebowanie na kolejne dostawy. Zarząd zaniepokojony tą sytuacją zgłosił konieczność wprowadzenia ewidencji stanów, dostaw i zużycia środków higienicznych.
Myślę że powyższy przykład dobrze przedstawi wszystkie problemy z jakimi musimy się zmierzyć. Po pierwsze nie mamy informacji systemowych. Przecież nikt nie prowadzi stanów magazynowych maseczek w systemie na którym pracują restauracje. Nie mamy też informacji o wszystkich dostawach. W prawdzie większość dostaw jest z wewnętrzne z centrali. Zdarza się, że gdzieś restauracja dostała maski z urzędu miasta, a gdzieś indziej musieli sami kupić interwencyjnie. Nie możemy też liczyć na jakieś wsparcie informatyczne w monitorowaniu zużycia środków higienicznych. Jak widać nie łatwo pozyskać dobre dane do tego raportu.
Co robimy?
Trzeba działać szybko i zdecydowanie, ponieważ każdy dzień zwłoki tylko nasila poziom niewiedzy o sytuacji w biznesie. Pozostaje nam tylko zebrać wszystkie informacje bezpośrednio od menadżerów restauracji. Czynnik ludzki jak można się domyślić stanowi tu największy problem. Chociaż kreatywność osób jest dużą zaletą to w tej sytuacji może nas pogrążyć, a stan GIGO będzie nieunikniony. Chyba każdy spotkał się z sytuacją gdzie oczekiwał od innych konkretnych danych w prostych tabelkach. Natomiast dostał informacje tak różne i tak zaskakujące, że sam by nie wpadł na to, że tak można zrozumieć proste polecenie.
Plan działania jak pozyskać dobre dane
Ok, zaczynamy pracę nad nowym wyzwaniem. Wiemy jakie informacje chcemy zebrać, od kogo i czemu mają posłużyć. Znamy cel, pozostaje wybrać odpowiednie rozwiązanie i narzędzia. Zacznijmy od narzędzi. Potrzebujemy zebrać informacje z 50 restauracji. Zbierać będziemy je regularnie, będą to dane liczbowe, które mamy zgrupować w jedną bazę danych. Naturalnym rozwiązaniem jest Excel, w którym odpowiednią tabelę do wypełnienia przygotujemy w kilka minut. To właśnie „tabelka do wypełnienia” jest pierwszym kluczowym elementem do zrealizowania tego zadania. Jeśli poprosilibyśmy menadżerów o przysłanie własnych tabelek. W takim przypadku od razu możemy sobie w kalendarz dopisać nadgodziny przeznaczone na wyjaśnianie co autor miał na myśli i co w ogóle nam przysłał. Kolejne nadgodziny na to jak potem te dane połączyć… Już wiemy, że musimy mieć jeden standard dla wszystkich, jak odpowiednio go przygotować?
Każda poświęcona minuta pracy nad przygotowaniem standardu tabel zwróci się wielokrotnie w późniejszej pracy. Musimy wziąć pod uwagę kilka aspektów
Jakie dane chcemy pozyskać?
Z wartości potrzebujemy stan na początek dnia, zużycie, dostawę i stan na koniec dnia, który powinien liczyć się sam. Prosta formuła która już eliminuje problem poprawnego liczenia stanu na koniec dnia. W przeciwnym razie gdy z wyniku działania „stan początkowy+dostawa-zużycie” nie jest równy stanu końcowego bez telefonu do menadżera nie ustalimy, która wartość jest niepoprawna. Druga formuła to stan na początek dnia powinien równać się stanowi na koniec dnia poprzedniego. Jeśli wpisana była inna wartość, to pytanie gdzie nam znika towar w nocy? A to pytanie nikomu się nie spodoba.
Czego mają dotyczyć zbierane dane?
Tu musimy określić, czy zbieramy informację tylko o maseczkach i płynie dezynfekującym czy jeszcze są inne rzeczy. Nieodzownym jest kontakt z menadżerami restauracji i z osobą odpowiedzialną za dostawy środków higienicznych i dezynfekujących. Z tych rozmów dowiadujemy się, że maseczki to tak naprawdę maseczki jednorazowe, maseczki wielokrotnego użytku, z filtrem. Płyn dezynfekujący to pojemniki litrowe, 5-litrowe, półlitrowe pojemniki z żelem. Do tego jeszcze musimy uwzględnić rękawiczki w opakowaniach po 50 sztuk i po 100 sztuk oraz przyłbice. Precyzyjne określenie środków, które chcemy ewidencjonować zaoszczędzi wielu nieporozumień, pytań i różnych interpretacji.
Definicje wartości
Czyli co rozumiemy przez 1 sztukę w danym środku ochronnym. Czy jedna sztuka to jedna para rękawiczek, jedna rękawiczka, jedno opakowanie nierozpoczęte czy jedno niepuste? W przypadku płynów jeden to litr czy opakowanie? Jeżeli rozróżniamy rodzaje opakowań to najlepiej przyjąć, że jeden to jedno opakowanie. A w przypadku zużycia przyjmować jeden jako jedno napoczęte opakowanie/pojemnik. To zaoszczędzi sytuacji gdzie ktoś przelicza rękawiczki w kartonie albo odmierza płyny w pojemnikach.
Częstotliwość ewidencji danych
Jeśli naszym celem jest możliwość analizowania w czasie zmian zużycia, stanów itp. to musimy przygotować plik, który pozwoli na wygodne codzienne wprowadzanie aktualnych danych. Może dla menadżerów jest to większa ilość pracy. Jednak unikamy sytuacji, gdzie otrzymujemy z różnych miejsc dane na różny dzień miesiąca.
Ciągłość ewidencji danych
Pytanie czy chcemy przygotować plik na każdy miesiąc oddzielnie czy powinien to być jeden plik, na którym menadżer będzie pracował od początku do końca. Moim zdaniem rozwiązaniem lepszym jest jeden plik z ciągłą ewidencją. Unikamy wtedy konieczności przenoszenia między plikami stanów na początek okresu, wypełniania dodatkowych pól, sprawdzeń czy te wartości między plikami się zgadzają itp. Do tego im mniej plików nad którymi trzeba pracować tym lepiej.
Dane informacyjne
Dobrze jeśli od razu w pliku mamy wprowadzone informacje z której restauracji są to dane. Nie musimy jej sami dopisywać, a dodatkowo łatwo zrobić makro w VBA, które samo nam pokaże z których przychodni mamy już dane, a na które jeszcze czekamy. Jeśli mamy gdzieś gotową listę restauracji, a pewnie jest w jakiejś bazie, to dobrze wykorzystać ją do wprowadzenia gotowego pola wyboru. To zapewni jednakowy standard nazewnictwa.
Nieuwzględnione elementy które mogą pojawić się w danych
Należy zastanowić się nad tym czy nasza lista środków higienicznych jest zamknięta czy może się pojawić coś nowego. Jeżeli nie przewidzimy takiej sytuacji to zapewne dostaniem po czasie dopisane środki typu „maseczki otrzymane z urzędu miasta”, „rękawiczki w opakowaniach po 200 sztuk” itp. Lepiej od razu przewidzieć miejsce na nowe rzeczy, niż pozwolić na dowolne rozbudowywanie naszego pliku.
Prostota i czytelność
To też kwestia, którą należy mieć na uwadze. Im plik łatwiejszy do wypełnienia tym lepiej. Dla przykładu poniżej łatwo określić, że uzupełniamy białe pole, żółte zawierają formuły, zielone mówią jakie to mają być dane, pomarańczowe to pola wyboru a niebieskie to pola informacje.

Ale standard to nie wszystko by pozyskać dobre dane…
Mamy przygotowany i przetestowany standard na którym chcemy pracować. Pozostaje nam teraz maksymalne ograniczenie ryzyka otrzymania błędnych lub niepotrzebnych danych. O tym kluczowym elemencie opowiem w części trzeciej GIGO jak pozyskać dobre dane III.