Wracamy do przykładu opisanego w poprzednim wpisie GIGO II. Jesteśmy o krok od wysłania do 50 osób naszego standardu pliku do uzupełniania ewidencji środków higienicznych. Odpowiednia jakość zbieranych danych jest naszym priorytetem. To kolejny kluczowy krok, który będzie miał bezpośredni wpływ na to na jakie problemy możemy trafić. Problemy mogą dotyczyć zarówno nas jak i menadżerów. Na tym etapie pozostają nam dwie rzeczy do przygotowania, które ograniczą ryzyko otrzymania złych danych.
Zabezpieczenie poprawności danych – bez niej wysoka jakość zbieranych danych jest niemożliwa
Pierwszy element to ustrzeżenie się przed nieograniczoną kreatywnością innych osób w modyfikacji tabelek jakie im wyślemy. Powinna nam zawsze towarzyszyć myśl, że „JEŻELI MOŻNA COŚ ZEPSUĆ, TO ZAPEWNE KTOŚ TO ZEPSUJE”. Musimy popatrzeć na nasz plik jak kontroler jakości, szukać wszystkich możliwych wad, luk i niebezpiecznych miejsc. Przejdziemy teraz cały proces myślowy jaki powinienem nam towarzyszyć w ograniczaniu psucia naszego standardu pliku i jakości danych. Kolejność kroków jest dowolna ale każdy z nich może mieć krytyczne znaczenie. Poniżej elementy które należy przemyśleć.
Czy wypełniający plik może dodawać nowe wiersze i kolumny lub je usuwać?
Przed tym musimy się zabezpieczyć, w przeciwnym razie nasze tabelki będą w innych miejscach. Między danymi zostaną puste obszary albo część tabeli zostanie usunięta a formuły zepsute. To nie pozwoli na zautomatyzowanie pobierania danych z wielu plików. Przecież mamy dostawać co jakiś czas 50 plików i nie chcemy każdego z nich szczegółowo przeglądać. Dlatego w Excelu na karcie „Recenzja” chronimy arkusz nie pozwalając na te czynności

Formatowanie komórek, kolumn, wierszy
Z jednej strony nie chcielibyśmy aby ktoś nam pokolorował inaczej całe tabele, skoro mamy zdefiniowane co dany kolor oznacza. Z drugiej strony często zmiana koloru danej komórki to oznaczenie, że należy zwrócić uwagę na daną wartość i ma to swoją słuszność. Dlatego tą opcję warto pozostawić użytkownikom. Ewentualnie zablokować formatowanie kolumn i wierszy.
Edycja komórek
Kluczowe zabezpieczenie w jakości samego pliku. Musimy jasno określić, w których komórkach użytkownik ma i może wprowadzać wartości, a których edytować nie może, bo grozi to popsuciem struktury pliku i danych. Nie chcemy by ktoś zmieniał nasze formuły, przestawiał daty albo zamieniał sobie nagłówki czy nazwy środków higienicznych w poszczególnych blokach. To właśnie jednakowy układ we wszystkich plikach daje nam możliwość pełnej automatyzacji zbierania i weryfikowania danych. Dlatego zaznaczamy komórki możliwe do edycji i w ich opcjach formatowania odznaczamy w ochronie pole „Zablokuj”. Zabezpieczając się przed pojawieniem się środków higienicznych, które nie ujęliśmy, z góry dołożone są bloki na wprowadzenie nowych pozycji. Nie możemy zapomnieć, że w tych blokach musi być możliwa edycja nazw środków ochrony. W przeciwnym razie plik wróci do nas z prośbą o zmianę lub będzie zawierał wartości nie wiadomo czego.

Format wprowadzanych danych
Jak już mamy określone gdzie użytkownik wprowadza dane, określmy jeszcze jakie dane może wprowadzić. W naszym przykładzie zdefiniowaliśmy sobie, że interesują nas pełne opakowania lub pojemniki, czyli liczby całkowite. Aby ustrzec się sytuacji, że na stanie mamy 1,25 5-litrowego pojemnika płynu dezynfekującego ustawmy dla tych komórek w opcjach „Poprawność danych”, że możliwe do wprowadzenia są tylko pełne liczby, które są większe lub równe zero.

Warto też ustawić odpowiedni komunikat w przypadku wprowadzenia złych wartości, aby użytkownik dokładnie wiedział w czym leży problem. To też zaoszczędzi telefonów z pytaniami lub pretensji, że coś nie działa.

Zabezpiecz strukturę skoroszytu
Mając na uwadze chęć automatyzacji pracy z plikami, dobrze jest ustrzec się zmian nazw arkuszy i dodawania nowych arkuszy. To zabezpieczy nas przed sytuacją, gdy dostaniemy plik z kilkoma podobnymi arkuszami i nie będziemy mieli pewności w której są poprawne dane. Druga istotna rzecz jest taka, że często mamy ukryte arkusze, w których są słowniki, parametry itp. Usunięcie przez użytkownika takiego arkusza zepsuje funkcjonowanie pliku. Lepiej zabezpieczyć strukturę pliku, aby użytkownik nawet nie wiedział, że takie arkusze istnieją.
Zabezpiecz plik hasłem
Jeżeli w pliku możemy mieć dane wrażliwe warto też zabezpieczyć plik hasłem przed otwarciem przed niepożądaną osobę. W naszym przypadku nie jest to konieczne. W sytuacji, gdy do pliku ma dostęp wiele osób ale tylko określone osoby powinny móc go edytować, to możemy ustawić dodatkowe hasło umożliwiające wprowadzanie zmian. Aby je ustawić wchodzimy w „Zapisz jako > Narzędzia > Opcje ogólne” i ustawiamy „Hasło ochrony przed zmianami”

Tak przygotowany plik zapewnia nam bardzo wysoką jakość danych. Mamy pewność, że od każdego menadżera dostaniemy taki sam plik, będą w nim te same środki higieniczne, te same daty i taki sam format liczb. Sama struktura pliku też jest zachowana. Praca z takimi plikami będzie wielokrotnie efektywniejsza i przyjemniejsza niż bez stosowania, którejś z powyższych wskazówek. Pozostaje nam jeszcze jedna rzecz do przygotowania
Przygotuj opis i instrukcję aby uzyskać wysoką jakość zbieranych danych
Wysyłając pliki do menadżerów musimy im przekazać dwie informacje. Po pierwsze jaki jest cel zbierania tych informacji, a co za tym idzie dodatkowej pracy oraz jakie to może dać nam wszystkim korzyści. Bez tych informacji zapewne zapanuje poczucie niechęci i konieczności wypełniania kolejnych bezsensownych tabelek. Jeśli wskażemy, że konieczność ewidencji wyszła ze strony samego zarządu, a pliki pozwolą menadżerom na łatwe i proste określanie ile, czego mają na stanie i kiedy warto zamówić kolejną dostawę, to prawdopodobnie nastawienie do tej czynności zmieni się na bardziej pozytywne. Druga informacja kluczowa do menadżerów, która też oszczędzi nam sporo czasu to jasna i precyzyjna instrukcja. Możemy wysłać świetny plik, spełniający wszelkie nasze oczekiwania ale jeżeli użytkownicy nie będą wiedzieli dokładnie co mają zrobić to uzyskany efekt może być daleki od pożądanego. Im instrukcja będzie prostsza, najlepiej z konkretnymi przykładami, tym lepszej jakości dane dostaniemy.
Podsumowanie działań które zmaksymalizują jakość zbieranych danych
Wracając do kluczowego zagadnienia naszego tematu to właśnie powyższe etapy przygotowania analizy są najważniejsze dla efektów naszego zadania. Tego czy z naszej analizy da się wyciągnąć właściwe wnioski. Również to czy wykonamy ją na czas, zależy od tego jak dobrze zabezpieczymy się w tych aspektach. Każde pytanie, uwaga ze strony użytkowników o coś co mogło zostać im zakomunikowane jest podwójną stratą czasu. Zamiast napisać coś w instrukcji, tłumaczymy to kolejnym osobom, które wiszą z nami na telefonie zamiast pracować nad ważnymi zadaniami.
Każde błędne dane mogą skutkować albo czasem straconym na poprawę błędów, albo co gorsza błędnymi wnioskami z naszej analizy. Cały czas naszą główną myślą powinno być to, że jesteśmy oceniani przez przełożonych za to jakie możliwości i korzyści daje analiza, którą zrobimy. Z drugiej strony będziemy postrzegani przez dostawców danych jako osoby, które przygotowują proste, ładne i przydatne narzędzia. Bądź odwrotnie, jako osoby które komplikują im życie i utrudniają pracę. Dlatego tak ważnym i nieodzownym elementem naszej pracy jest dokładne przemyślenie procesu zbierania danych. To proces bardzo często najważniejszy w całym zadaniu. Od niego zależy czy będziemy postrzegani jako ekspert w tego typu zadaniach, czy może osoba marnująca swój i innych czas, nierealizująca powierzonych zadań.
Pamiętajcie „Śmieci na wejściu – śmieci na wyjściu”
Przy każdym procesie zbierania niesystemowych danych przejdź ponownie przez ten proces GIGO I oraz GIGO II.