Archiwizacja danych_3_RD.pdf

(2186 KB) Pobierz
Archiwizacja i kontrola danych
Zakres działań dotyczy :
sposobów gromadzenia, dokumentowania, archiwizacji i kontroli danych
do obliczeń chemometrycznych,
które są istotne dla poprawności rezultatów
całej analizy.
Pytanie:
dlaczego mam poświęcać czas i uwagę tym nieciekawym sprawom.
Czy nie lepiej ”przeskoczyć” od razu do właściwej analizy chemometrycznej i
jej poświęcić czas zaoszczędzony przez opuszczenie tego etapu?
Odpowiedź
jest oczywista dla każdego, kto kiedykolwiek pracował z dużymi
zestawami różnorodnych danych:
Właściwe wykonanie prac przygotowawczych skraca czas
potrzebny dla uzyskania poprawnych wyników i ułatwia
prezentację uzyskanych rezultatów.
Cele wstępnej obróbki i kontroli danych
Jakość naszych wyników
zależy w istotny sposób od
jakości danych
wykorzystywanych w analizie. Każda błędna dana nie wyeliminowana w porę
może zniweczyć cały nasz wysiłek. A błędy zdarzają się nie tylko przyrządom
pomiarowym, ale i ludziom.
Podstawowymi celami wstępnej obróbki i kontroli danych są:
i) wykrycie ewentualnych "błędów grubych" powstałych na etapie
zbierania danych,
ii) zmniejszenie ryzyka popełnienia nowych błędów na kolejnych etapach
analizy chemometrycznej,
iii) wykrycie pewnych relacji tkwiących w danych
iv) wskazanie na potrzebę wykonania dodatkowych operacji na danych, np.
transformacji zmiennych.
Ostatecznym celem jest takie przygotowanie danych, aby ich analiza była jak
najwygodniejsza i dała jak najbardziej wiarygodne rezultaty.
DOKUMENTACJA DANYCH I WYNIKÓW
Jest to bardzo ważny etap. Jego zaniechanie lub niestaranne wykonanie jest
często głównym źródłem kłopotów i niepowodzeń w trakcie właściwej analizy
chemometrycznej.
Najlepszą formą gromadzenia wyników pomiarów do analizy problemów
wieloparametrycznych (zależnych od dużej liczby zmiennych) są
odpowiednio zaplanowane tabele.
Na etapie zbierania danych tabele te
powinny być we właściwy sposób opisane.
W praktyce oznacza to że:
i) każda tabela powinna mieć nagłówek zawierający informacje o:
- problemie którego dotyczy
- dacie utworzenia i dacie ostatniej modyfikacji
- nazwisku twórcy
ii) każda kolumna tablicy zawierająca wartości tej samej zmiennej dla
kolejnych obiektów pomiarowych (próbek) powinna mieć swoją własną,
jednoznaczną nazwę
iii) każdy wiersz tablicy zawierający wartości różnych zmiennych dla tego
samego obiektu (próbki) powinien mieć swoją własną, niepowtarzalną
nazwę. Numery kolejne wierszy nie mogą zastąpić nazw obiektów,
iv) tabele tego typu często zawierają wyniki pochodzące z różnych źródeł.
Dlatego też integralną część tabeli musi stanowić informacja o
pochodzeniu danych:
- przez kogo wykonane
- jaką metodą i na jakim przyrządzie
- kiedy
- gdzie znaleźć protokół pomiarów,
v) jeżeli dane pochodzą z literatury to tabela m u s i zawierać pełny
odnośnik do źródła,
vi) w przypadku modyfikacji danych należy te modyfikacje określić i
uzasadnić,
vii) jeżeli dane zostały obliczone w oparciu o inne dane należy podać sposób
obliczeń, źródło danych i przykład liczbowy,
Przykład tak przygotowanej tabeli danych dla danych pomiarów wykonanych
przez trzech laborantów:
Zgłoś jeśli naruszono regulamin