Poziomy dowodów w badaniach naukowych

Poziomy dowodów w badaniach żywieniowych

Odżywianie i zdrowie są ze sobą nierozerwalnie związane. Naukowcy zajmujący się żywieniem starają się rozwikłać te powiązania, aby uzyskać wiarygodne porady żywieniowe. Jednak nie wszystkie rodzaje badań można wykorzystać do wyciągnięcia równie stanowczych wniosków. Zrozumienie różnych typów projektów badań jest ważne dla rozróżnienia między wiarygodnymi i mniej wiarygodnymi wynikami. W tym artykule omówiono różne prace badawcze powszechnie stosowane w badaniach żywieniowych, ich cel, jak mocne są ich dowody oraz omówiono mocne strony i ograniczenia każdego projektu.

Przeglądy systematyczne i metaanalizy

Pojedyncze badanie nie wystarcza, aby z całą pewnością sformułować ogólne stwierdzenie na temat określonego związku między odżywianiem a zdrowiem. W tym miejscu pojawiają się systematyczne przeglądy i metaanalizy: w tego typu badaniach naukowcy zbierają wszystkie istotne badania na dany temat i analizują je zbiorczo. W rezultacie ryzyko między określoną ekspozycją/czynnikiem (np. nadwagą) a wynikiem/chorobą (np. rakiem) można oszacować dość dobrze.1

W metaanalizie wyniki wielu badań są łączone zgodnie z rygorystycznym protokołem w celu znalezienia wszystkich oryginalnych badań przeprowadzonych w danej kwestii i ważone metodami statystycznymi w celu uzyskania pojedynczego podsumowania. Duże i dobrze przeprowadzone badania z wysokiej jakości dowodami mają większą „wagę” niż te małe lub słabo przeprowadzone z danymi niskiej jakości. Metaanalizę można przeprowadzić tylko wtedy, gdy badania dotyczą tego samego pytania badawczego i wykorzystują podobne metody pomiaru odpowiednich zmiennych.

Przeglądy systematyczne są podobne do metaanalizy, ale bez użycia analizy statystycznej. Chociaż przeglądy systematyczne i metaanaliza mogą zmniejszyć stronniczość poprzez łączenie danych ze wszystkich istotnych badań badających określony temat, są one tak dobre, jak badania, które obejmują. Ważne jest, aby sprawdzić, czy uwzględniono dane z wadliwych badań lub czy istnieją dane z badań, które wykorzystują różne metody pomiaru zmiennych – co skutkuje porównaniem „jabłek do pomarańczy”.

Randomizowane badania kontrolowane (RCT)

Randomizowane badanie kontrolowane (RCT) to rodzaj badania interwencyjnego, w którym badacz aktywnie interweniuje w celu zmiany czegoś, aby sprawdzić, jaki ma to wpływ na określony wynik zdrowotny.

W badaniu RCT grupa pacjentów z tym samym schorzeniem jest identyfikowana, a następnie losowo przydzielana do grupy otrzymującej leczenie (np. suplement kwasów tłuszczowych omega-3) lub do grupy kontrolnej, która nie otrzymuje leczenia (np. suplementu „placebo”, który wygląda identycznie jak oryginalny suplement, ale nie zawiera badanej substancji). Po określonym czasie efekty w obu grupach są mierzone i porównywane ze sobą. Ponieważ tylko jeden czynnik jest celowo zmieniany między grupami (a inne możliwe czynniki wpływające na związek pozostają takie same lub tak podobne, jak to możliwe), ten rodzaj badań może pozwolić nam zidentyfikować związki przyczynowo-skutkowe.1 Tego typu badania są również wykorzystywane w badaniach medycznych, na przykład do testowania działania nowych leków lub szczepionek.

Zaleca się, aby badania RCT były przeprowadzane jako badania z podwójnie ślepą próbą: zarówno badacz, jak i uczestnicy nie wiedzą, kto jest w której grupie. Jest to ważne, ponieważ wiedza o tym, kto jest leczony, może wpłynąć na odpowiedź uczestnika lub pomiar wyniku przez badacza. Na przykład efekt placebo jest dobrze znanym zjawiskiem, w którym osoba obserwuje poprawę objawów lub efektów u siebie po zażyciu fałszywego lub nieaktywnego „leczenia” (np. tabletek, które nie zawierają żadnego aktywnego składnika). Co więcej, ważna jest prawdziwa randomizacja. Jeśli jedna grupa była w jakiś sposób bardziej chora (lub mniej zdrowa) niż druga grupa na początku, może to sprawić, że grupa ta będzie miała gorsze wyniki, nawet jeśli zastosowane leczenie naprawdę nie miało żadnego wpływu.

Badania RCT mają również ograniczenia. Mogą nie odpowiadać na niektóre pytania badawcze, takie jak wpływ całych diet (np. ketogenicznej, wegańskiej) na choroby przewlekłe, takie jak rak lub choroby układu krążenia. Niemożliwe byłoby kontrolowanie zgodności (np. jak ściśle uczestnicy badania trzymają się zaleconej diety), wymagana byłaby ogromna liczba uczestników, aby wykazać znaczącą różnicę w wynikach, a także kosztowałoby to ogromną ilość pieniędzy i czasu. Co więcej, interwencje, które celowo narażają uczestników na coś, co uważa się za szkodliwe (np. alkohol, palenie tytoniu, zanieczyszczenia) lub powstrzymują uczestników od leczenia uważanego za poprawiające zdrowie (np. niektóre antybiotyki lub środki chemioterapeutyczne) w celu definitywnego udowodnienia związku przyczynowo-skutkowego, budzą wątpliwości etyczne.

Ważne jest również, aby nie uogólniać zbyt szybko wyników RCT. Badanie te często mają ścisłe kryteria dotyczące tego, kogo należy uwzględnić i wykluczyć. Jeśli badanie przeprowadzono tylko na określonej grupie osób (np. kobietach w średnim wieku z cukrzycą), badanie może nie mieć zastosowania w szerszej populacji. Wreszcie, RCT mogą często trwać krótko, ponieważ ich przeprowadzenie jest kosztowne. Dlatego badania te mogą nie być w stanie powiedzieć nam o długoterminowych skutkach wzorców i zmian żywieniowych.

Badania obserwacyjne

Badania obserwacyjne obejmują po prostu obserwację nawyków lub zachowań w dużych grupach ludzi w celu zbadania związku między czynnikami stylu życia a wynikami zdrowotnymi. Badacz nie interweniuje w żaden sposób, ale porównuje wyniki zdrowotne osób, które dokonują różnych wyborów dotyczących diety lub stylu życia. Naukowcy wykorzystują te badania do identyfikowania korelacji i opracowywania hipotez do dalszego badania.1

Na przykład badacze zaobserwowali, że osoby pijące alkohol są bardziej narażone na raka płuc niż osoby niepijące. Jednak może być również tak, że osoby pijące alkohol mają także tendencję do częstszego palenia, a badacze nie uwzględnili tego czynnika w swojej analizie (np. nie został on zmierzony lub nie uważano, że wpływa na związek). W tym przypadku palenie jest tak zwanym czynnikiem zakłócającym: czynnikiem związanym zarówno z ekspozycją (picie alkoholu), jak i wynikiem (rak płuc), a zatem może zniekształcać dane. W badaniach RCT te czynniki zakłócające są równomiernie rozłożone na grupy badane (przy założeniu, że randomizacja została przeprowadzona prawidłowo), ale jest to mało prawdopodobne w przypadku badań obserwacyjnych. Ze względu na obecność czynników zakłócających badania obserwacyjne nie mogą udowodnić związku przyczynowo-skutkowego.

Kolejne sekcje opisują trzy wspólne projekty badań obserwacyjnych: prospektywne badania kohortowe, badania kliniczno-kontrolne i badania przekrojowe.

Prospektywne badania kohortowe

Prospektywne badanie kohortowe to badanie, które obserwuje grupę osób w czasie. Na początku badania naukowcy proszą uczestników o wypełnienie kwestionariusza (np. na temat ich nawyków żywieniowych, poziomu aktywności fizycznej itp.), a także mogą wykonywać pomiary masy ciała, wzrostu, ciśnienia krwi, profilu krwi lub innych czynników biologicznych. Po latach badacze sprawdzają, czy u uczestników rozwinęła się choroba i badają, czy ekspozycja z kwestionariusza lub pomiarów biologicznych jest związana z chorobą.1

Jedną z głównych zalet tego projektu jest to, że badacze obserwują naturalne ekspozycje i zachowania uczestników bez interwencji, zapewniając wgląd w rzeczywiste scenariusze. Pozwala również badaczom zbadać długoterminowy wpływ odżywiania lub innych ekspozycji związanych ze stylem życia na rzeczywiste choroby. Ponieważ rozwój chorób przewlekłych, takich jak choroby serca i osteoporoza, często zajmuje wiele dziesięcioleci, kohorta może być bardziej odpowiednia w porównaniu z RCT, w którym często mierzy się pośrednie markery tych chorób (np. zwężenie tętnic lub gęstość kości). Markery te nie zawsze rozwijają się w chorobę.

Jednym z głównych ograniczeń badań kohortowych jest to, że nie mogą one ostatecznie ustalić związku przyczynowego z powodu potencjalnych czynników zakłócających. Ważne jest również, aby zastanowić się, w jaki sposób mierzone jest spożycie pokarmu przez uczestników. Kohorty często używają tak zwanych kwestionariuszy częstotliwości spożycia żywności (FFQ), które mierzą średnie spożycie żywności przez daną osobę w czasie. Chociaż FFQ są jedną z najlepszych dostępnych metod oceny spożycia, dokładne oszacowanie typowego spożycia, wielkości porcji i metod przygotowywania może być trudne. Ponieważ dane są zgłaszane samodzielnie, mogą obejmować subiektywne interpretacje (np. uczestnicy mogą zaniżać, zawyżać lub po prostu zapominać o swoich wcześniejszych nawykach: problem zwany tendencyjnością wycofywania). FFQ nie odzwierciedlają również wzorców zachowań w ciągu całego życia: ludzie mogli zmienić swoje zachowanie w ciągu ostatnich lat (np. palacze mogą rzucić palenie lub osoby jedzące mięso mogą stać się wegetarianami), co skutkuje błędną klasyfikacją uczestników i potencjalną stronniczością. Gdy używany jest zweryfikowany FFQ, zasadniczo część stronniczości jest ograniczona.

W badaniu kohortowym ważne jest również, aby uczestnicy byli obserwowani przez długi czas, tak by zgromadzić wystarczającą liczbę danych, aby uzyskać wiarygodne wyniki. Oznacza to, że na ogół można je stosować wyłącznie do badania chorób, które są stosunkowo powszechne. Innym problemem w badaniach kohortowych jest stronniczość selekcji: osoby wybrane do badania różnią się od tych, które nie zostały wybrane w jakiś systematyczny sposób. Rekrutacja uczestników może odbywać się na przykład poprzez gazety, wybieranie numeru telefonu, miejsce pracy lub wolontariat, co wpływa na to, kto bierze udział w badaniu i jak uogólnione są wyniki (tj. gazety są często czytane tylko przez starsze populacje, wybieranie numeru telefonu wyklucza osoby nieposiadające telefonu, wolontariat rekrutuje bardziej świadomych zdrowia uczestników itp.). Kolejna obawa pojawia się, gdy wielu uczestników „wypada z obserwacji” (tj. odpada z badania) w jednej grupie ekspozycji niż w innej, szczególnie jeśli utrata jest również związana z badanym wynikiem.

Badania kliniczno-kontrolne

W badaniu kliniczno-kontrolnym badacze spoglądają w przeszłość osób z chorobą (zwanych „przypadkami”) i porównują ją z osobami bez choroby („kontrolami”). Badania te są najczęściej wykorzystywane do badania związku między ekspozycją a rzadkim wynikiem.1

Podobnie jak w badaniach kohortowych, tendencyjność wycofania jest problemem w badaniach kliniczno-kontrolnych. Dzieje się tak w jeszcze większym stopniu, ponieważ ludzie już cierpią na chorobę będącą przedmiotem zainteresowania, gdy informacje o narażeniu są zbierane lub mierzone, a zatem mogą pamiętać swoje narażenie inaczej niż osoby bez choroby. Efekt selekcji (przypadki i/lub kontrole mogą nie być reprezentatywne dla populacji ogólnej), zakłócający i odwrotny związek przyczynowy mogą być ograniczeniami. Odwrotna przyczyna występuje, gdy trudno jest określić, czy wynik lub ekspozycja były pierwsze. Na przykład, jeśli stwierdzono związek między spożywaniem słodzików niecukrowych a otyłością, czy naprawdę wynika to z wyższego spożycia słodzików niecukrowych, czy też osoby z otyłością częściej spożywały produkty zawierające słodziki niecukrowe, aby pomóc w kontrolowaniu swojej wagi?

Badania przekrojowe

Badanie przekrojowe to ankieta lub przekrój losowej próby populacji, w której jednocześnie gromadzone są informacje o potencjalnych ekspozycjach i wynikach. Na przykład badacze mierzą ciśnienie krwi i zadają pytania dotyczące na przykład ilości przetworzonego mięsa spożywanego przez każdą osobę dziennie. Dzięki temu dowiadują się, czy istnieje związek między ciśnieniem krwi a ilością przetworzonego mięsa spożywanego dziennie.1

W przypadku badań przekrojowych problemem jest ponownie odwrotna przyczynowość: nie można mieć pewności, czy spożywanie przetworzonego mięsa wpływa na ciśnienie krwi, czy też odwrotnie, ponieważ informacje uzyskano w tym samym czasie. Podobnie jak badania kohortowe, mogą być one również podatne na błędy selekcji i przywoływania. Szczególnym problemem może być błąd systematyczny, ponieważ wiedza uczestników na temat ich stanu zdrowia może wpływać na zgłaszane przez nich nawyki żywieniowe (np. osoba z cukrzycą typu 2 może pamiętać, że jadła więcej słodyczy i napojów gazowanych niż osoba bez tej choroby).

Zamiast tego ten prosty projekt badania może być przydatny do zbadania możliwych przyczyn złego stanu zdrowia na wczesnym etapie, zbadania narażenia, które nie zmienia się w czasie (np. płeć, czynniki genetyczne) lub które wystąpiło wiele lat wcześniej, lub oszacowania częstości występowania nawyków żywieniowych i wyników zdrowotnych w populacji w określonym punkcie czasowym. Mogą stanowić punkt wyjścia do dalszych badań nad związkami między czynnikami żywieniowymi a wynikami zdrowotnymi, na przykład w badaniu kohortowym lub RCT.

Badania na zwierzętach i komórkach

Badania na zwierzętach i komórkach (lub czasami nazywane in vitro) mogą wskazywać na prawdopodobny efekt, jednak nie można ich bezpośrednio zastosować u ludzi. Badania na zwierzętach są ważnym narzędziem w określaniu, jak ludzie mogą reagować w przypadku narażenia na określone substancje. Jednak na przykład ze względu na różnice w fizjologii i fakt, że zwierzęta są rutynowo narażone na znacznie wyższe poziomy związków niż typowe spożycie w diecie, wyniki nie mogą być bezpośrednio stosowane u ludzi.2 Podobnie wyizolowane komórki w laboratorium zachowują się inaczej niż komórki w naszym organizmie. Na przykład, jeśli probówka pokazuje, że substancja X powoduje szybsze spalanie tłuszczu w komórce, nie oznacza to, że substancja X pomoże schudnąć ludziom. Ludzkie ciało jest o wiele bardziej złożone niż to, które można naśladować w probówce.

W przypadku badań nad substancjami toksycznymi ten rodzaj badań jest normą. Badanie szkodliwych lub potencjalnie toksycznych związków na ludziach jest niebezpieczne i nieetyczne. Testy na zwierzętach są zatem wykorzystywane do ustalenia wytycznych bezpieczeństwa dla związków chemicznych, takich jak pestycydy i zanieczyszczenia środowiskowe. Ponieważ wyników nie można rozszerzyć na ludzi, a ludzie również różnią się od siebie, stosuje się szeroki margines bezpieczeństwa.

Badania na zwierzętach i komórkach mogą uzupełniać dowody z badań obserwacyjnych i eksperymentalnych: mogą wykazać, czy istnieje mechanizm wyjaśniający te wyniki. Na przykład badania obserwacyjne pokazują, że palenie wiąże się z rakiem, podczas gdy badania komórkowe podkreślają specyficzne szkodliwe substancje obecne w tytoniu, które przyczyniają się do rozwoju raka. Pewność, że wynik jest dokładny, wzrasta, gdy istnieje takie logiczne wyjaśnienie.

Dykteryjki/Anegdoty i studia przypadków

Dykteryjki, opisy przypadków (dotyczące 1 pacjenta) i serie przypadków (dotyczące kilku pacjentów) opisują szczegółowy raport dotyczący poszczególnych pacjentów z określonym wynikiem i/lub ekspozycją.3 Są one ważne dla wczesnej identyfikacji problemów zdrowotnych i mogą generować hipotezy o potencjalnych przyczynach. Ponieważ jednak dotyczą one ograniczonej liczby osób, nie można ich uogólnić na szersze populacje. Doświadczenie lub opinia jednej osoby nie zapewnia obiektywnego obrazu. Dlatego też anegdoty/dykteryjki i studia przypadków są uważane za dowody niskiej jakości.

Co jest uważane za „najlepsze” dowody?

Ogólnie rzecz biorąc, różne rodzaje badań są organizowane od doświadczeń jednej osoby i anegdot mających najsłabszą pewność dowodów do systematycznych przeglądów i metaanaliz mających najsilniejszy poziom dowodów. Te poziomy dowodów można wykorzystać jako wytyczną do oceny tego, co można wywnioskować z konkretnego badania. Nie zastępują one jednak oceny krytycznej.4 Na przykład silne badanie kohortowe może być bardziej przydatne niż wadliwy przegląd systematyczny. Poza tym to, jaki rodzaj badaczy zdecyduje się prowadzić, zależy między innymi od pytania badawczego, ilości dostępnego czasu i ilości pieniędzy. W związku z tym dowody można lepiej posortować według ich przydatności do badania konkretnego pytania badawczego niż według rodzaju projektu badania.

Różne rodzaje projektów badań należy postrzegać jako komplementarne. Na przykład badania obserwacyjne mogą nadal być znaczące i pouczające, gdy liczne badania konsekwentnie wykazują wzorce na dużą skalę.

Badania z randomizacją są często uważane za „złoty standard” prowadzenia badań, a ich wyniki są uważane za bardziej dokładne w porównaniu z badaniami obserwacyjnymi, ponieważ mogą ustalić związki przyczynowo-skutkowe. Jednak założenie to nie zawsze jest słuszne, ponieważ interwencja/ekspozycja badana w RCT może różnić się od tych w badaniach obserwacyjnych.4 Na przykład, spożycie w diecie w badaniach obserwacyjnych nie jest wymienne z niektórymi ekspozycjami stosowanymi w badaniach RCT (np. spożycie kwasów tłuszczowych omega-3 poprzez jedzenie ryb różni się od kwasów tłuszczowych omega-3 spożywanych w izolowanej formie suplementu). W rezultacie nie jest zaskakujące, że czasami znajdują się sprzeczne wyniki między badaniami obserwacyjnymi a eksperymentalnymi.5 Podczas dalszego testowania wyników badań obserwacyjnych w RCT ważne jest zatem dokładne rozważenie badanej populacji, sposobu zastosowania interwencji (zmiany diety), grupy porównawczej i mierzonych wyników. Nawet niewielkie różnice w sposobie prowadzenia badania mogą prowadzić do różnych wyników.

Wnioski

Istnieje wiele projektów badań stosowanych w badaniach żywieniowych, które są wykorzystywane do badania różnych ekspozycji i wyników. To, w jaki sposób wszystkie te badania mogą prowadzić do wniosków, zależy od pewności dowodów. Związek między ekspozycją a wynikiem jest bardziej pewny, jeśli6:

  • Duża liczba prospektywnych badań kohortowych konsekwentnie wykazuje związek między ekspozycją na A (przyczyna) a ryzykiem B (skutek);
  • Badania są dobrej jakości metodologicznej, wielkości i czasu trwania;
  • Istnieje niewiele badań, które stwierdzają coś przeciwnego;
  • W miarę możliwości przeprowadzono również badania eksperymentalne;
  • Znalezione powiązanie można wyjaśnić biologicznie.

Natomiast nie ma wystarczających dowodów, jeśli:

  • Istnieje tylko niewielka liczba badań sugerujących, że istnieje związek między narażeniem na A (przyczyna) a ryzykiem B (skutek);
  • Znalezione powiązanie jest słabe;
  • Nie przeprowadzono lub przeprowadzono niewystarczające badania eksperymentalne i obserwacyjne, dlatego potrzebne są dalsze badania.

Kampania Europejskiej Rady Informacji o Żywności (EUFIC) na rzecz umiejętności czytania i pisania w zakresie nauk o żywności i zdrowiu.

Dowody naukowe