B9 Trendy a novinky v sociologické metodologii I.

Garant panelu: Jaromír Mazák

3. 2. 13:30


Chybějící data v praxi: jak se vyhnout neštěstí způsobeného listwise deletion?

Mgr. Ivan Petrúšek

Anotace

Chybějící hodnoty představují v datech z dotazníkových šetření všudypřítomný jev, s kterým je potřeba se při analýze nějakým způsobem vypořádat. Už několik desítek let je přitom známý fakt, že vynechávání případů s chybějícími hodnotami z analýzy není ani zdaleka ideální strategií. Tato metoda, známá české sociologické obci primárně pod jménem „listwise deletion“, však u nás stále představuje dominantě používanou strategii. I když se autoři analyzující kvantitativní data k používání této techniky ve svých publikacích explicitně nehlásí, tak měnící se počet pozorování v jednotlivých prezentovaných analýzách (konkrétně n na konci řádku nebo sloupce tabulky výsledků) je toho jasným důkazem. Na jejich obranu alespoň částečně slouží, že v současnosti se překvapivě ještě stále jedná o výchozí (defaultní) metodu práce s chybějícími hodnotami ve většině programů pro analýzu dat. V první části příspěvku postupně vysvětluji hlavní nedostatky listwise deletion. Konkrétně se aplikací této metody při realizované analýze zbytečně zbavujeme drahocenných dat, přičemž ve velké většině situací bude výsledek takovéto analýzy vychýlen. Zároveň kvůli analyzování menšího počtu případů (respondentů) má tato technika nevyhnutelně menší přesnost intervalových odhadů zkoumaných parametrů. Ve stěžejní druhé části příspěvku představím metodu tzv. mnohonásobných imputací, která v současnosti představuje nejlepší metodu pro řešení problému chybějících hodnot v datech. Při mnohonásobných imputacích je nejdříve každá chybějící hodnota současně nahrazena několika hodnotami. Vznikne tak několik kompletních verzí datového souboru, na kterých se paralelně počítá věcná analýza (tzn. analýza, kterou chceme realizovat bez ohledu na přítomnost chybějících hodnot v datech). V závěrečné fázi mnohonásobných imputací dochází k sloučení paralelně získaných výsledků do jednoho finálního výsledku (tzn. finálního odhadu parametru a jeho směrodatné chyby). Finální odhad má několik výhodných vlastností (ve většině situací se jedná o nevychýlený odhad s poměrně vysokou relativní eficiencí), které jednoznačně překonávají výsledky získané při použití listwise deletion. V mém příspěvku kromě „logicky dedukovatelných“ argumentů proti používání listwise deletion zároveň graficky demonstruji klíčové výhody mnohonásobných imputací. Prezentované výsledky jsou založeny na realizaci komplexní simulační studie.

Yes, sir! Souhlasný styl odpovídání mezi českými respondenty a jeho vztah ke vzdělání a věku

Johana Chylíková

Anotace

Příspěvek má metodologický charakter a zabývá se systematickou chybou měření v datech z výběrových šetření, konkrétně systematickou odchylkou, jež vznikla v důsledku tzv. souhlasného stylu odpovídání (acquiescence response style; ARS). ARS je jev, kdy respondent odpovídá na položky dotazníku souhlasně bez ohledu na jejich skutečný význam. Jeho výskyt může mít za následek ohrožení validity závěrů analýz, neboť zvyšuje průměry zkoumaných proměnných a ovlivňuje vztahy mezi proměnnými. Zahraniční studie opakovaně doložily, že výskyt ARS je ovlivněn vzděláním a věkem respondenta; v západní Evropě jsou k ARS náchylnější starší a méně vzdělaní lidé. Vzhledem k sociokulturním odlišnostem mezi západní a postkomunistickou Evropou je oprávněné se ptát, zda lze charakteristiky ARS nalezené v západní Evropě identifikovat i v ČR. Ve své studii se ptám: existuje ARS v datech získaných na vzorku české populace? Pokud ano, jsou čeští "přitakávači" rovněž starší a méně vzdělaní, jako ti ze západní Evropy? Odpovědi hledám v datech z baterie zjišťující postoje k přistěhovalcům, použité v šetření ISSP v letech 2003 a 2013.

Statistické modelování sociálních sítí

Tomáš Diviák

Anotace

Metody statistického modelování sítí patří mezi takříkajíc state of the art metody současného výzkumu na poli nejen sociálních sítí, ale i obecně v síťové vědě. Ve svém příspěvku se pokusím nastínit, proč tomu tak je a co je přidanou hodnotou modelování ke standardním deskriptivním síťovým metrikám – možnost formulovat a testovat současný vliv i naprosto protichůdných hypotéz na strukturu sítě a možnost odlišit struktury vzniklé náhodně od těch vzniklých působením konkrétních mechanismů. Připomínám zásadní odlišnost síťového statistického modelování od klasických statistických modelů, kterou je narušení předpokladu nezávislosti pozorování. Dále ukazuji, jak s tímto problémem vypořádávají různé typy modelů. Extenze klasických regresních modelů pouze využívají tzv. QAP proceduru k odhadu statistické signifikance, zatímco ERGM a SAOM modely explicitně modelují interdependence mezi aktéry pomocí tzv. konfigurací. V závěru reflektuji problémy a omezení těchto modelů, především z hlediska výpočetní náročnosti, konceptuální náročnosti a jejich různé náchylnosti k degeneraci.

Process tracing: nástroj pro zkoumání kauzality v případových studiích

Jaromír Mazák

Anotace

Příspěvek představí metodu process tracing jakožto nástroj pro zkoumání kauzality v případových studiích. Metoda, která je založena na explicitním vymezení kauzálního mechanismu a formalizovaném zacházení s empirickou evidencí, je intenzivně rozvíjena zatím především v politologii (e. g. Beach, Pedersen, 2013; Bennett, Checkel, 2014). Naopak v sociologii a ostatních společenských vědách je zatím poměrně neznámá. Příspěvek nejprve zasadí metodu do širšího kontextu metodologické diskuse o odlišnosti/příbuznosti kvalitativních a kvantitativních přístupů ve společenskovědní metodologie (e. g. King, Keohane, Verba, 1994; Goertz, Mahoney, 2012), dále představí stěžejní koncepty, o které se metoda opírá, tj. především kauzální mechanismus, testování evidence založené na teoretické unikátnosti a teoretické jistotě (Van Evera, 1997) a některé praktické problémy aplikace metody process tracing. Nakonec bude aplikace metody process tracing ilustrována na příkladech studia dopadů aktivismu a sociálních hnutí.

Úvod > B9 Trendy a novinky v sociologické metodologii I.