07.雪球抽样

如何对一本书进行雪球抽样阅读? #

1 #

我们刚刚介绍的便利抽样、专家抽样都是有意识放大身边可以利用的资源,协助我们快速抽样,尽快进入阅读状态。除此之外,还有一种快速进入阅读状态的阅读方法就是使用雪球抽样阅读。

我们知道,一粒很小的雪球在雪地里不停的翻滚,它会变得越来越大。将滚雪球效应运用到阅读领域,我们可以假设,如果开始阅读一个章节,那么随着章节知识关联的越来越多,我们阅读的章数就会越来越多,直到达到我们想要阅读的章节数为止。

img

什么是雪球抽样阅读?

简单理解,就是将一本书从任一一个感兴趣的章节开始阅读,然后从这个章节中找到与之相关的感兴趣的其他章节信息,然后顺着这些信息链接阅读这一章节,再从该章节中寻找作者提及的其他章节……如此一轮一轮像滚雪球般持续读下去,一直读到自己设定的阅读样章饱和值。

image-20231220153053249

2 #

比如我拿到《心理与行为科学研究方法》这本书,全书一共14章,我打算选三章阅读。我大概浏览了一下目录,我想着研究方法比较重要的方式之一是科学实验,而这本书的第9章正好是「做实验」,所以我就直接从第9章开始阅读。

image-20231220114622940

在阅读过程中我发现书中提到「操作自变量」这个标题,并写到:

为了操作自变量,你必须构造变量的操作定义(见第4章)。也就是说,你必须把概念变量转换成一组操作,即要呈现给研究参与择的特定指导语、事件和刺激。

这一句话包含了一些抽象的术语比如「变量」、「特定指导语」、「事件」、「刺激」等,所以初读起来并不是很明白。但这里作者给到了相关信息在第4章的提示,所以我暂停阅读第9章,翻回第4章里面,找到了「变量」以及「变量的操作定义」文段:

image-20230530233153581

image-20230530233215718

这时候我就可以尝试对这两个关键概念引入文本细读方法进行阅读,搞清楚什么是变量以及变量的操作定义是什么。

在阅读第4章的过程中,我想,我现在阅读的是「变量」有关的知识,那么,「变量」和我之前阅读的第9章「实验」有什么关联关系呢?

我发现4.5小节作者提到用「非实验法」这个与实验相关的概念:

用非实验法,难以决定哪个变量引起了第一个变量的变化。换言之,实际上,我们不能说健身运动引起了焦虑减少。虽然对于这种因果模式的理由似乎是合理的,但是可出现相反模式的理由也是合理的,即或许是高焦虑使人减少了健身运动。这里的问题是时间先后问题;这对于做出因果推论是非常重要的(见第1章)。

读完这句话,我觉得它非常重要,因为我们经常在日常生活中习惯作一些线性因果推论, 比如很多人认为风湿病或感冒是由于天气变化引起的,事实上它们之间只存在相关性,但并不意味着天气变化一定会引发风湿病或感冒。

作者在这里提到了第1章的相关信息,这就引导我继续翻到本书的第1章,去查找实验的因果推论的相关知识:

image-20230530234640122

作者果真在这里又提及第4章:

有关备择解释的第三点是非常重要的:假设观看大量电视暴力的儿童比不看电视暴力的儿童更多地一个人留在家中。在这种情况中,攻击性能够具有备择解释:缺乏父母监督。第4章将进一步讨论因果关系。

这相当于又提醒我回到第4章去更深入的复习与因果关系、自变量等相关知识点。

在自变量介绍中,4.3小节提到了按操作定义变量的两个重要优点:

image-20230530233522219

这里对其优点解释的比较清晰,那么我想,操作定义有没有缺点呢?

我发现《心理与行为科学研究方法》这本书并没有任何介绍,于是我通过身边的另一本介绍实验的书《行为科学研究方法》中提到了操作定义的局限性:

image-20230530233616512

这时候,我对「操作性定义」就有了更加全面的认知。

我们尝试将前面的阅读过程汇总起来解析一下:

# 书目 阅读章节 备注
1 《心理与行为科学研究方法》 第九章 个人兴趣驱使
2 《心理与行为科学研究方法》 第九章理解「操作自变量」 书中出现「变量操作定义参见第一章」的提示
3 《心理与行为科学研究方法》 第四章 理解「变量」和「变量的操作定义」
4 《心理与行为科学研究方法》 第四章 非实验法的因果推论见第一章
5 《心理与行为科学研究方法》 第一章 因果关系满足的三个条件
6 《心理与行为科学研究方法》 第四章 操作定义变量的优点
7 《行为科学研究方法》 第四章 操作定义变量的缺点

最早我只是相对随性的选择了《心理与行为科学研究方法》的第9章去阅读,但随着阅读章节中对不同章节的文本提示,我实现了不同章节甚至不同书本的阅读跳转,但整体又围绕着一条主线去展开阅读,最终我阅读了四个章节,达到了最初设定的「读三章」的要求,这就是雪球抽样。

雪球抽样的案例图示:

image-20231220160051359

需要注意的是,雪球抽样阅读中一般会设定一个阅读章节的「饱和值」,即我们针对这本书使用滚雪球到底要滚到什么程度停止继续滚?关于这个饱和值的设定,有两种常见的做法:

  1. 提前设定饱和值
    • 在抽样阅读开始之前,我们根据研究自己的阅读目的、经验、现实条件等预先设定一个要滚雪球章节的饱和值。换句话说我们提前设定了雪球抽样的结束点。
  2. 过程中确定饱和值
    • 在抽样阅读过程中动态确定饱和值。比如我们在雪球抽样的过程中,发现抽中的章节内容开始重复或者不能再为我们提供需要的信息时,我们就随着抽样的状态而设定停止点。

在实际操作中,不论那种饱和值,都是基于我们的主观设定,目标都是帮助我们更加深入的理解书本内容。

3 #

通过上述抽样实践我们发现,雪球抽样有一些优点也有一些不足:

优点 #

从最开始第一次的样章选择,再到每次阅读时的章节跳转方向以及后续章节的跳转选择,都有相对较高的自由灵活度,比如某一章中同时提到了多个其他章节的介绍,阅读者也可以根据自己的需求和喜好来决定具体跳转到哪一章。

此外,雪球抽样主要依赖于对所选择的书本章节,并不需要从书本之外的信息入手去分析或预测,这样就大大降低了抽样成本,操作便捷迅速。

不足 #

由于雪球抽样阅读并非概率抽样,最开始选择的章节并不一定与整本书核心章节强相关,所以与之关联的后续章节可能与本书权重章节偏离较远,最终可能只能抽取到一部分章节,从而导致抽样偏差。

雪球抽样主要依赖于选定章节内的推荐或介绍线来次序抽样,但如果选定章节对其他章节介绍较少甚至没有,就很难将雪球抽样延续成功,这个不足体现了雪球抽样阅读过程中读者对雪球延续的主导权相对较低。所以它提醒我们,可以尝试在雪球抽样过程中主动叠加其他抽样方法,来强化雪球抽样的精准度与持续度。