textarchive.ru

Главная > Методическое пособие


социологический клуб город

Методическое пособие

Выборочный метод
в социологии

Редактор-составитель:

Андрей Ермолаев

Москва 2000

Содержание

1. Введение. 3

2. Суть выборочного метода и его роль в социологии. 3

3. Случайные (вероятностные) методы отбора. 5

3.1 Собственно случайная выборка. 5

3.1.1 Определение собственно случайной выборки. 5

3.1.2 Способы практической реализации собственно случайной выборки. 5

3.1.3 Вычисление ошибки репрезентативности для собственно случайной выборки. 6

3.1.4 Определение объема выборки. 9

3.1.5 Плюсы и минусы собственно случайной выборки. 10

3.2 Корректировка выборочных показателей. 10

4. Выборочные методы с внедрением элемента неслучайности. 12

4.1 Механическая выборка. 13

4.1.1 Практическая реализация. 13

4.1.2 Вычисление ошибки выборки. 13

4.1.3 Определение объема выборки. 13

4.1.4 Плюсы и минусы механического отбора. 13

4.2 Стратифицированная (районированная) выборка. 15

4.2.1 Практическая реализация. 15

4.2.2 Вычисление ошибки выборки. 15

4.2.3 Определение объема выборки. 17

4.2.4 Плюсы и минусы стратифицированного отбора. 18

4.3 Гнездовая (серийная) выборка. 20

4.3.1 Практическая реализация. 20

4.3.2 Вычисление ошибки выборки. 20

4.3.3 Определение объема выборки. 21

4.3.4 Плюсы и минусы этого метода. 21

5. Неслучайные (невероятностные) методы отбора. 22

5.1 Почему применяют неслучайный отбор? 22

5.2 Классификация методов неслучайного отбора. 22

5.2.1 Доступная выборка 22

5.2.2 Стихийная выборка. 23

5.2.3 Направленный отбор. 23

6. Литература. 25

1.Введение.

Настоящее методическое пособие является результатом серии семинаров по теме «Выборочное исследование в социологии», проведенной Социологическим клубом «Город» Государственного университета – Высшей Школы Экономики.

Цель работы – составить общее представление о выборочном методе и о возможностях его применения в социологии. Работа содержит классификацию типов случайной и неслучайной выборки, описание каждого метода, их преимущества и недостатки. Для каждого типа случайной выборки приведены формулы расчета ошибки репрезентативности (выборочного среднего) и объема выборки.

Предполагается, что читатель знаком с основами теории вероятности и математической статистики.

Авторы выражают огромную благодарность Ю. Н. Толстовой и А.О. Крыштановскому, за помощь в проведении и организации семинаров, подборе материала и постоянные консультации.

2.Суть выборочного метода и его роль в социологии.

Одной из задач, которые стоят перед социологом при проведении исследования, является сбор необходимых эмпирических данных об объекте исследования. Множество элементов, составляющих объект исследования называют генеральной совокупностью (ГС). Наиболее простым, на первый взгляд, способом сбора данных является сплошное обследование ГС. Однако применение сплошного обследования не всегда представляется возможным. В этом случае применяется выборочное обследование. Суть выборочного метода заключена в том, что обследованию подвергается только часть элементов ГС, которая называется выборочной совокупностью (ВС). Как писал профессор А. Кауфман , «изобретателем выборочного была сама жизнь» [4]. Действительно, еще до теоретического обоснования возможностей применения выборочного метода, статистики были вынуждены проводить выборочные обследования. Основными причинами для этого были отсутствие времени и средств.

Выборочный метод позволяет не только сократить временные и материальные затраты на проведения исследования, но и повысить достоверность результатов исследования [6, 16]. Это утверждение может вызвать недоумение: как можно получить более достоверные данные, обследовав менее половины ГС? Достоверность полученной информации может быть не только не ниже, чем при сплошном обследовании, но и выше вследствие возможности привлечения персонала более высокого класса и применения различных процедур контроля качества получаемой информации.

Кроме того выборочный метод имеет более широкую область применения [там же]. Широта области применения выборочного метода объясняется тем, что небольшой (по сравнению с ГС) объем выборки позволяет использовать более сложные методы обследования, включая использование различных технических средств (например, видео- и аудиоаппаратуры).

Следует различать единицы отбора и единицы наблюдения. Единицами отбора являются единицы или группы единиц ГС отбираемые на каждом этапе формирования ВС. Единицы наблюдения – это отобранные единицы ГС, характеристики которых непосредственно измеряются. Если выборка проходит в несколько этапов (многоступенчатая выборка), то единицы отбора и единицы наблюдения могут не совпадать. Мы будем рассматривать только одноступенчатую выборку, т.е. выборку, проходящую в один этап.

Развитие теории вероятностей позволило теоретически обосновать возможность применения выборочного метода. В основе теоретического обоснования выборочного метода лежит так называемый закон больших чисел. Физический смысл этого закона можно выразить следующим образом:

«при очень большом числе случайных явлений средний их результат практически перестает быть случайным и может быть предсказан с большой степенью определенности» [, 399].

Также это дало возможность определять ошибку репрезентативности. Репрезентативностью ВС называется ее способность адекватно представлять (репрезентировать) характеристики ГС. Ошибкой репрезентативности, как правило, называют отклонение выборочного среднего значения признака от генерального. Важно учитывать, что при помощи выборочного метода никогда нельзя получить абсолютно точную оценку наблюдаемого признака, всегда существует вероятность ошибки, но, если вероятность ошибки мала, то она скорее всего не произойдет.

Разделяют два типа ошибок. Случайная (статистическая) ошибка – это ошибки, которые возникают вследствие случайной вариации значений, вызванной тем, что наблюдается только часть единиц, а не вся ГС [6, 379]. Случайные ошибки уменьшаются с увеличением объема ВС. Случайную ошибку можно измерить методами математической статистики, если при формировании ВС соблюдался принцип случайности. Принцип случайности заключается в следующем: каждый элемент ГС имеет равную и отличную от нуля вероятность попасть в ВС [9, 100]. Иными словами, термин «случайный» употребляется здесь и далее как синоним слова «равновероятный». Для соблюдения принципа случайности формирование выборочной совокупности должно проходить по строго определенным правилам, которые составляют метод формирования выборочной совокупности.

На практике принцип случайности соблюсти очень сложно, а иногда просто невозможно, что приводит к появлению систематической ошибки. Систематическая ошибка – это неконтролируемые перекосы в распределении выборочных наблюдений1 [1, 132]. Число опрошенных не влияет на величину систематической ошибки.

Общая типология методов отбора представлена на рис. 1. Рассмотрим их.

Рисунок 1. Типология методов отбора.

3.Случайные (вероятностные) методы отбора.

3.1Собственно случайная выборка.

Собственно случайная выборка лежит в основе всех остальных типов выборки, которые будут рассмотрены далее.

3.1.1Определение собственно случайной выборки.

Выборка называется собственно случайной, если при извлечении выборки объема n все возможные комбинации из n элементов, которые могут быть получены из генеральной совокупности объема N, имеют равную вероятность быть извлеченными [16]

По определению, при собственно случайной выборке выполняется принцип случайности.

3.1.2Способы практической реализации собственно случайной выборки.

Отбор производится с помощью жеребьевки, таблицы (либо генератора) случайных чисел. Главный принцип – случайность, т.е. все единицы генеральной совокупности имеют равную вероятность попасть в выборочную совокупность.

  1. Принцип жеребьевки. Каждый элемент генеральной совокупности заносится на бумажку (это могут быть фамилии, адреса, просто номера (в этом случае выпавшие номера ставят в соответствие с людьми в списках) и т.д.), затем бумажки помещаются в барабан, перемешиваются и не глядя вытаскиваются.

  2. Принцип таблицыслучайных чисел. Начиная с любого места таблицы, берем четыре следующих друг за другом числа. Эти числа и будут номерами людей в списке, которых следует отобрать в выборку (числа, превышающие численность генеральной совокупности, опускаются) [1, 101].

  3. Принцип генератора случайных чисел. Это то же самое, что и таблицы случайных чисел, только числа вырабатываются компьютером (для этого существует специальная программа).

Различают повторную и бесповторную выборку. При повторном отборе каждый выбранный элемент возвращается в ГС. При бесповторном отборе выбранный элемент не возвращается в ГС2.

Также используются различные методы моделирования случайности.

  1. Механическая выборка требует список характеристик респондентов (фамилии, адреса, телефоны и т.д.). Из этого списка через равные промежутки люди отбираются в выборку. Этот промежуток называется шагом выборки.

[3, 19].

Начало отбора выбирается случайным образом в пределах шага выборки. Например, если шаг выборки равен 20, то начинать отбор надо с любого числа от 1 до 20.

  1. Территориальный отбор используется, когда нет основы выборки или ее составление сопряжено с большими трудностями [9, 104 111].

3.1.3Вычисление ошибки репрезентативности для собственно случайной выборки.

Пусть нам необходимо оценить средний возраст некоторой группы людей по ограниченному числу наблюдений n. Оценкой среднего значения непрерывной случайной величины является математическое ожидание:

.

Естественной оценкой математического ожидания является среднее арифметическое:

.

От оценки необходимо потребовать следующие свойства:

  1. состоятельность – оценка называется состоятельное, если при увеличении числа опытов оценка сходится по вероятности с искомым параметром,

  2. несмещенность – оценка называется несмещенной, если выполнялось условие

,

  1. эффективность – оценка называется эффективной, если ее дисперсия минимальна по сравнению с другими.

Среднее арифметическое обладает этими свойствами3.

Оценка параметра является функцией от случайных величин , , … ,, поэтому сама является случайной величиной. Другими словами, мы можем сделать множество выборок, для каждой из которых значение оценки будет различно. По закону больший чисел распределение оценки является нормальным с математическим ожиданием

и дисперсией

4,

где - генеральная дисперсия.

Тогда можно рассчитать вероятность того, что попадет в интервал . Поскольку нам неизвестна величина , то мы будем говорить о вероятности, с которой интервал накроет . Эта которая равна площади под графиком функции распределения случайной величины (см. рис. 2):

.

Рисунок 2. Распределение выборочной оценки среднего.

Приведем это распределение к стандартному виду.

Произведем замену переменной:

.

Справа получили функцию Лапласа, которая табулирована (см. Приложение):

.

Нам не известно значение , поэтому заменим его на . Но в этом случае нужно использовать не нормальное распределение, а распределение Стьюдента.

,

где

При больших объемах выборки вид распределения Стьюдента приближается к виду нормального распределения, поэтому для больших выборок также можно использовать функцию Лапласа.

Для повторной выборки

(1).

Для бесповторной выборки необходимо внести поправку на конечность ГС

(2).

Для большой ГС (объем ВС составляет менее 5% от ГС) поправкой на конечность совокупности можно пренебречь.

Про коэффициент доверия следует сказать отдельно. Этот коэффициент исследователь выбирает сам. Чем меньше , тем меньше доверительный интервал, но тем меньше и вероятность того, что оценка не выйдет за пределы доверительного интервала.

Пример 1. Пусть была произведена выборка 1600 человек. Средний возраст по выборке – 30 лет, среднеквадратическое отклонение – 10 лет. Необходимо найти доверительный интервал.

Прежде всего, необходимо задать надежность оценки. Возьмем 95% надежность. Поскольку выборка большая, воспользуемся таблицей значений функции Лапласа и найдем коэффициент доверия - 1,96.

Тогда

.

С вероятностью 95% истинное средний возраст по ГС находится в интервале от 29,51 лет до 30,49 лет.

Для биномиального распределения

,

где – доля признака, .

Тогда для повторной выборки из (1)

(3),

для бесповторной выборки из (2)

(4).

Пример 2. Из 200 опрошенных 55% - женщины. Действуем аналогично примеру 1. Выборку также можно считать большой. Тогда =1,96 для 95% надежности.

.

С вероятностью 95% доля женщин в ГС находится в интервале от 48% до 62%.

Таблица 1.

Формулы ошибки репрезентативности для собственно случайного отбора.[3, 16]

Предмет изучения.

Повторный отбор.

Бесповторный отбор.

Среднее значение признака.

Доля признака.

Где:

z – коэффициент доверия,

n – объем выборки,

- выборочная дисперсия,

N – объем генеральной совокупности,

- доля признака в выборочной совокупности.

3.1.4Определение объема выборки.

Определение объема выборки – это задача, обратная решенной выше задачи вычисления ошибки выборки.

Формулы для вычисления объема выборки при случайном отборе – просто преобразованные формулы ошибки репрезентативности. Они представлены в таблице 4.

Таблица 2.

Формулы для определения объема выборки при собственно случайном отборе.

Предмет изучения.

Повторный отбор.

Бесповторный отбор.

Среднее значение признака.

Доля признака.

Из (1) легко получить искомое n

.

Для нахождения объема выборки необходимо знать выборочное значение дисперсии признака. Его можно оценить несколькими способами [6, 95].

  1. Отобрать некоторое количество единиц из ГС. Рассчитать по полученной ВС . Рассчитать необходимый объем ВС и добрать недостающее число элементов .

  2. Воспользоваться результатами предыдущих исследований (если таковые проводились).

  3. Для биномиального распределения , где - доля признака, . Тогда из (3)

.

Произведение максимально, когда . Таким образом, мы получаем выборку с некоторым запасом [10]:

Точность и надежность выборки мы задаем, исходя из целей исследования. Например, насколько важное управленческое решение будет принято на основе результатов исследования.

3.1.5Плюсы и минусы собственно случайной выборки.

Плюсом данного метода является полное соблюдения принципа случайности и, как следствие – избежание систематических ошибок.

Случайная выборка обладает рядом недостатков, которые затрудняют ее применение на практике. Эти недостатки можно представить в трех пунктах:

  1. Необходимость наличия списка элементов генеральной совокупности. Обычно элементами генеральной совокупности являются люди; в этом случаев качестве списка могут выступать адреса, телефоны и т.д. Трудность здесь заключается в том, что получить такой список далеко не всегда представляется возможным. Следовательно, в тех случаях, когда невозможно получить список элементов генеральной совокупности, невозможно проводить и случайный отбор.

  2. Сложность проведения опроса. Процедура опроса при случайном отборе является очень громоздкой и требующей много времени. Ведь в результате случайного отбора исследователь получает на выходе список фамилий респондентов (телефонов, адресов и т.д.), которых необходимо опросить. Иными словами, интервьюерам приходится «бегать» за каждым респондентом и добиваться от него согласия ответить на «парочку вопросов».

Осложняет дело и то, что респондентов порой бывает не так просто достать; в случае отсутствия респондента его приходится посещать по нескольку раз (по крайней мере не менее трех раз).

Все вышеперечисленное ведет к повышенным временным затратам на проведение опроса. Временные затраты можно уменьшить только благодаря привлечению дополнительных интервьюеров, т.е. только за счет дополнительных денежных расходов. Помимо этого возникает еще так называемая проблема неответивших.

  1. Сравнительно большой объем выборки. Для получения результатов со сравнительно высокой степенью точности собственно случайный отбор требует достаточно большого объема выборки по сравнению с другими видами отбора. Другими словами, случайный отбор обладает меньшей степенью точности, что в конечном счете является причиной его меньшей эффективности5.

Существует два способа повышения эффективности выборки, которые :

  1. корректировка выборочных показателей,

  2. использование методов построения выборки с внедрением элемента неслучайности [6, 34].

Рассмотрим их.



Скачать документ

Похожие документы:

  1. Выборка Выборочный метод в социологии

    Документ
    Выборка. Выборочныйметод в социологии. Генеральная и выборочная совокупности. Генеральная совокупность – множество всех ... это уже большинство) Методы отбора в выборочном исследовании Случайный метод отбора Простой случайный отбор ...
  2. Социология том 1 методология и история социологии

    Учебники и учебные пособия
    ... математических методов в социологии. Контролирование репрезентативности - сравнение средних генеральной и выборочной совокупностей, ... 1968. Королев Ю.Т. Выборочныйметод в социологии. М., 1975. Кравченко А.И. Прикладная социология и менеджмент: Учеб. ...
  3. социология учебник

    Список учебников
    ... : Наукова думка, 1968. Королев Ю.Т. Выборочныйметод в социологии. — М., 1975. Кравченко А.И. Прикладная социология и менеджмент: Учеб. пособие ...
  4. Методы сбора и анализа маркетинговых данных

    Программа дисциплины
    ... . Глубинное интервью 20 Тема 14. Выборочныйметод в социологии 20 Тема 15. Математико-статистические ... . Sage, 1988. Тема 14. Выборочныйметод в социологии Генеральная и выборочная совокупности. Основные виды выборки. Ошибки ...
  5. СОЦИОЛОГИЯ Учебно-методическое пособие по самостоятельной работе для студентов всех специальностей

    Учебно-методическое пособие
    ... . Социологическое наблюдение. Эксперимент в социологическом исследовании. Выборочныйметод в социологии. Анализ документов. Контент-анализ. Обработка ...

Другие похожие документы..