Что такое выборка. Генеральная совокупность и выборочный метод. Пример нерепрезентативной выборки

Понятие выборки.

Лекция 4

1. Понятие выборки. 2. Типы выборок и способы построения выборок.3. Определение объема выборки.

Генеральная совокупность – множество всех элементов, обладающих некоторыми общими свойствами, существенными для их характеристики. Формирование выборки основывается на знании контура генеральной совокупности, под которым понимается список всех интересующих исследователя потребителей. Например, список всех домовладельцев определенного региона или города, или список всех торговых точек, реализующих продукты.

В зависимости от объема генеральной совокупности и целей исследования могут быть использованы методы сплошного или выборочного обследования. При проведении сплошного обследования изучаются все единицы совокупности. Данный метод может быть использован если количество элементов генеральной совокупности невелико (vip-клиенты в потребительских исследованиях, организации в исследованиях business-to- business).

Наиболее распространенным способом получения данных в маркетинговых исследованиях является выборочное наблюдение. Выполнение определенных правил отбора единиц в выборочную совокупность и соблюдение репрезентативности выборки позволяет распространять выборочные данные на генеральную совокупность.

При формировании выборки используются вероятностные и невероятностные (детерминированные) методы.

Вероятностная выборка (probability sampling) – выборка, в которую каждый элемент объекта исследования может попасть с заданной степенью вероятности. В вероятностных выборках каждый элемент генеральной совокупности известен и имеет определенную вероятность попасть в обследование. Следует отметить, что не представляется возможным точно рассчитать вероятности из-за отсутствия сведений о размере генеральной совокупности. Поэтому термин «определенная вероятность» скорее связан с правилами формирования выборки, чем со знанием точных размеров генеральной совокупности.

Детерминированная выборка (non-probability sampling) – выборка, в которую элементы попадают на основании заранее определённых предпочтений или суждений. В невероятностных выборках не выполняется условие равной вероятности попадания каждого объекта генеральной совокупности в выборку. Для этого типа выборок нельзя рассчитать ошибку выборки (погрешность). Но это не означат, что в ходе исследования будут получены неточные результаты. Невероятностные выборки требуют меньших временных и финансовых затрат. Часто невероятностные выборки используются для относительно малых генеральных совокупностей (тысячи, десятки тысяч потребителей).

Выделяются следующие виды детерминированных выборок:


· нерепрезентативные;

· преднамеренные;

· квотные;

· основной массив.

Нерепрезентативные (convenience sampling) выборки основаны на отборе наиболее доступных элементов (покупатели в магазинах, прохожие на улице и т.п.). Исследователь полагается на принцип принадлежности респондента к проектируемой генеральной совокупности.

Преднамеренные (judgemental sampling) выборки основаны на отборе вручную тех элементов, которые, по мнению исследователя, отвечают целям исследования. Разновидностью преднамеренной выборки является выборка по принципу «снежного кома» (snowball sampling). Она заключается в определении первоначальных элементов, каждый из которых указывает на несколько новых, и так далее. Такая выборка используется при обследовании объектов со специфическими признаками, занимающими невысокую долю в общем множестве аналогичных объектов, и тесно взаимодействующих между собой. Преднамеренные выборки имеют тот же основной недостаток, что и нерепрезентативная выборка – невозможность оценки её ошибки и низкая степень репрезентативности.

Квотная выборка - Квотные выборки (quota sampling) – детерминированные выборки, формируемые путём включения в выборку элементов в той же пропорции по основным характеристикам, в которой они присутствуют в общей исследуемой совокупности

один из наиболее популярных методов формирования выборки. При использовании квотного метода отбирают один или несколько признаков, по которым будет контролироваться выборка. Количество единиц в выборке, обладающих определенными характеристиками, должно быть пропорционально количеству таких единиц в генеральной совокупности. Считается, что при использовании метода квот можно делать выборку меньшего объема, чем при случайном отборе, так как квотный отбор дает почти полное совпадение выборочной и генеральной совокупностей по заданным параметрам, т.е. соблюдается свойство репрезентативности (представительности) выборки. Однако это утверждение невозможно подтвердить при помощи математических методов. Чаще всего в качестве параметров квотирования используются социально – демографические признаки (пол, возраст, образование, уровень доходов и т.п.).

Метод основного массива предполагает включение в выборку более 50% объектов генеральной совокупности. Преимущество опроса по методу основного массива состоит в том, что выборка имеет высокий удельный вес в генеральной совокупности. За счет этого удается устранить возможные ошибки. В принципе достаточно опросить большую долю респондентов генеральной совокупности, что минимизирует отличие выборочной средней от генеральной средней.

Вероятностные методы. Если единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной. Вероятностные методы включают в свой состав:

· простой случайный отбор;

· систематический отбор;

· кластерный отбор;

· стратифицированный отбор.

Простая случайная (simple random sampling, SRS)– выборка, в которой каждый элемент объекта исследования с равной вероятностью может попасть в выборочную совокупность Простейший метод формирования вероятностной выборки. Такая выборка формируется путём случайного равновероятного отбора элементов из их полного перечня. Основным недостатком такой выборки является необходимость обладания полным перечнем элементов исследуемой совокупности, что обеспечивается в практике маркетинговых исследований достаточно редко. При простой случайной выборке отбор производится из всей массы единиц генеральной совокупности без предварительного расчленения ее на какие-либо группы, и каждый элемент имеет одинаковую вероятность попадания в выборку (Р), которую можно рассчитать как отношение размера выборки к размеру генеральной совокупности. Например, если размер совокупности равен 10000 тыс. чел., а размер выборки – 600 чел., то вероятность попадания в выборку конкретного человека равна 6 % (400/10000 * 100). Наиболее простой способ организации случайной выборки – это жеребьевка, либо использование таблицы случайных чисел. При телефонном интервью компьютер может генерировать случайным образом телефонные номера, так как имеет генератор случайных чисел.

Выборка – это:

1) совокупность тех элементов объекта исследования, которая будет непосредственно изучаться;

2) способы и процедуры отбора элементов объекта исследования.

Генеральная совокупность – полная совокупность объектов, имеющих отношение к изучаемой проблеме. В социологических исследованиях в качестве Г.С. чаще всего выступают совокупности индивидов – население (города, страны и т.п.), социальная группа (молодежь, безработные, бизнесмены и т.п.), аудитория средств массовой коммуникации (СМК) и др. Однако во многих случаях Г.С. могут состоять из более крупных элементов (объектов) – семей (домохозяйств), академических групп, предприятий, религиозных общин, отдельных населенных пунктов или государств и т.п.

Выборочная совокупность – часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение о всей генеральной совокупности.

Для того, чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность выборка должна обладать свойством репрезентативности.

Репрезентативность – это способность выборки представлять изучаемую совокупность. Чем точнее состав выборки представляет совокупность по изучаемым вопросам, тем выше ее репрезентативность.

ПРИМЕР: Репрезентативность можно проиллюстрировать следующим примером. Предположим, совокупность - это все учащиеся школы (600 человек из 20 классов, по 30 человек в каждом классе). Предмет изучения – отношение к курению. Выборка, состоящая из 60 учеников старших классов гораздо хуже представляет совокупность, чем выборка из тех же 60 человек, в которую войдут по 3 ученика из каждого класса. Главной причиной тому - неравное возрастное распределение в классах. Следовательно, в первом случая репрезентативность выборки низкая, а во втором случае репрезентативность высокая (при прочих равных условиях).

Типы выборок

1.Случайная выборка.

1.1.Простой случайный отбор.

1.2.Метод систематической (или механической) выборки.

1.3.Серийная (гнездовая или кластерная) выборка.

1.4.Стратифицированная выборка.

2. Неслучайная выборка (невероятностная).

2.2. Стихийная выборка.

2.3. Многоступенчатая и одноступенчатая выборки.

1.Случайная выборка.

Особенность случайной выборки заключается в том, что все единицы генеральной совокупности имеют равную вероятность попасть в выборочную совокупность. При случайной выборке выполняется принцип случайности . Основой выборки могут выступать списки работников предприятия, телефонные справочники, регистрационные списки владельцев автомобилей, списки избирателей на избирательных участках, домовые книги, а так же составленные самим социологом различные списки в зависимости от целей исследования (список улиц, на которых потом проводится отбор респондентов).

Случайная выборка обычно применяется при опросах общественного мнения перед выборами, референдумами и другими массовыми мероприятиями.

Плюсом данного метода является полное соблюдения принципа случайности и, как следствие – избежание систематических ошибок.

Недостатки данного метода:

– Необходимость наличия списка элементов генеральной совокупности.

– Сложность проведения опроса.

– Сравнительно большой объем выборки.

Часто бывает так, что необходимо проанализировать какое-либо конкретное социальное явление и получить информацию о нем. Такие задания часто возникают в ста...

Выборка - это... Определение, виды, методы и результаты выборки

От Masterweb

09.04.2018 16:00

Часто бывает так, что необходимо проанализировать какое-либо конкретное социальное явление и получить информацию о нем. Такие задания часто возникают в статистике и при статистических исследованиях. Проверить полностью определенное социальное явление чаще всего бывает невозможным. Например, как узнать мнение населения или всех жителей определенного города по какому-либо вопросу? Спрашивать абсолютно всех – дело практически невозможное и очень трудоемкое. В таких случаях нам и необходима выборка. Это именно то понятие, на котором основаны практически все исследования и анализы.

Что такое выборка

При анализе конкретного социального явления необходимо получить информацию о нем. Если взять любое исследование, то можно заметить, что исследованию и анализу подлежит не каждая единица совокупности объекта исследования. Во внимание берется только определенная часть всей этой совокупности. Вот этот процесс и является выборкой: когда исследуются только определенные единицы из множества.

Конечно же, многое зависит от вида выборки. Но есть и основные правила. Главное из них гласит, что отбор из совокупности должен быть абсолютно случайным. Единицы совокупности, которые будут использованы, не должны быть выбраны из-за какого-либо критерия. Грубо говоря, если необходимо набрать совокупность из населения определенного города и отобрать только мужчин, то в исследовании будет ошибка, потому что отбор был проведен не случайно, а отобран по гендерному признаку. Практически все методы выборки основаны на этом правиле.

Правила выборки

Для того чтобы отобранная совокупность отражала основные качества всего явления, она должна быть построена по конкретным законам, где основное внимание необходимо уделять следующим категориям:

  • выборка (выборочная совокупность);
  • генеральная совокупность;
  • репрезентативность;
  • ошибка репрезентативности;
  • единица совокупности;
  • способы построения выборки.

Особенности выборочного наблюдения и составления выборки заключаются в следующем:

  1. Все полученные результаты основаны на математических законах и правилах, то есть при правильном проведении исследования и при правильных расчетах результаты не будут искажены по субъективному признаку
  2. Дает возможность значительно быстрее и с меньшими затратами времени и ресурсов получить результат, изучая не весь массив событий, а только их часть.
  3. Может быть применено для изучения различных объектов: от конкретных вопросов, например, возраст, пол интересующей нас группы, к изучению общественного мнения или уровня материального обеспечения населения.

Выборочное наблюдение

Выборочное - это такое статистическое наблюдение, при котором исследованию подвергается не вся совокупность изучаемого, а лишь некоторая, отобранная определенным образом ее часть, а полученные результаты изучения этой части распространяются на всю совокупность. Эта часть называется выборочной совокупностью. Это единственный способ изучения большого массива объекта исследования.

Но выборочное наблюдение может использоваться только в тех случаях, когда необходимо исследовать лишь малую группу единиц. Например, при исследовании соотношения мужчин к женщинам в мире, будет использоваться выборочное наблюдение. По понятным причинам – взять во внимание каждого жителя нашей планеты невозможно.

А вот при таком же исследовании, но не всех жителей земли, а определенного 2 «А» класса в конкретной школе, определенного города, определенной страны, может обойтись без выборочного наблюдения. Ведь проанализировать весь массив объекта исследования – вполне возможно. Необходимо посчитать мальчиков и девочек этого класса - вот и будет соотношение.


Выборочная и генеральная совокупность

На самом деле все не так сложно, как звучит. В любом объекте изучения есть две системы: генеральная и выборочная совокупность. Что же это такое? Все единицы относятся к генеральной. А к выборочной – те единицы общей совокупности, которые были взяты для выборки. Если все правильно сделано, то отобранная часть будет составлять уменьшенный макет всей (генеральной) совокупности.

Если говорить о генеральной совокупности, то можно выделить всего две ее разновидности: определенная и неопределенная генеральная совокупность. Зависит от того, известно ли общее количество единиц данной системы или нет. Если это определенная генеральная совокупность, то выборку будет делать легче из-за того, что известно, какой процент от общего количества единиц будет составлять выборка.

Этот момент очень необходим в исследованиях. Например, если необходимо исследовать процент недоброкачественной продукции кондитерских изделий на конкретном заводе. Допустим, что генеральная совокупность уже определена. Точно известно, что в год это предприятие производит 1000 кондитерских изделий. Если сделать выборку 100 случайных кондитерских изделий из этой тысячи и отправить их на экспертизу, то погрешность будет минимальной. Грубо говоря, исследованию подлежало 10 % всей продукции, и по результатам можем, приняв во внимание ошибку репрезентативности, говорить о недоброкачественности всей продукции.

А если провести выборку 100 кондитерских изделий из неопределенной генеральной совокупности, где их на самом деле было, допустим, 1 млн единиц, то результат выборки и самого исследования будет критически неправдоподобным и неточным. Чувствуете разницу? Поэтому определенность генеральной совокупности в большинстве случаев крайне важна и очень сильно влияет на результат исследования.


Репрезентативность совокупности

Итак, теперь один из самых главных вопросов - какой должна быть выборка? Это самый главный момент исследования. На этом этапе необходимо рассчитать выборку и отобрать единицы из общего числа в нее. Совокупность была отобрана правильно, если определенные особенности и характеристики генеральной совокупности остается и в выборочной. Это называется репрезентативностью.

Иными словами, если после отбора часть сохраняет те же самые тенденции и особенности что и все количество исследуемого, то такая совокупность называется репрезентативной. Но не каждая определенная выборка может быть отобрана из репрезентативной совокупности. Бывают и такие объекты исследования, выборка которых просто не может быть репрезентативной. Отсюда и возникает понятие ошибки репрезентативности. Но об этом поговорим подробнее чуть больше.

Как сделать выборку

Итак, чтобы репрезентативность была максимальной, выделяют три основные правила выборки:

  1. Самым уникальным показателем числа выборки считается 20 %. Статистическая выборка в 20 % будет практически всегда давать результат максимально приближенный к действительности. В то же самое время нет необходимости переносить в собранную большую часть генеральной совокупности. 20 % выборки – это тот показатель, который выработан многими исследованиями. Приведем еще немного теории. Чем больше выборка, тем меньше ошибка репрезентативности и точнее результат исследования. Чем ближе будет выборочная совокупность к генеральной по количеству единиц, тем более точными и правильными будут результаты. Ведь если исследовать всю систему, тогда результат будет 100 %. Но здесь уже нет выборки. Это те исследования, в которых исследуется весь массив, все единицы, поэтому это нас не интересует.
  2. В случае нецелесообразности обработки 20 % генеральной совокупности допускается изучение единиц совокупности в количестве не менее 1001. Это также один из показателей исследования массива объекта исследования, который выработался со временем. Конечно же, он не даст точных результатов при больших массивах исследования, но максимально приблизит к возможной точности выборки.
  3. В статистике существует множество формул и сведенных таблиц. В зависимости от объекта исследования и от критерия выборки, существует целесообразность выбора той или иной формулы. Но этот пункт используется в сложных и многоэтапных исследованиях.

Погрешность (ошибка) репрезентативности

Главной характеристикой качества выбранной выборки является понятие «погрешности репрезентативности». Что же это такое? Это определенные расхождения между показателями выборочного и сплошного наблюдения. По показателям погрешности репрезентативность делят на надежную, обычную и приближенную. Иначе говоря, допустимыми являются отклонения в размере до 3 %, от 3 до 10 % и от 10 до 20 % соответственно. Хотя в статистике желательно, чтобы погрешность не превышал 5-6 %. В противном случае есть повод говорить о недостаточной репрезентативности выборки. Для вычисления погрешности репрезентативности и того, как она влияет на выборочную или генеральную совокупность, во внимание берутся многие факторы:

  1. Вероятность, с которой необходимо получить точный результат.
  2. Количества единиц выборочной совокупности. Как уже упоминалось ранее, чем меньше единиц составит выборка, тем больше будет ошибка репрезентативности, и наоборот.
  3. Однородность исследуемой совокупности. Чем более разнородной является совокупность, тем больше будет погрешность репрезентативности. Возможность совокупности быть репрезентативной зависит от однородности всех ее составляющих единиц.
  4. Способ отбора единиц в выборочную совокупность.

В конкретно заданных исследованиях процент погрешности среднего значения обычно задается самим исследователем на основании программы наблюдения и согласно данным ранее проведенных исследований. Как правило, считается допустимой предельная ошибка выборки (ошибка репрезентативности) в пределах 3-5 %.


Больше – не всегда лучше

Также стоит помнить, что главное при организации выборочного наблюдения - это доведение его объема до допустимого минимума. При этом не следует стремиться к чрезмерному уменьшению границ погрешности выборки, так как это может привести к неоправданному увеличению объема данных выборки и, следовательно, к повышению расходов на проведение выборочного наблюдения.

В то же время нельзя и чрезмерно увеличивать размер погрешности репрезентативности. Ведь в этом случае, хотя и произойдет уменьшение объема выборочной совокупности, это приведет к ухудшению достоверности полученных результатов.

Какие вопросы обычно ставится перед исследователем

Любое исследование если и проводится, то для какой-то цели и для получения каких-то результатов. При проведении выборочного исследования, как правило, ставятся начальные вопросы:

  1. Определение необходимого количества единиц выборочной совокупности, то есть то, сколько единиц будет исследоваться. К тому же, для точного исследования совокупность должна быть репрезентативной.
  2. Расчет погрешности репрезентативности с установленным уровнем вероятности. Сразу стоит отметить, что выборочных исследований не бывает с уровнем вероятности 100 %. Если та инстанция, которая проводила изучение определенного сегмента, утверждает, что их результаты точны с вероятностью 100 %, то это ложь. Многолетняя практика уже установила процент вероятности правильно проведенного выборочного исследования. Этот показатель равняется 95,4 %.

Способы отбора единиц исследования в выборку

Не каждая выборка является репрезентативной. Иногда один и тот же признак по-разному выражен в целом и в ее части. Для достижения требований репрезентативности целесообразным является использование различных приемов создания выборки. Причем использование того или иного способа зависит от конкретных обстоятельств. Среди таких приемов создания выборки выделяют:

  • случайный отбор;
  • механический отбор;
  • типичный отбор;
  • серийный (гнездовой) отбор.

Случайный отбор представляет собой систему мероприятий, направленных на случайный отбор единиц совокупности, когда вероятность попасть в выборку является равной для всех единиц генеральной совокупности. Этот прием целесообразно применять только в случае однородности и небольшого количества присущих ей признаков. В противном случае некоторые характерные черты рискуют быть не отраженным в выборке. Признаки случайного отбора лежат в основе всех других способов построения выборки.

При механическом отбор единиц проводится через определенный интервал. Если необходимо сформировать выборку конкретных преступлений, можно изымать из всех карточек статистического учета зарегистрированных преступлений каждую 5-ю, 10-ю или 15-ю карточку в зависимости от их общего количества и имеющихся размеров выборки. Недостатком этого способа является то, что перед отбором необходимо иметь полный учет единиц совокупности, затем нужно провести ранжирование и только после этого можно проводить выборку с определенным интервалом. Этот метод занимает много времени, поэтому он и не часто используется.


Типичный (районированный) отбор – вид выборки, при котором генеральную совокупность разделяют на однородные группы по определенному признаку. Иногда исследователи употребляют вместо «групп» другие термины: «районы» и «зоны». Затем из каждой группы в случайном порядке отбирается определенное количество единиц пропорционально удельному весу группы в общей совокупности. Типичный отбор часто осуществляется в несколько этапов.

Серийный отбор - это такой метод, при котором отбор единиц проводится группами (сериями) и обследованию подлежат все единицы отобранной группы (серии). Преимуществом этого способа является то, что иногда отобрать отдельные единицы сложнее, чем серии, например, при изучении личности, которая отбывает наказание. В рамках отобранных районов, зон применяется изучение всех единиц без исключения, например, изучение всех лиц, отбывающих наказание в каком-то определенном учреждении.

Улица Киевян, 16 0016 Армения, Ереван +374 11 233 255

Большинство социологических исследований носит не сплошной, а выборочный характер: по строгим правилам отбирается определенное количество людей, отражающих по социально-демографическим признакам структуру изучаемого объекта. Такое исследование именуется выборочным .

Выборочное обследование представляет собой способ систематического сбора данных о поведении и установках людей посредством опроса специально подобранной группы респондентов, дающих информацию о себе и своем мнении. Оно является более экономичным и не менее надежным методом, чем сплошное ис­следование, хотя требует более изощренной методики и техники.

Правильная выборка - залог успеха и необходимая предпосылка любого опроса, если это не общенациональная перепись населения. Если социолог неправильно составил выборочную совокупность, т.е. группу людей, которую собирается опросить, результаты исследования окажутся неверными, а потому и никому не нужными.

Почему нерационально и практически невозможно опрашивать всех людей, составляющих объект исследования? Можно приблизительно рассчитать, во что обойдется сплошной опрос взрослых жителей хотя бы одного городского района с численностью населения, скажем, 200 тыс. чел. Учитывая, что один анкетер (интервьюер) в состоянии опросить не более трех человек в час, при семичасовом рабочем дне его выработка составит 20 анкет. Это означает, что для полного сбора информации нам потребуется 85 тыс. человеко-дней. Мы хотим завершить опрос за 10 дней и заплатить за каждое интервью 20 руб. таким образом, нам необходимо привлечь 8,5 тыс. помощников и заплатить 340 тыс. рублей. Какой бы важной ни была информация, она не стоит таких затрат, поэтому социологи прибегают к выборочным методам опроса.

Суть выборочного метода заключается в том, что по определённым, довольно строгим, правилам из общей численности людей, называемой генеральной совокупностью (население всей страны, всё городское население, жители одного района, только молодёжь и т.д.) отбирается ограниченное число людей, которое призвано в качестве своеобразной модели, воспроизводить структуру объекта. На языке социологов эта группа людей, а также процедура по её определению называется выборкой. Правильное построение выборочной совокупности – основа и гарантия высокой точности социологического исследования.

Программа включает определение обследуемой совокупности, поскольку абсолютное большинство исследований носит не сплошной, а выборочный характер. Очень важно грамотно, по определённым правилам, отобрать необходимое количество людей для опроса.

Генеральная совокупность – вся совокупность изучаемых элементов, имеющих одинаковые социальные характеристики, которые свидетельствуют о принадлежности к одному объекту, т.е. это весь объект на который распространяются выводы исследования. Он обычно локализован во времени, территориально и т.д. Объем генеральной совокупности в формулах и таблицах обычно обозначается символом N, а отобранная из генеральной совокупности часть её членов носит название выборки, или выборочной совокупности будет обозначаться маленькой n.

Выборочная совокупность – это часть, уменьшенная модель генеральной совокупности. Основное правило её составления гласит: Каждый элемент генеральной совокупности должен иметь одинаковые шансы попасть в выборку. Но как этого добиться? Прежде всего, надо узнать как можно больше свойств, или параметров ген. совокупности, например разброс в возрасте, доходах, национальности, местах проживания респондентов. Разброс в возрасте респондентов называется вариацией , конкретные величины возраста – значениями , а совокупность всех значений образует переменную. Таким образом, переменная «возраст» имеет значения от 0 до 70 (средняя продолжительность жизни) и более лет. Значения можно группировать в интервалы: 0 – 5 , 6 – 10 , 11 – 15 лет и т.д. все зависит от задач исследования.

Единицы анализа или отбора –

Опыт показал, что правильно произведённая выборка хорошо представляет или репрезентирует (от лат. Represento- представляю) структуру и состояние генеральной совокупности. Она должна быть репрезентативной – т.е. пропорционально воспроизводить все основные характеристики генеральной совокупности, и должна гарантировать для каждого элемента генеральную совокупность, равную вероятность попасть в выборочную. Процесс выборки основан на взаимосвязи и взаимообусловленности качественных характеристик и признаков социального объекта, также основан на правомерности выводов о целом на основании изучения его части, при условии, что по своей структуре эта часть является микромоделью целого. Другими словами, репрезентативной выборкой в социологии считается такая выборочная совокупность, основные характеристики которой полностью совпадают (представлены в той же пропорции или с той же частотой) с такими же характеристиками генеральной совокупности.

Репрезентативным считается такое исследование, при котором отклонение в выборочной совокупности по контрольным признакам не превышает 5%.

Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки, после чего решается вопрос о типе выборки, методе выборки, структуре выборки.

Типами выборки называются основные разновидности статистической выборки: случайная – вероятностная (если генеральная совокупность – однородные элементы) и неслучайная - невероятностная(целенаправленная, квотная).

Метод выборки – это способ построения того типа выборки, название которого этот метод носит, например, метод вероятностной выборки.

Для обеспечения репрезентативности требуется полный и точный перечень единиц выборочной совокупности, этот перечень образует основу выборки .Элементы, предназначенные для отбора, называются единицами отбора , элемент ген. совокупности, с которого непосредственно ведётся сбор информации, называется единицей наблюдения, - это отдельный человек.

Единицы анализа – это элементы выборной, илиобследуемой совокупности (индивиды, группы).

Если основа выборки включает список единиц отбора, то структура выборки подразумевает их группировку, отражающую процентное распределение ген. совокупности по каким-то важным признакам, например распределение индивидов по профессии, квалификации, полу или возрасту. Структура выборки - это процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность. Так если в ген. совокупности, например, 30% молодежи, 50% людей среднего возраста и 20% пожилых людей, то и в выборочной совокупности должны соблюдаться те же самые процентные пропорции трех возрастов.

ТИПЫ И МЕТОДЫ ВЫБОРКИ

В статистической науке, в зависимости от способа отбора различают выборки следующих типов:

1) Случайная выборка с возвратом , или другое названиеслучайно-повторная.

2) Случайная выборка без возврата , или случайно-бесповторная.

3) Механическая.

4) Типическая.

5) Серийная.

При формировании выборки используются вероятностные (случайные) и невероятностные (неслучайные) методы. Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной, другими словами – это выборка, для которой каждый элемент генеральной совокупности имеет определенную, заранее заданную вероятность быть отобранным. Это позволяет исследователю рассчитать, насколько правильно выборка отражает генеральную совокупность, из которой она выделена (спроектирована). Такую выборку иногда называют ещё случайной.

Если эта вероятность неизвестна, то выборка называется невероятностной. (неслучайной, целевой, целенаправленной).

Вероятностная выборка – её модель связана с понятием статистической вероятности. Вероятность некоторого ожидаемого события есть отношение числа ожидаемых событий к числу всех возможных. При этом общее число событий должно быть достаточно большим (статистически значимым).

Р =100/600=1/6 где Р – вероятность ожидаемого события.

Вероятность того, что любое из событий обязательно произойдет, всегда равна единице, т.е. является достоверным утверждением.

Вероятностные методы включают:

Простой случайный отбор,

Систематический отбор,

Кластерный отбор,

Стратифицированный отбор.

Простой случайный отбор может осуществляться с помощью формирования выборки вслепую (лотерейный метод) и с помощью таблицы случайных чисел. В одном случае вы осуществляете свой выбор не глядя, в другом – всё осознавая, но чтобы самому не вмешиваться и ничего не испортить, обращаемся к специальным таблицам. Простой случайный отбор подразделяется на две разновидности уже по другому критерию, а именно, по возвращению или невозвращению лотерейного шара (вместо него может быть фамилия респондента) обратно в корзину. В этом случае выделяют:

Случайный повторный (с возвращением) отбор,

Случайный бесповоротный (без возвращения) отбор.


Методы выборки вероятностной (случайной) (первые два даны выше)

1) Метод механической выборки (для больших генеральных совокупностей , подразумевается однородность элементов ген. совокупности, отбор из ген. совокупности через равные промежутки необходимого количества элементов). Все элементы генеральной совокупности сводятся в единый список, и из него, через равные интервалы, отбирается соответствующее число респондентов.

K – Шаг отбора рассчитывается:

К=N/n где N - величина (или численность) ген. совокупности, аn – величина выборочной совокупности.

2) Метод серийной выборки (удобный и точный), разбиение ген. совокупности на однородные части с последующим отбором внутри серий.

Если имеется возможность разбить ген. совокупность на однородные части (серии) по заданному признаку, то отбор респондентов может быть осуществлен из каждой серии отдельно. При этом число респондентов, отбираемых из серии пропорционально общему числу элементов в ней. Выделение респондентов в однородные группы.

Из каждой серии можно осуществить отбор единиц анализа при помощи собственно-случайной или механической выборки. Количество респондентов, подлежащих отбору из каждой серии в отдельности.

3) Метод гнездовой выборки (малые группы) – отбор в качестве единиц исследования не отдельных респондентов, а групп. С последующим сплошным опросом в отобранных группах. Гнездовая выборка репрезентативна в том случае, если состав групп в максимальной степени схож по основным демографическим признакам респондентов. Списки или карточки составляются только для групп (бригады, участки, студенты, класс и др.) представляющие собой объект с точки зрения социологического изучения проблемы.

Элементов, которая охватывается экспериментом (наблюдением, опросом).

Характеристики выборки:

  • Качественная характеристика выборки - что именно мы выбираем и какие способы построения выборки мы для этого используем.
  • Количественная характеристика выборки - сколько случаев выбираем, другими словами объём выборки.

Необходимость выборки:

  • Объект исследования очень обширный. Например, потребители продукции глобальной компании - огромное количество территориально разбросанных рынков.
  • Существует необходимость в сборе вторичной информации.

Объём выборки

Объём выборки - число случаев, включённых в выборочную совокупность.

Выборки можно условно разделить на большие и малые, так как в математической статистике используются различные подходы в зависимости от объёма выборки. Считается, что выборки объёма больше 30 можно отнести к большим .

Зависимые и независимые выборки

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми . Примеры зависимых выборок:

  • пары близнецов,
  • два измерения какого-либо признака до и после экспериментального воздействия,
  • мужья и жёны
  • и т. п.

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми , например:

  • мужчины и женщины ,
  • психологи и математики .

Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.

Сравнение выборок производится с помощью различных статистических критериев :

  • Критерий Пирсона (χ 2 )
  • Критерий Стьюдента (t )
  • Критерий Вилкоксона (T )
  • Критерий Манна - Уитни (U )
  • Критерий знаков (G )
  • и др.

Репрезентативность

Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной. Выборка будет репрезентативной при обследовании большой группы людей, если внутри этой группы есть представители разных подгрупп, только так можно сделать верные выводы.

Пример нерепрезентативной выборки

  1. Исследование с экспериментальной и контрольной группами, которые ставятся в разные условия.
    • Исследование с экспериментальной и контрольной группами с привлечением стратегии попарного отбора
  2. Исследование с использованием только одной группы - экспериментальной.
  3. Исследование с использованием смешанного (факторного) плана - все группы ставятся в разные условия.

Типы выборок

Выборки делятся на два типа:

  • вероятностные
  • невероятностные

Вероятностные выборки

  1. Простая вероятностная выборка:
    • Простая повторная выборка. Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. На основе списка генеральной совокупности составляются карточки с номерами респондентов. Они помещаются в колоду, перемешиваются и из них наугад вынимается карточка, записывается номер, потом возвращается обратно. Далее процедура повторяется столько раз, какой объём выборки нам необходим. Минус: повторение единиц отбора.

Процедура построения простой случайной выборки включает в себя следующие шаги:

1) необходимо получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки;

2) определить предполагаемый объём выборки, то есть ожидаемое число опрошенных;

3) извлечь из таблицы случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел. Эти случайные числа могут генерироваться компьютерной программой.

4) выбрать из списка-основы те наблюдения, номера которых соответствуют выписанным случайным числам

  • Простая случайная выборка имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования можно распространять на изучаемую совокупность. Большинство подходов к получению статистических выводов предусматривают сбор информации с помощью простой случайной выборки. Однако метод простой случайной выборки имеет как минимум четыре существенных ограничения:

1) нередко сложно создать основу выборочногo наблюдения, которая позволила бы провести простую случайную выборку.

2) результатом применения простой случайной выборки может стать большая совокупность, либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных.

3) результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов.

4) в результате применения SRS может сформироваться нерепрезентативная выборка. Хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них крайне некорректно представляют изучаемую совокупность. Вероятность этого особенно велика при небольшом объёме выборки.

  • Простая бесповторная выборка. Процедура построения выборки такая же, только карточки с номерами респондентов не возвращаются обратно в колоду.
  1. Систематическая вероятностная выборка. Является упрощенным вариантом простой вероятностной выборки. На основе списка генеральной совокупности через определённый интервал (К) отбираются респонденты. Величина К определяется случайно. Наиболее достоверный результат достигается при однородной генеральной совокупности, иначе возможны совпадение величины шага и каких-то внутренних циклических закономерностей выборки (смешение выборки). Минусы: такие же как и в простой вероятностной выборке.
  2. Серийная (гнездовая) выборка. Единицы отбора представляют собой статистические серии (семья, школа, бригада и т. п.). Отобранные элементы подвергаются сплошному обследованию. Отбор статистических единиц может быть организован по типу случайной или систематической выборки. Минус: Возможность большей однородности, чем в генеральной совокупности.
  3. Районированная выборка. В случае неоднородной генеральной совокупности, прежде, чем использовать вероятностную выборку с любой техникой отбора, рекомендуется разделить генеральную совокупность на однородные части, такая выборка называется районированной. Группами районирования могут выступать как естественные образования (например, районы города), так и любой признак, заложенный в основу исследования. Признак, на основе которого осуществляется разделение, называется признаком расслоения и районирования.
  4. «Удобная» выборка. Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки - с группой студентов, спортивной командой, с друзьями и соседями. Если необходимо получить информацию о реакции людей на новую концепцию, такая выборка вполне обоснована. «Удобную» выборку часто используют для предварительного тестирования анкет.

Стратегии построения групп

Отбор групп для их участия в психологическом эксперименте осуществляется с помощью различных стратегий, которые нужны для того, чтобы обеспечить максимально возможное соблюдение внутренней и внешней валидности .

Рандомизация

Рандомизация , или случайный отбор , используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза , можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек - это будет случайным отбором (Гудвин Дж., с. 147)......

Попарный отбор

Попарный отбор - стратегия построения групп выборки, при котором группы испытуемых составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. Данная стратегия эффективна для экспериментов с использованием экспериментальных и контрольных групп с лучшим вариантом - привлечением близнецовых пар (моно - и дизиготных).