Каталог :: Социология

Реферат: Реферат по анализу данных в социологии

     
Оглавление Введение 3 1. Виды статистического анализа 5 1.1. Инструменты дескриптивного анализа_ 5 1.2. Статистический вывод 7 2. Анализ различий_ 13 2.1. Определение и интерпретация связей между двумя переменными_ 15 Заключение 21 Список используемой литературы_ 22 Введение Анализ данных начинается с перевода «сырых» данных в осмыслен­ную информацию и включает их введение в компьютер, проверку на предмет ошибок, кодирование, представление в матричной форме (та­булирование). Все это называется преобразованием исходных данных. Далее проводится статистический анализ, т.е. определяются средние величины, частоты, корреляционные и регрессионные соотношения, осуществляется анализ трендов. После сбора данных необходимо их преобразовать, т.е. привести к более сжатому виду, удобному для анализа и обладающему достаточной для заказчика информацией. Обычно закодированные исходные данные представляются в виде матрицы, столбцы которой содержат ответы на различные вопросы анкеты, а ряды — респондентов или изучаемые ситуации. Преобразование заключается в описании данных матрицы на языке ограниченного числа мер, характеризующих собранные данные. Табулирование помогает исследователю понять, что означают собран­ные данные. Одновременный анализ двух и более категорий опрашива­емых называется перекрестной табуляцией. Исследователь, осуществляя преобразование, старается найти зави­симости среди собранных данных и в то же время достигнуть наиболее высокого уровня обобщения. Выделяют, по крайней мере, следующие четыре функции преобра­зования данных: обобщение, определение концепции (концептуализа­ция), перевод результатов статистического анализа на понятный для менеджера язык (коммуникация), определение степени соответствия полученных результатов всей совокупности (экстраполяция). Из-за неспособности человека анализировать большие массивы ин­формации необходимо исходные собранные данные представить в удоб­ном для осмысления виде, т.е. их необходимо обобщить, выразить через ограниченное число понятных параметров. Большинство статистических мер основано на конкретных предпо­ложениях, которые определяют базу анализа собранных данных. Кон­цептуализация направлена на оценку результатов обобщения. Например, слабый разброс оценок определенной марки продукта вырабатывает у исследователя одно суждение (концепцию), сильный — другое. Коммуникация предполагает при интерпретации полученных резуль­татов использование понятных для заказчика категорий. Например, если для него понятна такая статистическая мера, как «мода», то она исполь­зуется при представлении полученных результатов, если нет, то резуль­таты описываются на общепринятом языке. Экстраполяция в данном случае предполагает определение, в какой степени данные выборки можно обобщить на всю совокупность. 1. Виды статистического анализа Выделяют пять основных видов статистического анализа, использу­емых при проведении маркетинговых исследований: дескриптивный ана­лиз, выводной анализ, анализ различий, анализ связей и предсказатель­ный анализ. Иногда эти виды анализа используются по отдельности, иногда — совместно. В основе дескриптивного анализа лежит использование таких статис­тических мер, как средняя величина (средняя), мода, среднее квадрати-ческое отклонение, размах или амплитуда вариации. Анализ, в основе которого лежит использование статистических процедур (например, проверка гипотез) с целью обобщения получен­ных результатов на всю совокупность, называется выводным анализом. Анализ различий используется для сравнения результатов исследования двух групп для определения степени реального отличия в их поведении, в реакции на одну и ту же рекламу и т.п. Анализ связей направлен на определение систематических связей (их направленности и силы) переменных. Предсказательный анализ используется в целях прогнозирования раз­вития событий в будущем, например путем анализа временных рядов. 1.1. Инструменты дескриптивного анализа Для описания информации, полученной на основе выборочных из­мерений, широко используется две группы мер. Первая включает меры «центральной тенденции», или меры, которые описывают типичного респондента или типичный ответ. Вторая включает меры вариации, или меры, описывающие степень схожести или несхожести респондентов или ответов с «типичными» респондентами или ответами. Существуют и другие описательные меры, например меры асимметрии (насколько найденные кривые распределения отличаются от нормальных кривых распределения). Однако они используются не столь часто, как вышеупомянутые. К числу мер центральной тенденции относятся мода, медиана и средняя. Мода характеризует величину признака, появляющуюся наиболее часто по сравнению с другими величинами данного признака. Мода носит относительный характер, и необязательно, чтобы большинство респон­дентов указало именно эту величину признака. Медиана характеризует значение признака, занимающее срединное место в упорядоченном ряду значений данного признака. Третьей мерой центральной тенденции является средняя величина, которая чаще всего рассчитывается как средняя арифметическая величи­на. При ее вычислении общий объем признака поровну распределяется между всеми единицами совокупности. Видно, что степень информативности средней величины больше, чем медианы, а медианы — моды. Однако рассмотренные меры не характеризуют вариацию ответов на какой-то вопрос или, говоря другими словами, несходство, различие респондентов или измеренных характеристик. Очевидно, что помимо знания величин мер центральной тенденции важно установить, насколько близко к этим величинам расположены остальные полученные оценки. Обычно используют три меры вариации: распределение частот, размах вариации и среднее квадратическое отклонение. Распределение частот представляет в табличной или графической форме число случаев появления каждого значения измеренной характе­ристики (признака) в каждом выбранном диапазоне ее значений. Рас­пределение частот позволяет быстро сделать выводы о степени подроб­ности результатов измерений. Размах вариации определяет абсолютную разность между максималь­ным и минимальным значениями измеренного признака. Говоря другими словами, это разница между конечными точками в распределении упо­рядоченных величин измеренного признака. Данная мера определяет интервал распределения значений признака. Среднее квадратическое отклонение является обобщающей статисти­ческой характеристикой вариации значений признака. Если эта мера мала, то кривая распределения имеет узкую, сжатую форму (результаты изме­рений обладают высокой степенью схожести); если мера велика, то кри­вая распределения имеет широкий, растянутый вид (велика степень различия оценок). Ранее было отмечено, что выбор шкалы измерений, а следователь­но, типа вопросов в опросном листе предопределяют количество по­лучаемой информации. Подобным образом, количество информации, получаемой при использовании рассмотренных выше мер, является раз­личным. Общим правилом является то, что статистические меры дают возможность получить больше информации при применении наиболее информативных шкал измерений. Выбор шкалы измерений предопреде­ляет выбор статистических мер. Для вычисления средних надо ис­пользовать интервальную шкалу или шкалу отношений. Что касается мер вариации, то при использовании номинальной шкалы применяется распределение частот, при использовании шкалы порядков — кумулятивное распределение частот, а при использовании интервальной шкалы к шкалы отношений — среднее квадратическое отклонение. 1.2. Статистический вывод Вывод является видом логического анализа, направленного на по­лучение общих заключений о всей совокупности на основе наблюдений за малой группой единиц данной совокупности. Выводы делаются на основе анализа малого числа фактов. Статистический же вывод основан на статистическом анализе ре­зультатов выборочных исследований и направлен на оценку параметров совокупности в целом. В данном случае результаты выборочных исследо­ваний являются только отправной точкой для получения общих выводов. Используя логический анализ, можно сделать вывод, что большая выборка содержит меньшую ошибку и что на ее основе можно сделать более правильные выводы о мнении всей совокупности потреби­телей. Видно, что решающим фактором для получения правильных вы­водов является размер выборки. Данный показатель присутствует во всех формулах, определяющих содержание различных методов статистичес­кого вывода. При проведении анализа использу­ются следующие методы статистического вывода: оценка параметров и проверка гипотез. Оценка параметров генеральной совокупности представляет из себя процесс определения, исходя из данных о выборке, интервала, в кото­ром находится один из параметров генеральной совокупности, напри­мер среднее значение. Для этого используют следующие статистические показатели: средние величины, среднюю квадратическую ошибку и же­лаемый уровень доверительности (обычно 95% или 99%). Средняя квадратическая ошибка является, как отмечалось выше, мерой вариации выборочного распределения при теоретическом предпо­ложении, что исследовалось множество независимых выборок одной и той же генеральной совокупности. Она определяется по следующей формуле: где s- — средняя квадратическая ошибка выборочной средней; s — среднее квадратическое отклонение от средней величины в выборке; п — объем выборки. Если используются процентные меры, выражающие альтернатив­ную изменчивость качественных признаков, то где s — средняя квадратическая ошибка выборочной средней при ис­пользовании процентных мер; р — процент респондентов в выборке, поддержавших первую альтенативу; q = (100 — q) — процент респондентов в выборке, поддержав­ших вторую альтенативу; п — объем выборки. Видно, что средняя ошибка выборки тем больше, чем больше вари­ация, и тем меньше, чем больше объем выборки. Поскольку всегда существует выборочная ошибка, то необходимо оценить разброс значений изучаемого параметра генеральной совокуп­ности. Предположим, исследователь выбрал уровень доверительности, равный 99%. Из свойств нормальной кривой распределения вытекает, что ему соответствует параметр Z = ±2,58. Средняя для генеральной совокупности в целом вычисляется по формуле Если используются процентные меры, то Это означает, что если вы хотите, чтобы при 99%-ном уровне до­верительности диапазон оценок включал истинную для генеральной совокупности оценку, то необходимо умножить среднюю квадратическую ошибку на 2,58 и добавить полученный результат к процентному значению «р» (верхняя предельная оценка). Если же произвести вычита­ние данного произведения, то найдем нижнюю предельную оценку. Как эти формулы связаны со статистическим выводом? Поскольку производится оценка параметра генеральной совокупно­сти, то здесь указывается диапазон, в который попадает истинное зна­чение параметра генеральной совокупности. С этой целью этого для выборки берутся статистическая мера центральной тенденции, величина дисперсии и объем выборки. Далее делается предположение об уровне доверительности и рассчитывается диапазон разброса параметра для ге­неральной совокупности. Таким образом, логика статистического вывода направлена на по­лучение конечных заключений об изучаемом параметре генеральной совокупности на основе выборочного исследования, осуществленного по законам математической статистики. Бели используется простое зак­лючение, не основанное на статистических измерениях, то конечные выводы носят субъективный характер и на основе одних и тех же фактов разные специалисты могут сделать разные выводы. При использовании статистического вывода используются форму­лы, носящие объективный характер, в основе которых лежат общеприз­нанные статистические концепции. В результате конечные выводы носят намного более объективный характер. В ряде случаев делаются суждения относительно какого-то парамет­ра генеральной совокупности (величине средней, дисперсии, характере распределения, форме и тесноте связи между переменными) исходя только из некоторых предположений, размышлений, интуиции, непол­ных знаний. Такие суждения называются гипотезами. Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на дан­ные выборки. Под проверкой гипотезы понимается статистическая процедура, при­меняемая для подтверждения или отклонения гипотезы, основанной на результатах выборочных исследований. Проверка гипотезы осуществляет­ся на основе выявления согласованности эмпирических данных с гипо­тетическими. Если расхождение между сравниваемыми величинами не выходит за пределы случайных ошибок, гипотезу принимают. При этом не делается никаких заключений о правильности самой гипотезы, речь идет лишь о согласованности сравниваемых данных. Проверка гипотезы проводится в пять этапов: 1. Делается некоторое предположение относительно какой-то характеристики генеральной совокупности, например о средней величине определенного параметра. 2. Формируется случайная выборка, проводится выборочное исследование и определяются статистические показатели выборки. 3. Сравниваются гипотетическое и статистическое значения исследуемой характеристики. 4. Определяется, соответствуют или нет результаты выборочного исследования принятой гипотезе. 5. Если результаты выборочного исследования не подтверждают гипотезу, последняя пересматривается — она должна соответствовать данным выборочного исследования. Вследствие вариации результатов выборочных исследований невоз­можно сделать абсолютно точный вывод о достоверности гипотезы, проводя простое арифметическое сравнение величин характеристик. Поэтому статистическая проверка гипотезы включает использование: выборочного значения характеристики, среднего квадратического откло­нения, желательного уровня доверительности и гипотетического значе­ния характеристики для генеральной совокупности в целом. Для проверки гипотез о средних величинах применяется следующая формула: где средняя для выборки; mн — гипотетическое значение средней; средняя квадратическая ошибка средней. В ряде случаев целесообразно использовать направленные гипотезы. Направленные гипотезы определяет направления возможных значений какого-то параметра генеральной совокупности. Здесь, правда, возникает вопрос. Если можно провести выбороч­ные исследования, то зачем выдвигать гипотезы? Обработка результа­тов выборочных исследований дает возможность получить средние величины и их статистические характеристики, не выдвигая никаких гипотез. Поэтому проверка гипотез скорее применяется в случаях, когда невозможно или чрезвычайно трудоемко проводить полномасш­табные исследования и когда требуется сравнивать результаты не­скольких исследований (для разных групп респондентов или прове­денных в разное время). Такого рода задачи, как правило, возникают в социальной статистике. Трудоемкость статистико-социологических исследований приводит к тому, что почти все они строятся на не-сплошном учете. Поэтому проблема доказательности выводов в соци­альной статистике стоит особенно остро. Применяя процедуру проверки гипотез, следует помнить, что она может гарантировать результаты с определенной вероятностью лишь по «беспристрастным» выборкам, на основе объективных данных. 2. Анализ различий Проверка существенности различий заключается в сопоставлении ответов на один и тот же вопрос, полученных для двух или более неза­висимых групп респондентов. Кроме того, в ряде случаев представляет интерес сравнение ответов на два или более независимых вопросов для одной и той же выборки. Примером первого случая может служить изучение вопроса: что предпочитают пить по утрам жители определенного региона: кофе или чай. Первоначально было опрошено на основе формирования случайной выборки 100 респондентов, 60% которых отдают предпочтение кофе; через год исследование было повторено, и только 40% из 300 опрошен­ных человек высказалось за кофе. Как можно сопоставить результаты этих двух исследований? Прямым арифметическим путем сравнивать 40% и 60% нельзя из-за разных ошибок выборок. Хотя в случае больших различий в цифрах, скажем, 20 и 80%, легче сделать вывод об измене­нии вкусов в пользу кофе. Однако если есть уверенность, что эта большая разница обусловлена прежде всего тем, что в первом случае исполь­зовалась очень малая выборка, то такой вывод может оказаться сомни­тельным. Таким образом, при проведении подобного сравнения в расчет необходимо принять два критических фактора: степень существенности различий между величинами параметра для двух выборок и средние квадратические ошибки двух выборок, определяемые их объемами. Для проверки, является ли существенной разница измеренных сред­них, используется нулевая гипотеза. Нулевая гипотеза предполагает, что две совокупности, сравниваемые по одному или нескольким признакам, не отличаются друг от друга. При этом предполагается, что действитель­ное различие сравниваемых величин равно нулю, а выявленное по дан­ным отличие от нуля носит случайный характер. Для проверки существенности разницы между двумя измеренными средними (процентами) вначале проводится их сравнение, а затем по­лученная разница переводится в значение среднеквадратических оши­бок, и определяется, насколько далеко они отклоняются от гипотети­ческого нулевого значения. Как только определены среднеквадратические ошибки, становится известной площадь под нормальной кривой распределения и появляется возможность сделать заключение о вероятности выполнения нулевой ги­потезы. Числитель данной формулы характеризует разницу средних. Кроме того, необходимо учесть различие формы двух кривых распределения. Это осуществляется в знаменателе формулы. Выборочное распределение теперь рассматривается как выборочное распределение разницы между средними (процентными мерами). Если нулевая гипотеза справедлива, то распределение разницы является нормальной кривой со средней рав­ной нулю и средней квадратической ошибкой, равной 1. Видно, что величина 6,43 существенно превышает значение ±1,96 (95%-ный уровень доверительности) и ±2,58 (99%-ный уровень довери­тельности). Это означает, что нулевая гипотеза не является истинной. На (рис. 1) приводятся кривые распределения для этих двух сравни­ваемых выборок и средняя квадратическая ошибка кривой разницы. Средняя квадратическая ошибка средней кривой разницы равна 0. Вслед­ствие большого значения среднеквадратических ошибок вероятность справедливости нулевой гипотезы об отсутствии разницы между двумя средними меньше 0,001. Рис 1. Проверка нулевой гипотезы Результаты испытания интерпретируются следующим образом. Если бы гипотеза была истинной, то, образовав большое число выборок, проводя каждый раз аналогичные сравнения, пришли бы к выводу, что 99% разницы будет лежать в границах ±2,58 среднеквадратической ошибки нулевой разницы. Безусловно, может быть сделано только одно сравне­ние, и можно полагаться только на концепцию выборочного распреде­ления. 2.1. Определение и интерпретация связей между двумя переменными В связях не всегда имеются причин­но-следственный характер, а могут иметь просто статистическую природу. В поставленных вопросах можно определенно говорить о влиянии одного фактора на другой. Однако степень влияния изучаемых факторов может быть различной; скорее всего, влияние могут оказывать также какие-то другие факторы. Выделяют четыре типа связей между двумя переменными: немо­нотонная, монотонная, линейная и криволинейная. Немонотонная связь характеризуется тем, что присутствие (отсутст­вие) одной переменной систематически связано с присутствием (отсут­ствием) другой переменной, но ничего неизвестно о направлении этого взаимодействия (приводит ли, например, увеличение одной переменной к увеличению или уменьшению другой). Например, известно, что посе­тители закусочных в утренние часы предпочитают заказывать кофе, а в середине дня — чай. Немонотонная связь просто показывает, что утренние посетители предпочитают также заказывать яйца, бутерброды и бисквиты, а в обе­денное время скорее заказывают мясные блюда с гарниром. Монотонная связь характеризуется возможностью указать только об­щее направление связи между двумя переменными без использования каких-либо количественных характеристик. Нельзя сказать, насколько, например, определенное увеличение одной переменной приводит к уве­личению другой переменной. Существуют только два типа таких связей: увеличение и уменьшение. Например, владельцу обувного магазина из­вестно, что более взрослые дети обычно требуют обувь больших разме­ров. Однако невозможно четко установить связь между конкретным воз­растом и точным размером обуви. Линейная связь характеризует прямолинейную зависимость между дву­мя переменными. Знание количественной характеристики одной перемен­ной автоматически предопределяет знание величины другой переменной: где у — оцениваемая или прогнозируемая зависимая переменная (ре­зультативный признак); а — свободный член уравнения; х — независимая переменная (факторный признак), используе­мая для определения зависимой переменной. b — коэффициент регрессии, измеряющий среднее отношение от­клонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения — вариация у, приходящаяся на единицу вариации х. Коэффициенты а и b рассчитываются на основе наблюдений вели­чин у и х с помощью метода наименьших квадратов. Криволинейная связь характеризует связь между переменными, нося­щую более сложный характер по сравнению с прямой линией. Напри­мер, связь между переменными может описываться S-об разно и кривой. В зависимости от своего типа связь может быть охарактеризована путем определения: ее присутствия (отсутствия), направления и силы (тесноты) связи. Присутствие характеризует наличие или отсутствие систематичес­кой связи между двумя изучаемыми переменными; оно имеет статисти­ческую природу. Проведя испытание статистической значимости, опре­деляют, существует ли зависимость между данными. Если результаты исследования отвергают нулевую гипотезу, это говорит о том, что зави­симость между данными существует. В случае монотонных линейных связей последние могут быть описа­ны с точки зрения их направления — в сторону увеличения или умень­шения. Связь между двумя переменными может быть сильной, умеренной, слабой или отсутствовать. Сильная зависимость характеризуется высокой вероятностью существования связи между двумя переменными, слабая — малой вероятностью. Существуют специальные процедуры для определения указанных выше характеристик связей. Первоначально надо решить, какой тип свя­зей может существовать между двумя изучаемыми переменными. Ответ на этот вопрос зависит от выбранной шкалы измерений. Шкала низкого уровня (наименований) может отразить только не­точные связи, в то время как шкала отношений, или интервальная, — очень точные связи. Определив тип связи (монотонная, немонотонная), надо установить, существует ли эта связь для генеральной совокупности в целом. Для этого проводятся статистические испытания. После того как найдено, что для генеральной совокупности суще­ствует определенный тип связи, устанавливается ее направление. Нако­нец, необходимо установить силу (тесноту) связи. Для определения, существует или нет немонотонная зависимость, используется таблица сопряженности двух переменных и критерий хи-квадрат. Как правило, критерий хи-квадрат применяется для анализа таблиц сопряженности номинальных признаков, однако он может ис­пользоваться и при анализе взаимосвязи порядковых, или интерваль­ных, переменных. Если, скажем, было выяснено, что две переменные не связаны друг с другом, то их дальнейшим исследованием заниматься не стоит. Некоторые указания на связь скорее были обусловлены ошиб­кой выборки. Если же тест на хи-квадрат указал на связь, то она существует в реальности для генеральной совокупности и ее, возможно, следует изучать. Однако этот анализ не указывает на характер связи. Предположим, что изучалась лояльность к определенной марке пива среди служащих и рабочих (двумя переменными, измеренными в шкале наименований). Результаты опроса затабулированы в следующем виде (Таб. 1). Таблица № 1 Первая из приведенных матриц содержит наблюдаемые частоты, которые сравниваются с ожидаемыми частотами, определяемыми как теоретические частоты, вытекающие из принимаемой гипотезы об от­сутствии связи между двумя переменными (выполняется нулевая гипоте­за). Величина отличия наблюдаемых частот от ожидаемых выражается с помощью величины хи-квадрата. Последняя сравнивается с ее таблич­ным значением для выбранного уровня значимости. Когда величина хи-квадрата мала, то нулевая гипотеза принимается, а следовательно, счи­тается, что две переменные являются независимыми и исследователю не стоит тратить время на выяснение связи между ними, поскольку связь является результатом выборочной ошибки. Из таблицы критических значений хи-квадрата вытекает, что для степени свободы, равной в нашем примере 1, и уровня значимости альфа —0,05 критическое значение хи-квадрата равно 3,841. Видно, что расчетное значение хи-квадрата существенно больше его критичес­кого значения. Это говорит о существовании статистически значимой связи между родом деятельности и лояльностью к исследованной марке пива, и не только для данной выборки, но и для совокупности в целом. Из таблицы следует, что главная связь заключается в том, что рабочие покупают пиво данной марки реже по сравнению со служащими. Теснота связи и ее направление определяются путем расчета коэф­фициента корреляции, который изменяется от -1 до +1. Абсолютная величина коэффициента корреляции характеризует тесноту связи, а знак указывает на ее направление. Вначале определяется статистическая значимость коэффициента корреляции. Безотносительно к его абсолютной величине коэффициент корреляции, не обладающий статистической значимостью, бессмыслен. Статистическая значимость проверяется с помощью нулевой гипотезы, которая констатирует, что для совокупности коэффициент корреляции равен нулю. Если нулевая гипотеза отвергается, это означает, что коэф­фициент корреляции для выборки является значимым и его значение для совокупности не будет равно нулю. Существуют таблицы, с помо­щью которых, для выборки определенного объема, можно определить наименьшую величину значимости для коэффициента корреляции. Далее, если коэффициент корреляции оказался статистически зна­чимым, с помощью некоторого общего правила «большого пальца» оп­ределяется сила связи (Таб. 2). Таблица № 2 Данные результаты можно получить также расчетным методом, ис­пользуя уравнение прямой линии и ис­пользуя различные аналитические методы, в частности метод наимень­ших квадратов. Для определения тесноты связи переменных, измеренных в шкале рангов, используются коэффициенты корреляции рангов. Заключение В наше время каждый социолог понимает, что собранные им данные так или иначе надо "анализировать" (конечно, с помощью математических методов). Практически в каждом учебном заведении, готовящем социологов, предусматривается преподавание предмета, название которого фигурирует в заголовке настоящей книги. Но, на наш взгляд, далеко не всегда совокупность действий, называемая анализом социологических данных, понимается правильно. В первую очередь, мы имеем в виду то, что эта совокупность действий не всегда трактуется как некоторый специфичный процесс, не сводящийся ни к какому набору математических приемов и органично вписывающийся в содержательную ткань социологического исследования. Непонимание же сути указанного процесса, по нашему мнению, приводит к неэффективному использованию математического аппарата, и, более того, к получению выводов, противоречащих реальности. Неадекватное отношение к процессу анализа данных не является случайным. Список используемой литературы 1. Девятко И.Ф. Диагностическая процедура в социологии. Очерк истории и теории. М.:Наука,1993. 2. Девятко И.Ф. Модели объяснения и логика социологического исследования. М.:ИС Рос.АН, 1996. 3. Девятко И.Ф. Методы социологического исследования. Екатеринбург:Изд-во Уральского университета, 1998. 4. Социология в России/ Под ред. В.А.Ядова. М.:Изд-во "На Воробьевых", 1996. 5. Толстова Ю.Н. Измерение в социологии. М.:ИНФРА-М, 1998. 6. Татарова Г.Г. От постулатов эмпирической социологии к методологии анализа данных. М.:Наука, 1996. 7. Ядов В.А. Стратегия социологического исследования. М.:Добро­свет, 1998. 8. Паниотто, Максименко. Анализ данных. М.:Наука, 1987. 9. Голубков Е.П. Маркетинговые исследования. М.:Финпресс, 2000.