Решение задач по математической статистике. Учебное пособие: Математическая статистика Что такое мат статистика

СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ЗАКОНЫ ИХ РАСПРЕДЕЛЕНИЯ.

Случайной называют такую величину, которая принимает значения в зависимости от стечения случайных обстоятельств. Различают дискретные и случайные непрерывные величины.

Дискретной называют величину, если она принимает счетное множество значений. (Пример: число пациентов на приеме у врача, число букв на странице, число молекул в заданном объеме).

Непрерывной называют величину, которая может принимать значения внутри некоторого интервала. (Пример: температура воздуха, масса тела, рост человека и т.д.)

Законом распределения случайной величины называется совокупность возможных значений этой величины и, соответствующих этим значениям, вероятностей (или частот встречаемости).

П р и м е р:

x x 1 x 2 x 3 x 4 ... x n
p р 1 р 2 р 3 р 4 ... p n
x x 1 x 2 x 3 x 4 ... x n
m m 1 m 2 m 3 m 4 ... m n

ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН.

Во многих случаях наряду с распределением случайной величины или вместо него информацию об этих величинах могут дать числовые параметры, получившие название числовых характеристик случайной величины . Наиболее употребительные из них:

1 .Математическое ожидание - (среднее значение) случайной величины есть сумма произведений всех возможных ее значений на вероятности этих значений:

2 .Дисперсия случайной величины:


3 .Среднее квадратичное отклонение :

Правило “ТРЕХ СИГМ” - если случайная величина распределена по нормальному закону, то отклонение этой величины от среднего значения по абсолютной величине не превосходит утроенного среднего квадратичного отклонения

ЗАОН ГАУССА – НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ

Часто встречаются величины, распределенные по нормальному закону (закон Гаусса). Главная особенность : он является предельным законом, к которому приближаются другие законы распределения.

Случайная величина распределена по нормальному закону, если ее плотность вероятности имеет вид:



M(X) - математическое ожидание случайной величины;

s - среднее квадратичное отклонение.

Плотность вероятности (функция распределения) показывает, как меняется вероятность, отнесенная к интервалу dx случайной величины, в зависимости от значения самой величины:


ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Математическая статистика - раздел прикладной математики, непосредственно примыкающий к теории вероятностей. Основное отличие математической статистики от теории вероятностей состоит в том, что в математической статистике рассматриваются не действия над законами распределения и числовыми характеристиками случайных величин, а приближенные методы отыскания этих законов и числовых характеристик по результатам экспериментов.

Основными понятиями математической статистики являются:

1. Генеральная совокупность;

2. выборка;

3. вариационный ряд;

4. мода;

5. медиана;

6. процентиль,

7. полигон частот,

8. гистограмма.

Генеральная совокупность - большая статистическая совокупность, из которой отбирается часть объектов для исследования

(Пример: все население области, студенты вузов данного города и т.д.)

Выборка (выборочная совокупность) - множество объектов, отобранных из генеральной совокупности.

Вариационный ряд - статистическое распределение, состоящее из вариант (значений случайной величины) и соответствующих им частот.

Пример:

X,кг
m

x - значение случайной величины (масса девочек в возрасте 10 лет);

m - частота встречаемости.

Мода – значение случайной величины, которому соответствует наибольшая частота встречаемости. (В приведенном выше примере моде соответствует значение 24 кг, оно встречается чаще других: m = 20).

Медиана – значение случайной величины, которое делит распределение пополам: половина значений расположена правее медианы, половина (не больше) – левее.

Пример:

1, 1, 1, 1, 1. 1, 2, 2, 2, 3 , 3, 4, 4, 5, 5, 5, 5, 6, 6, 7 , 7, 7, 7, 7, 7, 8, 8, 8, 8, 8 , 8, 9, 9, 9, 10, 10, 10, 10, 10, 10

В примере мы наблюдаем 40 значений случайной величины. Все значения расположены в порядке возрастания с учетом частоты их встречаемости. Видно, что справа от выделенного значения 7 расположены 20 (половина) из 40 значений. Стало быть, 7 – это медиана.

Для характеристики разброса найдем значения, не выше которых оказалось 25 и 75% результатов измерения. Эти величины называются 25-м и 75-м процентилями . Если медиана делит распределение пополам, то 25-й и 75-й процентили отсекают от него по четвертушке. (Саму медиану, кстати, можно считать 50-м процентилем.) Как видно из примера, 25-й и 75-й процентили равны соответственно 3 и 8.

Используют дискретное (точечное) статистическое распределение инепрерывное (интервальное) статистическое распределение.

Для наглядности статистические распределения изображают графически в виде полигона частот или - гистограммы .

Полигон частот - ломаная линия, отрезки которой соединяют точки с координатами (x 1 ,m 1 ), (x 2 ,m 2 ), ..., или для полигона относительных частот – с координатами (x 1 ,р * 1 ), (x 2 ,р * 2 ), ...(Рис.1).


m m i /n f(x)

Рис.1 Рис.2

Гистограмма частот - совокупность смежных прямоугольников, построенных на одной прямой линии (Рис.2), основания прямоугольников одинаковы и равны dx , а высоты равны отношению частоты к dx , или р * к dx (плотность вероятности).

Пример:

х, кг 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4
m

Полигон частот

Отношение относительной частоты к ширине интервала носит название плотности вероятности f(x)=m i / n dx = p* i / dx

Пример построения гистограммы .

Воспользуемся данными предыдущего примера.

1. Расчет количества классовых интервалов

гдеn - число наблюдений. В нашем случае n = 100 . Следовательно:

2. Расчет ширины интервала :

,

3. Составление интервального ряда:

2.7-2.9 2.9-3.1 3.1-3.3 3.3-3.5 3.5-3.7 3.7-3.9 3.9-4.1 4.1-4.3 4.3-4.5
m
f(x) 0.3 0.75 1.25 0.85 0.55 0.6 0.4 0.25 0.05

Гистограмма

Каждое исследование в области случайных явлений своими корнями всегда уходит в эксперимент, в опытные данные. Числовые данные, которые собирают при изучении какого-либо признака некоторого объекта, называются статистическими . Статистические данные являются первоначальным материалом исследования. Для того, чтобы они представляли научную или практическую ценность, их надо обработать методами математической статистики.

Математическая статистика - это научная дисциплина, предметом изучения которой является разработка методов регистрации, описания и анализа статистических экспериментальных данных, полученных в результате наблюдений массовых случайных явлений.

Основными задачами математической статистики являются:

    определение закона распределения случайной величины или системы случайных величин;

    проверка правдоподобия гипотез;

    определение неизвестных параметров распределения.

Все методы математической статистики основаны на теории вероятностей. Однако в силу специфичности решаемых задач математическая статистика выделяется из теории вероятностей в самостоятельную область. Если в теории вероятностей считается заданной модель явления и производится расчет возможного реального течения этого явления (рис.1), то в математической статистике подбирается подходящая теоретико-вероятностная модель, исходя из статистических данных (рис.2).

Рис.1. Общая задача теории вероятностей

Рис.2. Общая задача математической статистики

Как научная дисциплина математическая статистика развивалась вместе с теорией вероятностей. Математический аппарат этой науки построен во второй половине XIX века.

2. Генеральная совокупность и выборка.

Для изучения статистических методов вводятся понятия генеральной и выборочной совокупностей. В общем случае под генеральной совокупностью понимается случайная величина X с функцией распределения
. Выборочной совокупностью или выборкой объемаn для данной случайной величины X называется набор
независимых наблюдений этой величины, гденосит название выборочного значения или реализации случайной величиныX. Таким образом, можно рассматривать как числа (если эксперимент проведен и выборка состоялась) и как случайные величины (до проведения эксперимента), поскольку они меняются от выборки к выборке.

Пример 1 . Для определения зависимости толщины ствола дерева от его высоты было отобрано 200 деревьев. В данном случае объем выборки n=200.

Пример 2. В результате распиловки древесностружечных плит на круглопильном станке было получено 15 значений удельной работы резания. В этом случае n=15.

Д
ля того чтобы по данным выборки уверенно судить об интересующем нас признаке генеральной совокупности, объекты выборки должны правильно ее представлять, то есть выборка должна бытьрепрезентативной (представительной). Репрезентативность выборки обычно достигается случайностью отбора объектов: каждому объекту генеральной совокупности обеспечивается равная со всеми остальными вероятность попадания в выборку.

Рис.3. Демонстация репрезентативности выборки


Все книги можно скачать бесплатно и без регистрации.

NEW. Игорь Гайдышев. Анализ и обработка данных. Специальный справочник. 2001 ГОД. 742 СТР. DjVu. 11.0 Mб.
Информация, которую вы найдете в справочнике:
- статистики эмпирического ряда;
- проверка гипотез;
- дисперсионный анализ;
- теория распределений;
- корреляционный анализ;
- методы снижения размерности;
- факторный анализ;
- распознавание образов;
- методы теории информации;
- планирование эксперимента;
- методы теории множеств;
- аппроксимация зависимостей

скачать

NEW. Электронный учебник tat Soft. chm. 5.2 Mб.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Т. Андерсон. Введение в многомерный статистический анализ. 1963 год. 501 стр. djvu. 6.0 Мб.
Эта монография была первоначально задумана как учебник по годовому курсу статистики многомерных величин. Надеюсь, что данная работа послужит и введением во многие разделы этой области для всех, кто занимается математической статистикой. Книгу эту можно использовать также и как справочник.
В течение нескольких лет эта книга в виде конспекта использовалась при чтении годового курса в Колумбийском университете; первые шесть глав составили материал первого семестра, причем особое внимание уделялось теории корреляции. Предполагается, что читатель знаком с обычной теорией статистики одномерных величин, в частности с методами, основанными на одномерном нормальном распределении. Также предполагается знание матричной алгебры, однако этот материал включен в приложение к книге.
Надеюсь, что основные и наиболее важные разделы многомерного статистического анализа рассмотрены в настоящей работе, хотя отбор материала является до некоторой степени делом вкуса. Некоторые наиболее важные результаты лишь очень кратко затронуты в последней главе.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Айвазян В.А. Прикладная статистика. В 3-х томах. Справочное издание. 1983-1989 годы. djvu. 1.1 Мб.
Том 1. Основы моделирования и первичная обработка данных.
Книга посвящена методам предварительного статистического анализа данных и построения модели реального явления, характеризуемого этими данными. Приводятся сведения по теории вероятностей и математической статистике, освещаются вопросы программной реализации излагаемых методов. 472 стр. 8.9 Мб.
Том 2. Исследование зависимостей.
В книге рассматриваются методы корреляционного, регрессионного и дисперсионного анализа. Приводятся их алгоритмы и обзор программного обеспечения. 488 стр. 11.6 Мб.
Том 3. Классификация и снижение размерности.
Рассматриваются задачи классификации объектов, снижения размерности. Большое внимание уделяется разведочному статистическому анализу. 608 стр. 6.6 Мб.

. . . . . . . . . . . . . . . . . . .Скачать 1 . . . . . . . . . . Скачать 2 . . . . . . . . . . Скачать 3

В.С. Балинова. Статистика в вопросах и ответах. Учебное пособие. 2005 год. 344 стр. djvu. 2.9 Mб.
В учебном пособии в соответствии с государственным образовательным стандартом высшего профессионального образования подробно рассмотрены основные вопросы курса Статистика: предмет статистики и ее история, методы расчета абсолютных и относительных величин, сводки и группировки, средние величины, выборочное наблюдение, индексы и др.
В пособии также отражены изменения в методологии построения статистических показателей из-за перехода государственной статистики Российской Федерации на международные стандарты. Материал, изложенный в виде вопросов и ответов, включаемых в билеты, позволяет быстро и легко подготовиться к экзамену или зачету, сделать доклад или написать реферат.
Для студентов и преподавателей вузов, научных и практических работников, а также всех интересующихся статистикой.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Боровков. Математическая статистика. Оценка параметров. Проверка гипотез. 1984 год. Djvu. 240 стр. 12.2 Мб.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Скачать

Гусаров В.М. Статистика. Учебное пособие. 2003 год. 463 стр. djvu. 3.8 Мб.
В учебном пособии «Статистика» рассмотрены основные методы статистического исследования (статистическое наблюдение, сводка, группировка, расчет обобщающих показателей, выборочный метод, анализ рядов динамики, индексный метод анализа, основы корреляционного и регрессионного анализа). Показана необходимость их комплексного применения в анализе элементов рыночной экономики. Особое внимание уделено обоснованию вероятностного характера статистического вывода. Теория статистической методологии подкреплена иллюстрацией применения статистических методов в исследованиях конкретных социально-экономических процессов.
В учебном пособии «Статистика» нашло отражение расширение задач отечественной статистики в связи с выполнением «Государственной программы перехода Российской Федерации на принятую в международной практике систему учета и статистики в соответствии с требованиями развития рыночной экономики». Статистическая методология изложена в доступной форме, понятной читателю, не имеющему специальной подготовки.
В учебном пособии «Статистика» четыре раздела.
В первом разделе «Теория статистики» освещен предмет статистики, определены ее задачи, рассмотрены вопросы статистической методологии, показано применение важнейших методов статистического исследования социально-экономических явлений.
Во втором разделе «Макроэкономическая статистика» рассмотрены система показателей и методика их расчета, в совокупности» обеспечивающих количественную характеристику результатов функционирования экономики страны и регионов в разрезе отраслей, секторов и форм собственности; уровень жизни населения; система национальных счетов как макростатисти-ческая модель экономики.
Третий раздел «Статистика предприятия» посвящен анализу функционирования предприятия, условий применения и потребления основного и оборотного капитала и рабочей силы, характеристике натурально-вещественных и финансовых результатов производства.
Четвертый раздел «Статистика финансов» посвящен количественному и качественному анализу финансово-денежных отношений, возникающих в процессе производства. Рассмотрены вопросы статистики цен, кредита, денежного обращения, страхового рынка, рынка ценных бумаг, финансов предприятий, финансовых расчетов.

скачать

Дронов С.В. Многомерный статистический анализ. Учеб. пособие. 2003 год. 246 стр. pdf. 706 Кб.
Учебное пособие создано на основе опыта преподавания автором курсов многомерного статистического анализа и эконометрики. Содержит материалы по дискриминантному, факторному, регрессионному анализу, анализу соответствий и теории временных рядов. Изложены подходы к задачам многомерного шкалирования и некоторым другим задачам многомерной статистики. В начале пособия даются необходимык сведения из математике.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

И.И. Елисеева и др. Теория статистики с основами теории вероятностей. Учеб. пособие для вуэов. 2001 год. 446 стр. djvu. 7.1 Мб.
Изложены основы теории вероятностей, математической статистики и общие правила сбора, обработки и анализа статистических данных. Особое внимание уделено правилам принятия решений в условиях неопределенности. Анализ данных рассматривается также как составная часть принятия решений. Рассмотрены статистические методы изучения связей между переменными, проблемы построения и анализа временных рядов, прогнозирование на их основе. Показано значение статистики для решения основных прикладных задач: статистического контроля качества, разработки маркетинговой стратегии, финансового анализа и т п.
Для студентов и преподавателей экономических вузов и факультетов, аспирантов и стажеров.

. . . . . . . . . . . . . . . . . . . . . . . .скачать

И.И. Елисеева, М.М. Юзбашев. Общая теория статистики. Учебник. 2004 год. 657 стр. PDF. !4,8 МБ.
В учебнике «Общая теория статистики» рассмотрены основные процедуры сбора, обработки и анализа массовых данных; возможности их реализации на персональных компьютерах. Особое внимание уделено обоснованию вероятностного характера статистического вывода, выборочному методу, проверке статистических гипотез. Этот учебник дает представление об основных статистических методах, их возможностях и границах применения. Для желающих более глубоко изучить соответствующий раздел статистики в конце каждой главы приведен список рекомендуемой литературы.
Авторы стремились показать, что статистика не является скучной и трудной наукой, как иногда думают, а ее изучение может доставить удовольствие. Этим обусловлена подача материала - неформальная, но информативная. Изложение теории проиллюстрировано примерами из разнообразных областей, которые должны убедить читателя во «всесильности» статистики, возможности ее применения при решении различных задач.
Учебник «Общая теория статистики» соответствует программе подготовки бакалавров. Вместе с тем он будет полезен и занимающимся в магистратуре и даже в аспирантуре. В данное, 5-е издание, внесены уточнения и дополнения во все главы. Глава 2 существенно переработана и дополнена с учетом изменений в работе государственной статистики. Выборочный метод излагается теперь отдельно от методов проверки статистических гипотез, дополненных прежде всего изложением непараметрического тестирования.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Г.И. Ивченко, И.Ю. Медведев. Введение в математическую статистику. Учeбник. 2010 год. 600 стр. djvu. 8.7 Мб.
Настоящая книrа представляет собой своеобразный расширеттый учебник по математической статистике. Данный учебник не оrpаничен рамками учебноrо стандарта или вузовской проrpаммы. Он предназначен всем, кто интересуется математикой вообще и, в частности, хочет узнать, что такое современная мaтeмaтическая статистика, какие задачи и какими методами она решает, какие результаты в ней уже накоплены, какие проблемы в ней сеrодня актуальны, наконец, каковы ее истоки, какой путь она прошла и какие ученые были ее творцами. По замыслу авторов, книrа простым и ДОСТУПНbIМ ЯЗbIКОМ рассказывает о математической стaтистике и одновременно обучает ей. Вся теория объясняется и иллюстрируется на интересных и тщательно подобранных примерах. Книrа может служить и задачником, так как содержит большой список упражнений для самостоятельноrо решения, а также справочным пособием по математической статистнке, а в некоторых аспектах и по теории вероятностей.
Книrа будет интересна преподавателям, аспирантам и студентам естественных и технических вузов, в которых изучается математическая статистика, научным работникам, использующим в своей деятельности методы математической статистики, а также самому широкому Kpyry любителей математики.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

В.Г. Ионин редактор. Статистика. Курс лекций. 2000 год. 310 стр. djvu. 1.8 Мб.
Учебное пособие охватывает основные разделы курса "Статистика", являющегося базовым для студентов НГАЭиУ всех специальностей и форм обучения. Курс включает два раздела: теорию статистики (развитие статистики, методы сбора и обработки данных, анализа сатистических взаимосвязей) и вопросы применения статистики в конкретных исследованиях социально-экономических процессов (оценка уровня экономического развития, основных условий и факторов социаьных и экономических процессов, факторов и результатов деятельности в сфере производства, уровня жизни).
Издание предназначено для студенто и всех интересующихся проблемами непосредственного анализа конкретных процессов в области производства, учёта и финансов.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Калинина В.Н., Панкин В.Ф. Математическая статистика. 4-е изд. Уч. пособие. 2002 год. 340 стр. djvu. 3.5 Mб.
В учебнике (3-е изд. - 2001 г.) содержатся наиболее важные разделы математической статистики: оценивание числовых характеристик и закона распределения случайной величины, проверка гипотез, дисперсионный и корреляционно-регрессионный анализ, а также необходимые для понимания этих разделов сведения по теории вероятностей. Приведены примеры и упражнения, их разбор и решения, графические иллюстрации. В учебник включены вопросы статистического моделирования случайных величин и систем массового обслуживания на ЭВМ, широко используемого специалистами, которые работают в области программирования и использования ЭВМ.
Для студентов средних специальных учебных заведений.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Кремлев А. Г. Статистика. Учеб. пособие. 2001 год. 140 стр. pdf. 5.8 Мб.
Изложены теоретические основы математической статистики: анализ вариационных рядов, оценивание числовых характеристик и закона распределения, анализ корреляционной зависимости, линейные и нелинейные модели регрессии, проверка гипотез. Рассматриваются и объясняются в примерах практические методы расчета статистических характеристик. Каждый раздел содержит систематизированную подборку задач и необходимые для их решения статистические таблицы.
Студентам юридических и других гуманитарных вузов и факультетов, а также всем интересующимся методами статистического анализа данных.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. 2008 год. 816 стр. djvu. 8.1 Мб.
В книге рассматриваются способы анализа наблюдений методами математической статистики. Последовательно на языке, доступном специалисту - не математику, излагаются современные методы анализа распределений вероятностей, оценки параметров распределений, проверки статистических гипотез, оценки связей между случайными величинами, планирования статистического эксперимента. Основное внимание уделено пояснению примеров применения методов современной математической статистики. Книга предназначена для инженеров, исследователей, экономистов, медиков, аспирантов и студентов, желающих быстро, экономично и на высоком профессиональном уровне использовать весь арсенал современной математической статистики для решения своих прикладных задач.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Крянев, Лукин. Математические методы обработки неопределенных данных. 215 стр. djv. 2.4 Мб.
В первых главах монографии изложены основные понятия параметрической и непараметрической статистики, включая понятия оценки, а также требования, предъявляемые к свойствам оценок с точки зрения их вычисления при обработке данных на компьютере. В 7-13 главах монографии изложены методы и алгоритмы восстановления регрессионных зависимостей, включая методы прогнозирования и решения задач планирования оптимальных экспериментов.
Предполагается, что читатель предварительно освоил курс теории вероятностей и математической статистики. В монографии представлены некоторые новые методы робастного оценивания и учета априорной информации, включая алгоритмы их численной реализации. Основная цель монографии - ознакомить читателя с наиболее эффективными и апробированными классическими и новыми статистическими методами оценки и восстановления, научить использовать эти методы при решении конкретных задач обработки неопределенных данных. Монография предназначена научным работникам, аспирантам, студентам старших курсов различных специальностей.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Скачать

Лялин В. С., Зверева И. Г., Никифорова Н. Г. : Статистика. Теория и практика в Excel. 2010 год. 448 стр. djvu. 10.5 Мб.
Рассмотрены вопросы обшей теории статистики и практики современных статистических исследований в соответствии с требованиями государственного образовательного стандарта высшего профессионального образования. Приведены основные концепции, понятия и показатели теоретической статистики. Описана на конкретных примерах методика использования табличного процессора Excel для статистической обработки информации.
Для студентов, аспирантов, преподавателей и практических работников, заинтересованных в изучении и использовании современных методов анализа статистических данных. Может быть использовано как справочное издание для анализа исходного статистического массива в Excel.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Лапач С.Н., Чубенко А.В., Бабич П.Н. Статистические методы в медико-биологических исследованиях с использованием Excel. 2001 год. 408 стр. djvu. 18.1 Мб.
Монография призвана обеспечить читателей инструментарием для решения задач, требующих использования статистических методов, помочь им правильно и эффективно их применять. В ней содержится описание методов проверки гипотез о средних и дисперсиях, наличия связи между факторами (корреляционный, дисперсионный анализ, анализ таблиц сопряженности), методов классификации (кластерный и дискриминантный анализ) и получения зависимостей (регрессионный анализ, анализ временных рядов). Приведены теоретические сведения, базовые понятия, необходимые для усвоения предмета, и материал, достаточный для решения задач с использованием Excel. Описание каждого метода сопровождается примером. Поскольку в Excel многие из рассматриваемых методов отсутствуют, разработаны и описаны программы для расширения его возможностей, которые также содержатся на прилагаемой к книге дискете. Рассматриваются типичные ошибки, возникающие при применении статистических методов, а также способы, позволяющие их избежать. Во втором издании рассмотрены дополнительные возможности статистического анализа данных, реализованные в Microsoft Excel 2000, включая графические методы. Расширено описание базовых понятий теории вероятностей с точки зрения их практического применения. Добавлены новые программы (дискриминантного и кластерного анализа, построения рейтингов, расчета коэффициентов корреляции Спирмена и Кендалла). Освещены основные проблемы применения статистических методов в клинических испытаниях.
Издание содержит русско-английский и англо-русский словари терминов математической статистики.
Для исследователей, специалистов медико-биологического профиля, маркетологов, а также студентов и аспирантов.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Р.С. Рао. Линейные статистические методы и их применения. 1968 год. 548 стр. djvu. 22.3 Мб.
Книга содержит восемь глав. В главе 1 изложены необходимые сведения из линейной алгебры, в главе 2 - из теории вероятностей. Статистическая часть начинается с главы 3, где описываются некоторые стандартные распределения математической статистики, вводится нормальный закон и изучаются распределения статистик, играющих фундаментальную роль в методе наименьших квадратов. Глава 4 посвящена статистическим выводам, базирующимся на линейных моделях для математических ожиданий. Особое внимание уделяется вычислительной стороне метода наименьших квадратов. Рассматриваются также различные задачи доверительного оценивания линейных параметрических функций. В главе 5 рассматриваются общие (не только линейные) методы оценивания параметров. Здесь доказана теорема Рао - Блекуэла - Колмогорова и рассмотрены связанные с ней вопросы. Подробно излагается теория информационного количества Фишера. Рассмотрены общие методы оценивания при различных предположениях о паре (параметр, наблюдаемая переменная), а также асимптотическая теория оценивания. Подробно изучены оценки максимального правдоподобия. Основная часть главы 4 отведена применению критерия хи-квадрат к различным задачам. В главе 7 излагаются критерий Неймана-Пирсона, построение локально наиболее мощных критериев, конструкция подобных тестов для семейств с нетривиальными достаточными статистиками, различные меры асимптотической эффективности критериев, общий метод построения доверительных множеств, схема последовательного анализа. В главе 8 рассматриваются: распределение Уишарта, критерии различных гипотез о параметрах многомерного нормального закона, дискриминантный анализ. Изложение иллюстрируется примерами преимущественно биометрического характера. В конце каждой главы приведено большое количество задач и упражнений, а также обширная библиография.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Статистика. 2-е изд. 2007 год. 288 стр. pdf. 5.9 Мб.
В пособии рассматриваются вопросы, посвященные применению статистических методов в статике и динамике, а также их комплексное применение в различных сочетаниях при изучении макроэкономических показателей, рассматривается методология и построение показателей социально-экономической статистики с учетом международных стандартов.
Отдельное внимание уделяется прикладным статистическим методам.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Практикум по статистике. 2007 год. 288 стр. pdf. 4.6 Мб.
Данный практикум предназначен для студентов экономических специальностей, а также аспирантов, преподавателей и практических работников, занимающихся вопросами планирования и анализа производственно-хозяйственной деятельности предприятий.
В практикуме по каждой теме в сжатой форме приводятся методические указания о методах расчета и анализа показателей. Представлены решения типовых задач и набор задач для самостоятельной работы студентов.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Спирина, Башина редакторы. Оющая теория статистики. Стстистичкская методология при изучении коммерческой деятельности. Учебник. 1996 год. 296 стр. djvu. 5.0 Мб.
В отличие от прежних изданий в этом учебнике вопросы статистической методологии рассматриваются применительно к решению управленческих задач в коммерческой деятельности на рынке товаров и услуг. Изучение общей теории статистики во многом способствует формированию деловых качеств коммерсанта, экономиста, менеджера
Для студентов торговых вузов и экономических факультетов, коммерсантов, менеджеров, экономистов, слушателей школ бизнеса.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .скачать

Л.П. Харченко и мн. др. Статистика. Курс лекций. 2000 год. 312 стр. djvu. 1.8 Mб.
1. ТЕОРИЯ СТАТИСТИКИ.
Предмет и метод статистики. Статистическое наблюдение. Сводка и группировка данных статистического наблюдения. Статистические величины. Изучение динамики общественных явлений. Индексы. Статистическое изучение взаимосвязей.
2. СТАТИСТИКА В ПРИКЛАДНЫХ ИССЛЕДОВАНИЯХ.
Статистическая оценка экономического развития страны. Статистический анализ условий социально-экономического развития общества. Статистические показатели продукции, трудовых ресурсов и эффективности производства. Статистическая оценка уровня жизни населения.

Введение

2. Основные понятия математической статистики

2.1 Основные понятия выборочного метода

2.2 Выборочное распределение

2.3 Эмпирическая функция распределения, гистограмма

Заключение

Список литературы

Введение

Математическая статистика - наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надежность и точность выводов, делаемых на основании ограниченного статистического материала (напр., оценить необходимый объем выборки для получения результатов требуемой точности при выборочном обследовании).

В теории вероятностей рассматриваются случайные величины с заданным распределением или случайные эксперименты, свойства которых целиком известны. Предмет теории вероятностей - свойства и взаимосвязи этих величин (распределений).

Но часто эксперимент представляет собой черный ящик, выдающий лишь некие результаты, по которым требуется сделать вывод о свойствах самого эксперимента. Наблюдатель имеет набор числовых (или их можно сделать числовыми) результатов, полученных повторением одного и того же случайного эксперимента в одинаковых условиях.

При этом возникают, например, следующие вопросы: Если мы наблюдаем одну случайную величину - как по набору ее значений в нескольких опытах сделать как можно более точный вывод о ее распределении?

Примером такой серии экспериментов может служить социологический опрос, набор экономических показателей или, наконец, последовательность гербов и решек при тысячекратном подбрасывании монеты.

Все вышеприведенные факторы обуславливают актуальность и значимость тематики работы на современном этапе, направленной на глубокое и всестороннее изучение основных понятий математической статистики.

В связи с этим целью данной работы является систематизация, накопление и закрепление знаний о понятиях математической статистики.

1. Предмет и методы математической статистики

Математическая статистика - наука о математических методах анализа данных, полученных при проведении массовых наблюдений (измерений, опытов). В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы. Существенная часть статистики математической основана на вероятностных моделях. Выделяют общие задачи описания данных, оценивания и проверки гипотез. Рассматривают и более частные задачи, связанные с проведением выборочных обследований, восстановлением зависимостей, построением и использованием классификаций (типологий) и др.

Для описания данных строят таблицы, диаграммы, иные наглядные представления, например, корреляционные поля. Вероятностные модели обычно не применяются. Некоторые методы описания данных опираются на продвинутую теорию и возможности современных компьютеров. К ним относятся, в частности, кластер-анализ, нацеленный на выделение групп объектов, похожих друг на друга, и многомерное шкалирование, позволяющее наглядно представить объекты на плоскости, в наименьшей степени исказив расстояния между ними.

Методы оценивания и проверки гипотез опираются на вероятностные модели порождения данных. Эти модели делятся на параметрические и непараметрические. В параметрических моделях предполагается, что изучаемые объекты описываются функциями распределения, зависящими от небольшого числа (1-4) числовых параметров. В непараметрических моделях функции распределения предполагаются произвольными непрерывными. В статистике математической оценивают параметры и характеристики распределения (математическое ожидание, медиану, дисперсию, квантили и др.), плотности и функции распределения, зависимости между переменными (на основе линейных и непараметрических коэффициентов корреляции, а также параметрических или непараметрических оценок функций, выражающих зависимости) и др. Используют точечные и интервальные (дающие границы для истинных значений) оценки.

В математической статистике есть общая теория проверки гипотез и большое число методов, посвященных проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик, о проверке однородности (то есть о совпадении характеристик или функций распределения в двух выборках), о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций, о симметрии распределения и др.

Большое значение имеет раздел математической статистики, связанный с проведением выборочных обследований, со свойствами различных схем организации выборок и построением адекватных методов оценивания и проверки гипотез.

Задачи восстановления зависимостей активно изучаются более 200 лет, с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов. В настоящее время наиболее актуальны методы поиска информативного подмножества переменных и непараметрические методы.

Разработка методов аппроксимации данных и сокращения размерности описания была начата более 100 лет назад, когда К. Пирсон создал метод главных компонент. Позднее были разработаны факторный анализ и многочисленные нелинейные обобщения.

Различные методы построения (кластер-анализ), анализа и использования (дискриминантный анализ) классификаций (типологий) именуют также методами распознавания образов (с учителем и без), автоматической классификации и др.

Математические методы в статистике основаны либо на использовании сумм (на основе Центральной Предельной Теоремы теории вероятностей) или показателей различия (расстояний, метрик), как в статистике объектов нечисловой природы. Строго обоснованы обычно лишь асимптотические результаты. В настоящее время компьютеры играют большую роль в математической статистике. Они используются как для расчетов, так и для имитационного моделирования (в частности, в методах размножения выборок и при изучении пригодности асимптотических результатов).

Основные понятия математической статистики

2.1 Основные понятия выборочного метода

Пусть - случайная величина, наблюдаемая в случайном эксперименте. Предполагается, что вероятностное пространство задано (и не будет нас интересовать).

Будем считать, что, проведя раз этот эксперимент в одинаковых условиях, мы получили числа , , , - значения этой случайной величины в первом, втором, и т.д. экспериментах. Случайная величина имеет некоторое распределение , которое нам частично или полностью неизвестно.

Рассмотрим подробнее набор , называемый выборкой .

В серии уже произведенных экспериментов выборка - это набор чисел. Но если эту серию экспериментов повторить еще раз, то вместо этого набора мы получим новый набор чисел. Вместо числа появится другое число - одно из значений случайной величины . То есть (и , и , и т.д.) - переменная величина, которая может принимать те же значения, что и случайная величина , и так же часто (с теми же вероятностями). Поэтому до опыта - случайная величина, одинаково распределенная с , а после опыта - число, которое мы наблюдаем в данном первом эксперименте, т.е. одно из возможных значений случайной величины .

Выборка объема - это набор из независимых и одинаково распределенных случайных величин («копий »), имеющих, как и , распределение .

Что значит «по выборке сделать вывод о распределении»? Распределение характеризуется функцией распределения, плотностью или таблицей, набором числовых характеристик - , , и т.д. По выборке нужно уметь строить приближения для всех этих характеристик.

.2 Выборочное распределение

Рассмотрим реализацию выборки на одном элементарном исходе - набор чисел , , . На подходящем вероятностном пространстве введем случайную величину , принимающую значения , , с вероятностями по (если какие-то из значений совпали, сложим вероятности соответствующее число раз). Таблица распределения вероятностей и функция распределения случайной величины выглядят так:

Распределение величины называют эмпирическим или выборочным распределением. Вычислим математическое ожидание и дисперсию величины и введем обозначения для этих величин:

Точно так же вычислим и момент порядка

В общем случае обозначим через величину

Если при построении всех введенных нами характеристик считать выборку , , набором случайных величин, то и сами эти характеристики - , , , , - станут величинами случайными. Эти характеристики выборочного распределения используют для оценки (приближения) соответствующих неизвестных характеристик истинного распределения.

Причина использования характеристик распределения для оценки характеристик истинного распределения (или ) - в близости этих распределений при больших .

Рассмотрим, для примера, подбрасываний правильного кубика. Пусть - количество очков, выпавших при -м броске, . Предположим, что единица в выборке встретится раз, двойка - раз и т.д. Тогда случайная величина будет принимать значения 1 , , 6 с вероятностями , , соответственно. Но эти пропорции с ростом приближаются к согласно закону больших чисел. То есть распределение величины в некотором смысле сближается с истинным распределением числа очков, выпадающих при подбрасывании правильного кубика.

Мы не станем уточнять, что имеется в виду под близостью выборочного и истинного распределений. В следующих параграфах мы подробнее познакомимся с каждой из введенных выше характеристик и исследуем ее свойства, в том числе ее поведение с ростом объема выборки.

.3 Эмпирическая функция распределения, гистограмма

Поскольку неизвестное распределение можно описать, например, его функцией распределения , построим по выборке «оценку» для этой функции.

Определение 1.

Эмпирической функцией распределения, построенной по выборке объема , называется случайная функция , при каждом равная

Напоминание: Случайная функция

называется индикатором события . При каждом это - случайная величина, имеющая распределение Бернулли с параметром . почему?

Иначе говоря, при любом значение , равное истинной вероятности случайной величине быть меньше , оценивается долей элементов выборки, меньших .

Если элементы выборки , , упорядочить по возрастанию (на каждом элементарном исходе), получится новый набор случайных величин, называемый вариационным рядом :

Элемент , , называется -м членом вариационного ряда или -й порядковой статистикой .

Пример 1.

Выборка:

Вариационный ряд:

Рис. 1. Пример 1

Эмпирическая функция распределения имеет скачки в точках выборки, величина скачка в точке равна , где - количество элементов выборки, совпадающих с .

Можно построить эмпирическую функцию распределения по вариационному ряду:

Другой характеристикой распределения является таблица (для дискретных распределений) или плотность (для абсолютно непрерывных). Эмпирическим, или выборочным аналогом таблицы или плотности является так называемая гистограмма .

Гистограмма строится по группированным данным. Предполагаемую область значений случайной величины (или область выборочных данных) делят независимо от выборки на некоторое количество интервалов (не обязательно одинаковых). Пусть , , - интервалы на прямой, называемые интервалами группировки . Обозначим для через число элементов выборки, попавших в интервал :

(1)

На каждом из интервалов строят прямоугольник, площадь которого пропорциональна . Общая площадь всех прямоугольников должна равняться единице. Пусть - длина интервала . Высота прямоугольника над равна

Полученная фигура называется гистограммой.

Пример 2.

Имеется вариационный ряд (см. пример 1):

Здесь - десятичный логарифм, поэтому , т.е. при увеличении выборки вдвое число интервалов группировки увеличивается на 1. Заметим, что чем больше интервалов группировки, тем лучше. Но, если брать число интервалов, скажем, порядка , то с ростом гистограмма не будет приближаться к плотности.

Справедливо следующее утверждение:

Если плотность распределения элементов выборки является непрерывной функцией, то при так, что , имеет место поточечная сходимость по вероятности гистограммы к плотности.

Так что выбор логарифма разумен, но не является единственно возможным.

Заключение

Математическая (или теоретическая) статистика опирается на методы и понятия теории вероятностей, но решает в каком-то смысле обратные задачи.

Если мы наблюдаем одновременно проявление двух (или более) признаков, т.е. имеем набор значений нескольких случайных величин - что можно сказать об их зависимости? Есть она или нет? А если есть, то какова эта зависимость?

Часто бывает возможно высказать некие предположения о распределении, спрятанном в «черном ящике», или о его свойствах. В этом случае по опытным данным требуется подтвердить или опровергнуть эти предположения («гипотезы»). При этом надо помнить, что ответ «да» или «нет» может быть дан лишь с определенной степенью достоверности, и чем дольше мы можем продолжать эксперимент, тем точнее могут быть выводы. Наиболее благоприятной для исследования оказывается ситуация, когда можно уверенно утверждать о некоторых свойствах наблюдаемого эксперимента - например, о наличии функциональной зависимости между наблюдаемыми величинами, о нормальности распределения, о его симметричности, о наличии у распределения плотности или о его дискретном характере, и т.д.

Итак, о (математической) статистике имеет смысл вспоминать, если

· имеется случайный эксперимент, свойства которого частично или полностью неизвестны,

· мы умеем воспроизводить этот эксперимент в одних и тех же условиях некоторое (а лучше - какое угодно) число раз.

Список литературы

1. Баумоль У. Экономическая теория и исследование операций. – М.; Наука, 1999.

2. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1995.

3. Боровков А.А. Математическая статистика. М.: Наука, 1994.

4. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. - СПБ: Издательство «Лань», 2003.

5. Коршунов Д.А., Чернова Н.И. Сборник задач и упражнений по математической статистике. Новосибирск: Изд-во Института математики им. С.Л.Соболева СО РАН, 2001.

6. Пехелецкий И.Д. Математика: учебник для студентов. - М.: Академия, 2003.

7. Суходольский В.Г. Лекции по высшей математике для гуманитариев. - СПБ Издательство Санкт-петербургского государственного университета. 2003

8. Феллер В. Введение в теорию вероятностей и ее приложения. - М.: Мир, Т.2, 1984.

9. Харман Г., Современный факторный анализ. - М.: Статистика, 1972.


Харман Г., Современный факторный анализ. - М.: Статистика, 1972.

Министерство образования и науки Российской Федерации

Костромской государственный технологический университет

И.В. Землякова, О.Б. Садовская, А.В. Чередникова

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

в качестве учебного пособия для студентов специальностей

220301, 230104, 230201 очной формы обучения

Кострома

ИЗДАТЕЛЬСТВО

УДК 519.22 (075)

Рецензенты: кафедра математических методов в экономике
Костромского государственного университета им. Н.А. Некрасова;

канд. физ.-мат. наук, доцент кафедры математического анализа

Костромского государственного университета им. Н.А. Некрасова К.Е. Ширяев.

З 51 Землякова, И.В. Математическая статистика. Теория и практика: учебное пособие / И.В. Землякова, О.Б. Садовская, А.В. Чередникова. – Кострома: Изд-во Костром. гос. технол. ун-та, 2010. – 60 с.

ISBN 978-5-8285-0525-8

Учебное пособие содержит в максимально доступной форме теоретический материал, примеры, тесты и прокомментированный алгоритм выполнения заданий по типовому расчету.

Предназначено для студентов вузов, обучающихся по специальностям 220301, 230104, 230201 очной формы обучения. Может использоваться как во время лекций, так и на практических занятиях.

УДК 519.22 (075)

ISBN 978-5-8285-0525-8

 Костромской государственный технологический университет, 2010

§1. ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 4

§2. ГЕНЕРАЛЬНАЯ И ВЫБОРОЧНАЯ СОВОКУПНОСТЬ. 4

РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ. СПОСОБЫ ОТБОРА 4

(СПОСОБЫ ОРГАНИЗАЦИИ ВЫБОРКИ) 4

§3. СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ. 6

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РАСПРЕДЕЛЕНИЙ 6

§4. СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ 18

§5. ГЕНЕРАЛЬНАЯ СРЕДНЯЯ. ВЫБОРОЧНАЯ СРЕДНЯЯ. 20

ОЦЕНКА ГЕНЕРАЛЬНОЙ СРЕДНЕЙ ПО ВЫБОРОЧНОЙ СРЕДНЕЙ 20

§6. ГЕНЕРАЛЬНАЯ ДИСПЕРСИЯ. ВЫБОРОЧНАЯ ДИСПЕРСИЯ. 22

ОЦЕНКА ГЕНЕРАЛЬНОЙ ДИСПЕРСИИ ПО ИСПРАВЛЕННОЙ ДИСПЕРСИИ 22

§7. МЕТОД МОМЕНТОВ И МЕТОД НАИБОЛЬШЕГО ПРАВДОПОДОБИЯ НАХОЖДЕНИЯ ОЦЕНОК ПАРАМЕТРОВ. МЕТОД МОМЕНТОВ 25

§8. ДОВЕРИТЕЛЬНАЯ ВЕРОЯТНОСТЬ. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ 27

§9. ПРОВЕРКА ГИПОТЕЗЫ О СООТВЕТСТВИИ СТАТИСТИЧЕСКИХ ДАННЫХ ТЕОРЕТИЧЕСКОМУ ЗАКОНУ РАСПРЕДЕЛЕНИЯ 31

§ 10. ПОНЯТИЕ О КОРРЕЛЯЦИОННОМ И РЕГРЕССИВНОМ АНАЛИЗЕ 39

ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ 44

ОТВЕТЫ И УКАЗАНИЯ 46

Приложения 51

§1. ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Математические законы теории вероятностей не являются абстрактными, лишёнными физического содержания, они представляют собой математическое выражение реальных закономерностей, существующих в массовых случайных явлениях.

Каждое исследование случайных явлений, выполняемое методами теории вероятностей, опирается на экспериментальные данные.

Зарождение математической статистики было связано со сбором данных и графическим представлением полученных результатов (сводки рождаемости, бракосочетаний и т.д.). Это описательная статистика. Нужно было свести обширный материал к небольшому числу величин. Разработка методов сбора (регистрации), описания и анализа экспериментальных (статистических) данных, получаемых в результате наблюдения массовых, случайных явлений, составляет предмет математической статистики .

При этом можно выделить три этапа :

    сбор данных;

    обработка данных;

    статистические выводы-прогнозы и решения.

Типичные задачи математической статистики:

    определение закона распределения случайной величины (или системы случайных величин) по статистическим данным;

    проверка правдоподобия гипотез;

    нахождение неизвестных параметров распределения.

Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

§2. ГЕНЕРАЛЬНАЯ И ВЫБОРОЧНАЯ СОВОКУПНОСТЬ.

РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ. СПОСОБЫ ОТБОРА

(СПОСОБЫ ОРГАНИЗАЦИИ ВЫБОРКИ)

Массовые случайные явления могут быть представлены в виде тех или иных статистических совокупностей однородных объектов. Каждая статистическая совокупность обладает различными признаками.

Различают качественные и количественные признаки. Количественные признаки могут изменяться непрерывно или дискретно .

Пример 1. Рассмотрим производственный процесс (массовое случайное явление) изготовления партии деталей (статистическая совокупность).

Стандартность детали – качественный признак. Размер детали – количественный признак, изменяющийся непрерывно.

Пусть требуется изучить статистическую совокупность однородных объектов относительно некоторого признака. Сплошное обследование, т. е. исследование каждого из объектов статистической совокупности на практике применяется редко. Если исследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование нет смысла. Если совокупность содержит очень большое число объектов, то провести сплошное обследование практически невозможно. В таких случаях из всей совокупности случайно отбирают ограниченное число объектов и исследуют их.

Определение. Генеральной совокупностью называется вся подлежащая изучению совокупность.

Определение. Выборочной совокупностью или выборкой называется совокупность случайно отобранных объектов.

Определение. Объёмом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Объём генеральной совокупности обозначается через N , а выборки через n .

На практике обычно применяют бесповторную выборку , при которой отобранный объект не возвращается в генеральную совокупность (иначе получаем повторную выборку).

Для того чтобы по данным выборки можно было судить о всей генеральной совокупности, выборка должна быть репрезентативной (представительной). Для этого каждый объект должен быть отобран случайно, и все объекты должны иметь одинаковую вероятность попасть в выборку. применяются различные способы отбора (рис. 1).

Способы отбора

(способы организации выборки)

Двухступенчатый

(генеральная совокупность разделена

на группы)

Одноступенчатый

(генеральная совокупность не делится

на группы)


Простой случайный

(объекты извлекаются случайно

из всей совокупности)

Типический

(объект выбирается из каждой типической части)

Комбинированный

(из общего числа групп отбирают несколько и из них по несколько объектов)


Простая случайная повторная выборка

случайная бесповторная выборка

Механический

(из каждой группы

выбирают по одному объекту)

Серийный

(из общего числа групп – серий отбирают несколько

и их сплошь исследуют)

Рис. 1. Способы отбора


Пример 2. На заводе 150 станков производят одинаковые изделия.

1. Изделия со всех 150 станков перемешивают и случайно отбирают несколько изделий – простая случайная выборка .

2. Изделия с каждого станка располагаются отдельно.

      Со всех 150 станков отбирают по несколько изделий, причём анализируют отдельно изделия с более изношенных и менее изношенных станков – типическая выборка.

      С каждого из 150 станков по одному изделию – механическая выборка.

      Из 150 станков отбирают несколько (например, 15 станков), и все изделия с этих станков исследуют – серийная выборка.

      Из 150 станков выбирают несколько, а затем по несколько изделий с этих станков – комбинированная выборка.

§3. СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ.

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РАСПРЕДЕЛЕНИЙ

Пусть требуется изучить статистическую совокупность относительно некоторого количественного признака X . Числовые значения признака будем обозначать через х i .

Из генеральной совокупности извлекается выборка объёма п.

    Количественный признак Х дискретная случайная величина .

Наблюдаемые значения х i называют вариантами , а последовательность вариантов, записанных в возрастающем порядке, – вариационным рядом .

Пусть x 1 наблюдалось n 1 раз,

x 2 наблюдалось n 2 раз,

x k наблюдалось n k раз,

причем
. Числа n i называют частотами , а их отношение к объёму выборки, т.е.
, – относительными частотами (или частостями), причем
.

Значение вариант и соответствующие им частоты или относительные частоты можно записать в виде таблиц 1 и 2.

Таблица 1

Варианта x i

x 1

x 2

x k

Частота n i

n 1

n 2

n k

Таблицу 1 называют дискретным статистическим рядом распределения (ДСР) частот, или таблицей частот.

Таблица 2

Варианта x i

x 1

x 2

x k

Относительная частота w i

w 1

w 2

w k

Таблица 2  ДСР относительных частот, или таблица относительных частот.

Определение. Модой называется наиболее часто встречающийся вариант, т.е. вариант с наибольшей частотой. Обозначается x мод .

Определение. Медианой называется такое значение признака, которое делит всю статистическую совокупность, представленную в виде вариационного ряда, на две равных по числу части. Обозначается
.

Если n нечетно, т.е. n = 2 m + 1 , то = x m +1.

Если n четно, т.е. n = 2 m , то
.

Пример 3 . По результатам наблюдений: 1, 7, 7, 2, 3, 2, 5, 5, 4, 6, 3, 4, 3, 5, 6, 6, 5, 5, 4, 4 построить ДСР относительных частот. Найти моду и медиану.

Решение . Объем выборки n = 20. Составим ранжированный ряд элементов выборки: 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 6, 7, 7. Выделим варианты и подсчитаем их частоты (в скобках): 1 (1), 2 (2), 3 (3),
4 (4), 5 (5), 6 (3), 7 (2). Строим таблицу:

x i

w i

Наиболее часто встречающийся вариант x i = 5. Следовательно, x мод = 5. Так как объем выборки n четное число, то

Если на плоскости нанести точки и соединить их отрезками прямых, то получим полигон частот .

Если на плоскости нанести точки , то получим полигон относительных частот .

Пример 4 . Построить полигон частот и полигон относительных частот по данному распределению выборки:

x i