Текст книги "Большая Советская Энциклопедия (СТ)"
Автор книги: Большая Советская Энциклопедия
Жанр:
Энциклопедии
сообщить о нарушении
Текущая страница: 26 (всего у книги 89 страниц)
Статистические группировки
Статисти'ческие группиро'вки, метод группировок, метод обработки и анализа статистических данных, при котором изучаемая совокупность явлений расчленяется на однородные по отдельным признакам группы и подгруппы и каждая из них характеризуется системой статистических показателей. Конкретное выражение С. г. находят в групповых и комбинационных таблицах (см. Таблицы статистические ).
Метод группировок – главный метод статистического изучения общественных явлений; служит предпосылкой для использования различных статистических приёмов и методов анализа, например для использования различных обобщающих показателей, в том числе средних величин .
В дореволюционной русской статистике, в особенности земской статистике , был накоплен богатейший опыт группировок различных объектов, довольно подробно разработаны групповые и комбинационные таблицы. Однако научное обоснование теоретических вопросов применения методов группировок получило только в трудах В. И. Ленина, который высоко оценивал познавательную ценность и практическую значимость метода группировок. О комбинационных таблицах Ленин писал: «Можно сказать без всякого преувеличения, что они внесли бы целый переворот в науку об экономике земледелия» (Полн. собр. соч., 5 изд., т. 24, с. 281). Принципиально важное значение имеют ленинские указания о предварительном политэкономическом анализе существа закономерностей и характеристике типов явлений до начала экспериментов с группировкой материалов исследования.
Кроме анализа структуры совокупности (см. Совокупность статистическая ), метод группировок применяется при характеристике типов явлений и изучении взаимосвязей между различными признаками или факторами. Примерами С. г., выражающих структуру совокупности, служит группировка населения по возрастным группам (с годичными и, чаще, пятилетними интервалами), группировка предприятий по их размерам (табл. 1).
Укрупняя группы или устанавливая неравномерные интервалы, можно выяснить качественные различия между отдельными группами, а затем и определить технико-экономические или социально-экономические типы объектов (предприятий, хозяйств). Так, в С. г. населения по возрасту, кроме простого хронологического принципа, применяют специальные группы: женщины в возрасте 16—54 лет и мужчины в возрасте 16– 59 лет, в этом случае статистика имеет возможность перейти к вычислению народно-хозяйственного показателя – трудовых ресурсов страны. Известная условность в определении границ интервалов (в различных странах они различаются между собой) не имеет принципиального значения. От детальной количественной группировки предприятий и хозяйств можно перейти к выделению нескольких основных качественных групп – мелкие, средние, крупные, а затем к выяснению ряда общих экономических проблем, например процесса концентрации производства и роста его эффективности, производительности труда. Блестящий пример глубокого анализа (проведённого с помощью С. г.) сложного характера закономерностей и связей между величиной хозяйства и его интенсивностью и производительностью имеется в работе Ленина «Новые данные о законах развития капитализма в земледелии» (там же, т. 27, с. 129—227).
Наиболее сложная задача метода группировок заключается в выделении и развёрнутой характеристике типов (т. н. типологическая С. г.) социально-экономических явлений, которые представляют собой выражение форм определенного общественного процесса, существенных особенностей, общих для многих единичных явлений. Ленин всесторонне, комплексно использовал метод группировок в своём анализе расслоения крестьянства, показав процесс формирования основных классов в дореволюционной России, в западно-европейской деревне и в сельском хозяйстве США.
Сов. статистика имеет большой опыт типологических С. г.: например, баланс народного хозяйства СССР предполагает сложную и разветвленную систему С. г.; группировка классового состава населения (табл. 2); группировка основных производственных фондов по социально-экономическим видам хозяйства; группировка совокупного общественного продукта и др.
В буржуазной статистике группировки используются недостаточно, а в случаях применения они большей частью строятся на неправильных основаниях, не способствуют характеристике действительного положения вещей в капиталистических странах, например группировка с.-х. предприятий по размерам земельной площади приукрашивает положение мелкого производства в сельском хозяйстве; группировка населения по занятиям не раскрывает действительную классовую структуру буржуазного общества и т.д.
Социально-экономические особенности социалистического общества ставят новые задачи перед С. г. Метод группировок применяется при анализе выполнения народно-хозяйственных планов, выяснении причин отставания отдельных предприятий и отраслей, выявлении неиспользованных резервов (например, С. г. предприятий по степени выполнения планов, степени рентабельности). С. г. предприятий по степени автоматизации и механизации, электровооружённости труда и по др. технико-экономическим признакам важны для характеристики внедрения достижений научно-технического прогресса в производство.
Табл. 1. – Группировка промышленных предприятий СССР по численности рабочих (1973, % к итогу)
Группы предприятий | Число предприятий | Валовая продукция | Среднегодовая численность промышленно-производствен– ного персонала | Среднегодовая стоимость промышленно-производ– ственных основных фондов |
Предприятия, состоящие на самостоятельном балансе (без электростанций, электросетей и теплосетей) | 100 | 100 | 100 | 100 |
В том числе предприятия со среднегодовой численностью рабочих: | ||||
до 100 | 35,0 | 4,2 | 3,4 | 2,9 |
101—200 | 19,6 | 5,9 | 5,5 | 4,0 |
201—500 | 22,9 | 14,0 | 13,9 | 11,2 |
501-1000 | 11,3 | 14,4 | 14,9 | 13,2 |
1001—3000 | 8,4 | 25,9 | 26,6 | 25,8 |
3001—10000 | 2,5 | 24,0 | 24,1 | 26,5 |
10001 и более | 0,3 | 11,6 | 11,6 | 16,4 |
Табл. 2. – Классовый состав населения СССР, %
1913 | 1928 | 1975 | |
Всё население (включая неработающих членов семей) | 100 | 100 | 100 |
В том числе: | |||
Рабочие и служащие | 17,0 | 17,6 | 82,9 |
из них рабочие | 14,6 | 12,4 | 60,9 |
Колхозное крестьянство и кооперированные кустари | 2,9 | 17,1 | |
Крестьяне-единоличники и некооперированные кустари | 66,7 | 74,9 | 0,0 |
Буржуазия, помещики, торговцы и кулаки | 16,3 | 4,6 | – |
Лит . см. при ст. Статистика .
Т. В. Рябушкин.
Статистические оценки
Статисти'ческие оце'нки, функции от результатов наблюдений, употребляемые для статистического оценивания неизвестных параметров распределения вероятностей изучаемых случайных величин. Например, если X1 ,..., Xn – независимые случайные величины, имеющие одно и то же нормальное распределение с неизвестным средним значением а , то функции – среднее арифметическое результатов наблюдений
и выборочная медиана m = m(X1 ,..., Xn ) являются возможными точечными С. о. неизвестного параметра а . В качестве С. о. какого-либо параметра q естественно выбрать функцию q* (X1 ,..., Xn ) от результатов наблюдений X1 ,..., Xn , в некотором смысле близкую к истинному значению параметра. Принимая какую-либо меру «близости» С. о. к значению оцениваемого параметра, можно сравнивать различные оценки по качеству. Обычно мерой близости оценки к истинному значению параметра служит величина среднего значения квадрата ошибки
(выражающаяся через математическое ожидание оценки E q* и её дисперсию D q*). В классе всех несмещённых оценок (для которых E q* = 0) наилучшими с этой точки зрения будут оценки, имеющие при заданном n минимальную возможную дисперсию при всех q. Указанная выше оценка Х для параметра а нормального распределения является наилучшей несмещенной оценкой, поскольку дисперсия любой другой несмещенной оценки а* параметра а удовлетворяет неравенству , где s2 – дисперсия нормального распределения. Если существует несмещенная оценка с минимальной дисперсией, то можно найти и несмещенную наилучшую оценку в классе функций, зависящих только от достаточной статистики . Имея в виду построение С. о. для больших значений n , естественно предполагать, что вероятность отклонений q* от истинного значения параметра q, превосходящих какое-либо заданное число, будет близка к нулю при n ®¥. С. о. с таким свойством называются состоятельными оценками. Несмещенные оценки, дисперсия которых стремится к нулю при n ®¥, являются состоятельными. Поскольку скорость стремления к пределу играет при этом важную роль, то асимптотическое сравнение С. о. производят по отношению их асимптотической дисперсии. Так, среднее арифметическое Х в приведённом выше примере – наилучшая и, следовательно, асимптотически наилучщая оценка для параметра а , тогда как выборочная медиана m, представляющая собой также несмещенную оценку, не является асимптотически наилучшей, т.к.
(тем не менее использование m имеет также положительные стороны: например, если истинное распределение не является в точности нормальным, а несколько отличается от него, дисперсия Х может резко возрасти, а дисперсия m остаётся почти той же, т. е. m обладает свойством, называется «прочностью»). Одним из распространённых общих методов получения С. о. является метод моментов, который заключается в приравнивании определённого числа выборочных моментов к соответствующим моментам теоретического распределения, которые суть функции от неизвестных параметров, и решении полученных уравнений относительно этих параметров. Хотя метод моментов удобен в практическом отношении, однако С. о., найденные при его использовании, вообще говоря, не являются асимптотически наилучшими, Более важным с теоретической точки зрения представляется максимального правдоподобия метод , который приводит к оценкам, при некоторых общих условиях асимптотически наилучшим. Частным случаем последнего является наименьших квадратов метод . Метод С. о. существенно дополняется оцениванием с помощью доверительных границ .
Лит.: Кендалл М., Стьюарт А., Статистические выводы и связи, пер. с англ., М., 1973; Крамер Г., Математические методы статистики, пер. с англ., 2 изд., М., 1975.
А. В. Прохоров.
Статистические расчёты
Статисти'ческие расчёты, исчисление на основе имеющихся статистических данных новых показателей, расширяющих и обогащающих возможности анализа и познания социально-экономических явлений и процессов. С. р. можно подразделить на 2 группы: расчёты отдельных показателей и комплексные расчёты систем показателей. К первой группе относятся: расчёты относительных показателей (например, показателей выполнения плана, структуры совокупности, соотношения отдельных её частей, динамики, сравнения и интенсивности развития); расчёты средних величин (например, средней заработной платы, средней выработки на одного работающего, средней урожайности и т.п.); исчисление отдельных статистических характеристик (например, средней ошибки выборки, дисперсии , вариационных коэффициентов ), расчёты статистических индексов ; расчёты недостающих показателей на основе балансовых уравнений, интерполяции в рядах динамики ; расчёты сводных показателей в социально-экономической статистике (например, совокупного общественного продукта , национального дохода и др.). Вторую группу составляют комплексные С. р., воссоздающие какой-либо процесс или состояние социально-экономического явления. В них применяются методы статистических группировок , построение индексных систем, теория корреляции и др. статистические приёмы анализа. Непревзойдённые примеры глубоко научных С. р. содержатся в трудах В. И. Ленина. В работе «Развитие капитализма в России» на основе массового статистического материала, собранного земской статистикой и научно обработанного Лениным с помощью метода группировок, доказано развитие капитализма в России: в пореформенной русской деревне происходил процесс классовой дифференциации, выделялись 3 различных социально-экономических типа крестьянских хозяйств: пролетарское и полупролетарское, живущие главным образом или наполовину продажей рабочей силы; середняцкие, источник существования которых – собственное мелкое хозяйство, и зажиточные, эксплуатирующие наёмных рабочих. По расчётам В. И. Ленина, удельный вес этих типов крестьянских хозяйств в конце 19 в. в России составлял соответственно 50, 30 и 20%. В этой же работе дан классический пример С. р. социальной структуры населения России по материалам переписи населения в 1897 с использованием данных переписи населения 1890 в Петербурге и материалов земской статистики. В. И. Ленин установил, что численность пролетариата в России в 1897 составляла «... не менее 22-х миллионов» (Полн. собр. соч., 5 изд., т. 3, с. 505, прим.). В социалистическом хозяйстве С. р. находят применение в балансовых работах (см. Балансовый метод в планировании , Балансовый метод в статистике ), прежде всего в расчётах, связанных с построением баланса народного хозяйства СССР , баланса основных фондов , финансового баланса, баланса трудовых ресурсов , баланса межотраслевого производства и распределения общественного продукта; при сопоставлении показателей между странами в международных сравнениях; при исчислении различных сводных показателей и коэффициентов и т.д. Большую группу составляют С. р. по прогнозированию численности населения и др. показателей социально-экономической статистики на длительный период времени. Следует назвать также расчёты по распространению на генеральную совокупность результатов выборочного наблюдения и оценки их достоверности, Примером С. р. может служить математическая обработка данных межотраслевого баланса народного хозяйства. Для производства комплексных С. р. применяются экономико-математические методы и электронно-вычислительные машины.
Лит.: Эйдельман М Р Межотраслевой баланс общественного продукта, М.,1966: Курс экономической статистики, под ред. А. И. Петрова, 4 изд., М., 1967; Курс демографии, под ред. А. Я. Боярского, М., 1967; Ряузов Н. Н., Общая теория статистики, 2. изд., м., 1971.
Н. Н. Ряузов.
Статистические решения
Статисти'ческие реше'ния, общее название решений, принимаемых на основе результатов наблюдений какого-либо явления, подчиняющегося вероятностным закономерностям (см. Вероятность ), которые известны лишь частично. Например при обеззараживании воды хлорированием количество добавляемого хлора должно зависеть от среднего числа q бактерий в единице объёма. Однако само q неизвестно и оценивается по результатам X1 , X2 ,..., Xn подсчёта численности бактерий в n независимо выбранных единицах объёма воды, при допущении (в простейшей модели) что Xi , при i =1,... n имеют Пуассона распределение с неизвестным средним значением (математическим ожиданием ) q. Поэтому С. р. решение о количестве добавляемого хлора – будет функцией от какой-либо статистической оценки q* параметра q. Последняя должна выбираться с учётом нежелательных последствий как недооценки q (недостаточное обеззараживание воды), так и завышенной оценки q (ухудшение вкуса воды от чрезмерного добавления хлора). Точную математическую формулировку понятий, касающихся С. р. и способов их сравнения, рассматривает статистических решений теория .
Ю. В. Прохоров.
Статистические сборники
Статисти'ческие сбо'рники, справочные издания, содержащие цифровую информацию о развитии народного хозяйства, его отраслей и подразделений. Различаются по назначению (ежегодники, справочники, юбилейные издания, бюллетени и т.п.), объёму (полные и краткие), охвату данных (общеэкономические и отраслевые, по всей стране или по республикам, районам), ведомственной принадлежности, форме (книги и журналы) и периодичности издания (десятилетние, годовые, квартальные, месячные, разовые и др.). Независимо от назначения С. с. охватывают характеристику (состояние и развитие) территории и населения, науки и научно-технического прогресса, промышленности и её отраслей, сельского хозяйства, строительства, транспорта и связи, торговли, финансов и кредита, внешних связей, образования и культуры, здравоохранения, труда и быта, материального благосостояния и развития народного хозяйства в целом. Разработка схем и методологии С. с. – неотъемлемая часть статистики как науки, а их составление и публикация – важный раздел в деятельности (в странах социализма – плановой) статистических организаций (в СССР – ЦСУ СССР и его органов в республиках и на местах). В России систематические издания С. с. осуществлялись с 19 в. («Статистический Временник Российской империи», 1866—94, и «Ежегодник России», 1905—18). В 1924 в СССР вышел первый С. с. по народному хозяйству. В 1925 он был дополнен новым материалом и издан под названием «Народное хозяйство Союза ССР в цифрах». Это был первый опыт отражения в статистических публикациях системы показателей развития народного хозяйства СССР. С 1956 ежегодно (кроме 1958) выпускается С. с. «Народное хозяйство СССР», а с 1957 – С. с. о развитии народного хозяйства отдельно по каждой союзной республике, по краям и областям. Ежегодники являются основной разновидностью С. с. и в др. странах (издаются в 126 странах, в том числе во всех странах СЭВ). Важнейшими С. с. ООН и её специализированных учреждений с 1946 являются: «Статистический ежегодник» («Statistical yearbook»), «Демографический ежегодник» («Demografic yearbook»), «Ежегодник по статистике международной торговли» («Yearbook of international trade statistics»), «Ежегодник ООН» («Yearbook of the United Nations») и др. Продовольственная и с.-х. организация ООН (ФАО) издаёт «Ежегодник по статистике продовольствия и сельского хозяйства» («Yearbook of food and agricultural statistics»), а также ежегодники по статистике рыболовства и лесного хозяйства; Организация Объединённых Наций по вопросам образования, науки и культуры (ЮНЕСКО) издаёт «Международный ежегодник по образованию» («International yearbook of education») и общий статистический ежегодник («Statistical yearbook»). Свои ежегодники издают и многие др. международные организации.
В. М. Симчера.
Статистический анализ многомерный
Статисти'ческий ана'лиз многоме'рный, в широком смысле – раздел математической статистики , объединяющий методы изучения статистических данных, относящихся к объектам, которые характеризуются несколькими качественными или количественными признаками. Наиболее разработана часть С. а. м., основанная на допущении, что результаты отдельных наблюдений независимы и подчинены одному и тому же многомерному нормальному распределению (обычно именно к этой части применяют термин С. а. м. в узком смысле). Иными словами, результат Xj наблюдения с номером j можно представить вектором
Xj = (Xj1 , Xj2 ,..., Xjs ),
где случайные величины Xjk имеют математическое ожидание mk , дисперсию s2k , а коэффициент корреляции между Xjk и Xjl равен rkl . Вектор математических ожиданий m = (m1 ,..., ms ) и ковариационная матрица S с элементами sk sl rkl , k, l = 1,..., s , являются основными параметрами, полностью определяющими распределение векторов X1 ,..., Xn – результатов п независимых наблюдений. Выбор многомерного нормального распределения в качестве основной математической модели С. а. м. отчасти может быть оправдан следующими соображениями: с одной стороны, эта модель приемлема для большого числа приложений, с другой – только в рамках этой модели удаётся вычислить точные распределения выборочных характеристик. Выборочное среднее и выборочная ковариационная матрица
[где обозначает транспонированный вектор , см. Матрица ] суть оценки максимального правдоподобия соответствующих параметров совокупности. Распределение нормально , а совместное распределение элементов ковариационной матрицы S , т. н. распределение Уишарта, является естественным обобщением «хи-квадрат» распределения и играет значительную роль в С. а. м.
Ряд задач С. а. м. более или менее аналогичен соответствующим одномерным задачам (например, задача проверки гипотез о равенстве средних значений в двух независимых выборках). Другого типа задачи связаны с проверкой гипотез о независимости тех или иных групп компонент векторов Xj, проверкой таких специальных гипотез, как гипотеза сферической симметрии распределения Xj и т.д. Необходимость разобраться в сложных взаимосвязях между компонентами случайных векторов Xj ставит новые проблемы. В целях сокращения числа рассматриваемых случайных признаков (уменьшения размерности) или сведения их к независимым случайным величинам применяются метод главных компонент и метод канонических корреляций. В теории главных компонент осуществляется переход от векторов Xj к векторам Yj = (Yj1 ,..., Yjr ). При этом, например, Yj1 выделяется максимальной дисперсией среди всех нормированных линейных комбинаций компонент X1 ; Yj2 имеет наибольшую дисперсию среди всех линейных функций компонент X1 , не коррелированных с Yj1 и т.д. В теории канонических корреляций каждое из двух множеств случайных величин (компонент Xj ) линейно преобразуется в новое множество т. н. канонических величин так, что внутри каждого множества коэффициенты корреляции между величинами равны 0, первые координаты каждого множества имеют максимальную корреляцию, вторые координаты имеют наибольшую корреляцию из оставшихся координат и т.д. (упорядоченные т. о. корреляции называются каноническими). Последний метод указывает максимальную корреляцию линейных функций от двух групп случайных компонент вектора наблюдения. Выводы методов главных компонент и канонических корреляций помогают понять структуру изучаемой многомерной совокупности. Сходным целям служит и факторный анализ , в схеме которого предполагается, что компоненты случайных векторов Xj явлются линейными функциями от некоторых ненаблюдаемых факторов, подлежащих изучению. В рамках С. а. м. рассматривается и проблема дифференциации двух или большего числа совокупностей по результатам наблюдений. Одна часть проблемы заключается в том, чтобы на основе анализа выборок из нескольких совокупностей отнести новый элемент к одной из них (дискриминация), другая – в том, чтобы внутри совокупности разделить элементы на группы, в определённом смысле максимально отличающиеся друг от друга.
Лит.: Андерсон Т., Введение в многомерный статистический анализ, пер. с англ., М., 1963; Kendall М. G., Stuart А., The advanced theory of statistics, v. 3, L., 1966; Dempster A. P., Elements of continuons multivariate analysis, L., 1969.
А. В. Прохоров.