Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
http://srd.pgasa.dp.ua:8080/xmlui/handle/123456789/11638
Назва: | Контроль інформації статистичних даних на основі дисперсійного аналізу |
Інші назви: | Control information of statistical data based on dispersion analysis |
Автори: | Єршова, Ніна Михайлівна Ershova, Nina |
Ключові слова: | experiment information dispersion analysis regression model adequacy criterion method of control експеримент адекватність моделі регресії критерій дисперсійний аналіз інформація спосіб контролю |
Дата публікації: | жов-2023 |
Видавництво: | Придніпровська державна академія будівництва та архітектури |
Бібліографічний опис: | Єршова Н. М. Контроль інформації статистичних даних на основі дисперсійного аналізу / Н. М. Єршова // Український журнал будівництва та архітектури. – 2023. – № 5. – С. 74-84 |
Короткий огляд (реферат): | UK: Постановка проблеми. Точність і достовірність вихідного статистичного матеріалу – найважливіше завдання статистичного спостереження. Навіть за гарної організації спостережень або проведення експерименту з тих чи інших причин можуть виявитися неточності, похибки, тобто помилки реєстрації. Аналіз існуючого способу контролю інформації показує, що він занадто складний, використовує різні критерії залежно від обсягу вибірки, критичні значення критеріїв обираються з таблиць, розрахунок критеріїв виконується за формулами та статистичними функціями майстра функцій Excel. Мета статті – розроблення способу контролю інформації на основі дисперсійного аналізу даних спостережень. Результати. Створено єдину база даних об’єктів-аналогів. Для коректного створення об'єднаної бази даних потрібно бути впевненим, що об’єднані дані належать до однієї генеральної сукупності. Складність проведення дисперсійного аналізу залежить від обсягу вибірок. Якщо об’єднуються кілька вибірок одного обсягу, легко перевірити їх однорідність за допомогою інструменту «Однофакторний дисперсійний аналіз», у вихідній інформації якого видаються розрахункове і критичне значення F-критерію Фішера. На прикладах показано, що за допомогою дисперсійного аналізу можна встановити не тільки однорідність вибірок, а і причину її порушення. Створено спосіб дисперсійного аналізу однорідності вибірок різного обсягу за допомогою інструменту «Описова статистика» пакета аналізу. Виконанj перевіркe адекватності моделі регресії активного експерименту. План експерименту визначає точність моделі регресії. У факторному просторі обирається деяка точка і розглядається безліч точок її околиці. У цій околиці проводиться експеримент, на основі якого будується перша модель. Головна вимога до моделі – здатність передбачати напрямок подальших дослідів із необхідною точністю. І точність цього передбачення в усіх напрямах пошуку повинна бути однаковою. Модель, що задовольняє таку вимогу, називається адекватною. Перевірка здійсненності цієї умови називається аналізом адекватності моделі. У процесі проведення експерименту необхідно переконатися, що вимірювані значення відгуку належать до однієї генеральної сукупності і технологічний процес не вимагає регулювання. Для цього здійснюються паралельні досліди. Після проведення чотирьох дослідів за матрицею планування експерименту необхідно переконатися в однорідності отриманих вибірок відгуку та можливості відтворюваності дослідів. Висновки. Виконані розрахунки доказують, що: існуючий спосіб контролю інформації занадто складний та має суттєві недоліки – використовуються різні критерії залежно від обсягу вибірки, критичні значення критеріїв обираються з таблиць, розрахунок критеріїв виконується за формулами та статистичними функціями майстра функцій Excel; спосіб контролю інформації на основі дисперсійного аналізу не має цих недоліків і є універсальним, тому що існує один критерій для малих і великих вибірок, розрахункове і критичне значення F-критерію видаються у вихідній інформації інструменту «Однофакторний дисперсійний аналіз», його можна використовувати для створення єдиної бази даних об’єктів-аналогів та перевірки адекватності моделі регресії активного експерименту. EN: Problem statement. The accuracy and reliability of the source statistical material is the most important task of statistical observation. Even with a good organization of observations or conducting an experiment, for one reason or another, inaccuracies, errors, that is, registration errors, may appear. Analysis of the existing method of information control shows that it is too complicated, uses different criteria depending on the sample size, critical criteria values are selected from tables, calculation is performed using formulas and statistical functions of the Excel function master. The purpose of the article is to develop a method of information control based on dispersion analysis of observation data. Results. A single database of analogue objects is created. To correctly create a combined database, you need to be sure that the combined data belong to the same general population. The complexity of dispersion analysis depends on the size of the samples. If several samples of the same volume are combined, then it is easy to check their homogeneity with the help of the “One-factor dispersion analysis” tool, in the output of which the calculated and critical value F- Fisher's test - are given. The examples show that with the help of dispersion analysis it is possible not only to establish the homogeneity of samples, but also the reason for its violation. A method of dispersion analysis of the homogeneity of samples of different volumes was created using the “Descriptive statistics” tool of the analysis package. The adequacy check of the regression model of the active experiment was performed. The experiment plan determines the accuracy of the regression model. Some point is selected in the factor space and many points in its neighborhood are considered. An experiment is being conducted in this neighborhood, on the basis of which the first model is being built. The main requirement for the model is the ability to predict the direction of further experiments with the required accuracy. And the accuracy of this prediction in all search directions should be the same. A model that satisfies this requirement is called adequate. Checking the feasibility of this condition is called model adequacy analysis. In the process of conducting the experiment, it is necessary to make sure that the measured response values belong to the same general population and the technological process does not require regulation. For this purpose, is carried parallel experiments. After conducting 4 experiments according to the experiment planning matrix, it is necessary to make sure of the received response samples’ homogeneity and the reproducibility of the experiments. Conclusions. The performed calculations prove that: the existing method of information control is too complex and has significant disadvantages − different criteria are used depending on the sample size, critical values of the criteria are selected from tables, the calculation is performed using formulas and statistical functions of the Excel function master; the method of information control based on dispersion analysis does not have these disadvantages and is universal, because there is one criterion for small and large samples, the calculated and critical value of F-criterion are given in the initial information of the tool “One-factor dispersion analysis”, it can be used to create a single database analogue objects and to check the adequacy of the regression model at the active experiment. |
URI (Уніфікований ідентифікатор ресурсу): | http://srd.pgasa.dp.ua:8080/xmlui/handle/123456789/11638 |
Інші ідентифікатори: | http://uajcea.pgasa.dp.ua/article/view/294686 DOI: 10.30838/J.BPSACEA.2312.241023.74.995 |
Розташовується у зібраннях: | № 5 |
Файли цього матеріалу:
Файл | Опис | Розмір | Формат | |
---|---|---|---|---|
YERSHOVA.pdf | 656,31 kB | Adobe PDF | Переглянути/Відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.