Для випробувань, що проводять за певним порядком, рекомендується застосовувати послідовний аналіз, бо в цьому разі можна істотно зменшити кількість учасників, необхідних для досягнення статистичної достовірності випробування з нульовим припущенням.

Примітка 1. Головною особливістю послідовного аналізу є те, що розмір вибірки заздалегідь не визначається; замість цього, дієвість нульового припущення перевіряється після отримання кожного набору результатів.

Примітка 2. Допускається використовувати інші статистичні процедури за умови, що вони забезпечують порівняну надійність.


Якщо описаний далі метод послідовного аналізу не застосовано, випробування та статистичний аналіз повинні гарантувати, що помилка оцінки Типу 2 дорівнює 0,05, або менша при стандартному відхиленні, D, 0,5 і що критерій а (ризик виробника) становитиме 0,05 (див. таблицю С.1).

Статистичне оброблення результатів передбачає порівняння показників випробуваного та еталонного дисплеїв. Через те, що ніякими статистичними випробуваннями не можна довести, що два вироби абсолютно однакові, такі випробування використовують для вирішення, чи набагато гірший випробовуваний виріб ніж еталонний. Якщо випробовуваний виріб не набагато гірший, його вважають таким, що відповідає вимогам стандарту.

Проте, нульове припущення Н0 свідчить про те, що показники випробовуваного дисплея дорівнюють показникам еталонного дисплея, або кращі за них. Альтернативне припущення H1 говорить про те, що показники випробовуваного дисплея значно гірші, ніж аналогічні показники еталонного дисплея.

С.7.2 Загальна теорія

У разі статистичного рішення виникає два типи помилок. Перший тип помилки (Тип 1) виникає, коли помилково відкидається нульова гіпотеза; другий тип помилки (Тип 2) виникає, коли нульова гіпотеза помилково не відкидається. Зазначені ризики звичайно позначаються як α та β (див. таблицю С.1).


У разі непослідовного проведення випробувань розмір вибірки повинен бути визначений заздалегідь використанням адаптованої формули Гауса [31].

де µα, µβ— нормальне відхилення (для z підрахунків) відповідно для α та β;

D — стандартне відхилення.

Наприклад, якщо α та β дорівнюють 0,05, а ми хочемо визначити різницю між середніми половинними значеннями стандартних відхилень:

і, отже, для випробувань необхідно залучити не менше ніж 87 учасників.


С.7.3 Статистичне випробування

Для порівняння середніх значень швидкості та оцінок візуального комфорту випробовуваного та еталонного дисплеїв використовують U-тест Барнарда (Barnard, 1946). У таблицях С.2—С.4 дано рекомендації щодо ступінчастого проведення U-тесту Барнарда та наведено приклад.

Розглянемо приклад, у якому х1 та х0 — середні значення підрахунків швидкості пошуку (у знаках за секунду) для випробовуваного та еталонного дисплеїв, відповідно.

Після випробувань із вісьмома учасниками U < U0; отже, нульове припущення не відкидають, тобто швидкість пошуку для випробовуваного дисплея незначно нижча, ніж для еталонного, і вважають, що цю частину випробувань дисплей витримав.



С.8 Відповідність вимогам

Відповідність досягається виконанням таких вимог:

a) швидкість пошуку на випробовуваному дисплеї незначно нижча ніж на еталонному;

b) сприйнята якість випробовуваного дисплея незначно нижча якості еталонного дисплея.


С.9 Критичні значення для ІЛтесту Барнарда

У таблиці С.4 наведені критичні значення для U-тесту Барнарда за α = 0,05, β= 0,05 та D = 0,5. Ці значення отримані інтерполяцією (з використанням лінійної регрессії) даних з таблиці L.3 у Davies [28]. Граничні значення, зазначені у таблиці С.4 у квадратних дужках, наведені як допоміжні при складанні графіка і не повинні використовуватися для прийняття рішення.


Таблиця С.4 Критичні значення для U-тесту Барнарда

Учасник

U0

U1

Учасник

U0

U1

випробувань




випробувань



2

[-6,96]


37

0,548

2,376

3

[-5,045]


38

0,582

2,384

4

[-3,13]

[3,01]

39

0,616

2,392

5

[-2,6]

[2,87]

40

0,65

2,4

6

-2,07

[2,73]

41

0,678

2,408

7

-1,79

[2,645]

42

0,706

2,416

8

-1,51

2,56

43

0,734

2,424

9

-1,33

2,51

44

0,762

2,432

10

-1,15

2,46

45

0,79

2,44

11

-1,034

2,436

46

0,816

2,45

12

-0.918

2,412

47

0,842

2,46

13

-0,802

2,388

48

0,868

2,47

14

-0,686

2,364

49

0,894

2,48

15

-0,57

2,34

50

0,92

2,49

16

-0,498

2,334

51

0,944

2,499

17

-0,426

2,328

52

0,968

2,508

18

-0,354

2,322

53

0,992

2,517

19

-0,282

2,316

54

1,016

2,526

20

-0,21

2,31

55

1,04

2,535

21

-0,154

2,308

56

1,064

2,544

22

-0,098

2,306

57

1,088

2,553

23

-0,042

2,304

58

1,112

2,562

24

0,014

2,302

59

1,136

2,571

25

0,07

2,3

60

1,16

2,58

26

0,114

2,304

61

1,18

2,59

27

0,158

2,308

62

1,2

2,60

28

0,202

2,312

63

1,22

2,61

29

0,246

2,316

64

1,24

2,62

30

0,29

2,32

65

1,26

2,63

31

0,328

2,328

66

1,28

2,64

32

0,366

2,336

67

1,3

2.65

33

0,404

2,344

68

1,32

2,66

34

0,442

2,352

69

1,34

2,67

35

0,48

2,36

70

1,36

2,68

36

0,514

2,368

71

1,378

2,69


Закінчення таблиці С.4


Учасник

випробувань

U0

U1

Учасник

випробувань

U0

U1


72

1,396

2,70

80

1,54

2,78


73

1,414

2,71

81

1,557

2,79


74

1,432

2,72

82

1,574

2,80


75

1,45

2,73

83

1,591

2,81


76

1,468

2,74

84

1,608

2,82


77

1,486

2,75

85

1,625

2,83


78

1,504

2,76

86

1,642

2,84


79

1,522

2,77

87

1,659

2,85



Внести зміни до бібліографії:

Замінити _3) на 1998 після [2] ISO 9241-5: та [3] ISO 9241-7: і на 1997 після [4] ISO 9241-8: . Замінити другу частину назви ISO 9241-7 на «Частина 7. Вимоги до відеотерміналів із відбитками».

Додати нові джерела до бібліографії.

[23] American Psychological Association (1990) Ethical principles of psychologists. American Psychologist, 45, pp. 390—395.