Tipuri de scale statistice. Tipuri și tipuri de date. Cântare de măsurare. Prezentarea unificată a diferitelor tipuri de date

1.1.2.

Scale de măsură de bază De ce este necesară teoria măsurării? Teoria măsurării (denumită în continuare TI) este una dintre componentele statisticii aplicate..

Face parte din

statistica obiectelor de natură nenumerică Utilizarea numerelor în viața și activitățile economice ale oamenilor nu implică întotdeauna că aceste numere pot fi adunate și înmulțite, sau efectuate alte operații aritmetice. Ce ai spune despre o persoană care înmulțește numerele de telefon? Și nicidecum întotdeauna 2+2=4. Dacă puneți două animale într-o cușcă seara și apoi încă două, atunci nu este întotdeauna posibil să găsiți patru animale în această cușcă dimineața. Pot fi mai multe dintre ele - dacă seara ați dus oi sau pisici gestante într-o cușcă. S-ar putea să fie mai puțini - dacă ați plasat doi miei cu doi lupi. Numerele sunt folosite mult mai pe scară largă decât aritmetica. De exemplu, opiniile experților sunt adesea exprimate în scară ordinală(scalele sunt discutate mai detaliat mai jos), i.e. un expert poate spune (și justifica) că un indicator al calității produsului este mai important decât altul, primul obiect tehnologic este mai periculos decât al doilea etc. Dar el este incapabil să spună de câte orisau mai important, deci mai periculos. Experților li se cere adesea să dea o clasare (ordonare) obiectelor examinate, de ex. aranjați-le în ordine crescătoare (sau descrescătoare) de intensitate a caracteristicilor care îi interesează pe organizatorii examenului.

Rangul este un număr (al obiectului examinării) într-o serie ordonată de valori caracteristice pentru diferite obiecte. În statistică, o astfel de serie se numește variațională. Formal, rangurile sunt exprimate prin numerele 1, 2, 3, ..., dar nu puteți face operațiile aritmetice obișnuite cu aceste numere. De exemplu, deși în aritmetica 1 + 2 = 3, nu se poate argumenta că pentru un obiect pe locul trei în ordonare, intensitatea caracteristicii studiate este egală cu suma intensităților obiectelor cu rangurile 1 și 2. Astfel, unul dintre tipurile de evaluare a experților este evaluările studenților. Este puțin probabil ca cineva să susțină că cunoștințele unui elev excelent sunt egale cu suma cunoștințelor unui student D și unui student C (deși 5 = 2 + 3), un elev bun îi corespunde doi elevi săraci (2 + 2 = 4), iar între un elev excelent și un student C există aceeași diferență ca între un elev excelent și un elev sărac (5 - 3 = 4 - 2). Prin urmare, este evident că pentru a analiza acest tip de date calitative nu este nevoie de aritmetică binecunoscută, ci de o altă teorie care oferă baza dezvoltării, studiului și aplicării unor metode de calcul specifice. Acesta este TI.

Când citiți literatura de specialitate, trebuie să aveți în vedere că în prezent termenul „teoria măsurării” este folosit pentru a se referi la o serie de discipline științifice. Și anume, metrologia clasică (știința măsurării mărimilor fizice), TI a luat în considerare aici, câteva alte domenii, de exemplu, teoria algoritmică a măsurătorilor. De obicei, este clar din context ce teorie specifică este discutată. TI sa dezvoltat mai întâi ca o teorie a măsurătorilor psihofizice. În publicațiile de după război, psihologul american S.S. Stevens sa concentrat pe scalele de măsurare. În a doua jumătate a secolului al XX-lea. Domeniul de aplicare al TI se extinde rapid. Să vedem cum s-a întâmplat asta. Unul dintre volumele Encyclopedia of Psychological Sciences publicat în Statele Unite în anii 1950 se numea „Psychological Measurements”. Aceasta înseamnă că compilatorii acestui volum au extins domeniul de aplicare al RTI de la psihofizică la psihologie în general. Și în articolul principal din această colecție, intitulat, vă rugăm să rețineți, „Fundamentals of Measurement Theory”, prezentarea a fost la un nivel matematic abstract, fără referire la vreun domeniu specific de aplicare. În acest articol, s-a pus accentul pe „homomorfismele sistemelor empirice cu relații în cele numerice” (nu este nevoie să intrăm aici în acești termeni matematici), iar complexitatea matematică a prezentării a crescut în comparație cu lucrările lui S.S. Stevens.

Deja într-unul dintre primele articole interne despre RTI (sfârșitul anilor 1960), s-a stabilit că punctele atribuite de experți la evaluarea obiectelor de examinare sunt, de regulă, măsurate pe o scară ordinală. Lucrările casnice apărute la începutul anilor 1970 au dus la o extindere semnificativă a zonei de utilizare a produselor din cauciuc. A fost aplicat calimetriei pedagogice (măsurarea calității cunoștințelor studenților), în cercetarea de sisteme, în diverse probleme ale teoriei evaluărilor experților, pentru agregarea indicatorilor de calitate a produselor, în studiile sociologice etc.

Rezultatele acestei etape au fost rezumate într-o monografie. Ca două probleme principale ale RTI împreună cu stabilirea tipului scalei măsurarea unor date specifice, a fost propusă căutarea unor algoritmi de analiză a datelor, al căror rezultat nu se modifică cu nicio transformare acceptabilă la scară (de ex. invariant referitor la această transformare).

Metrologii s-au opus inițial cu tărie la utilizarea termenului „măsurare” pentru atributele calitative. Cu toate acestea, treptat, obiecțiile au dispărut și până la sfârșitul secolului al XX-lea. TI a început să fie considerată ca o teorie științifică generală.

Șase tipuri de cântare.În conformitate cu TI, atunci când modelăm matematic un fenomen sau un proces real, ar trebui în primul rând să se stabilească tipuri de cântare, în care măsurat anumite variabile. Tipul de scară specifică grup de transformări de scară admisibile. Transformările valide nu modifică relațiile dintre obiectele de măsurare. De exemplu, la măsurarea lungimii, trecerea de la arshins la metri nu modifică relația dintre lungimile obiectelor luate în considerare - dacă primul obiect este mai lung decât al doilea, atunci acest lucru va fi stabilit atât atunci când este măsurat în arshins, cât și atunci când este măsurat. în metri. Vă rugăm să rețineți că, în acest caz, valoarea numerică a lungimii în arshins diferă de valoarea numerică a lungimii în metri - doar rezultatul comparării lungimii a două obiecte nu se modifică.

Să indicăm principalele tipuri de scale de măsurare și grupurile corespunzătoare de transformări permise.

ÎN scara de nume(un alt nume pentru această scară este nominal; acesta este un nume englezesc rescris cu litere ruse cântare) acceptabil sunt toate transformări unu-la-unu. În această scară, numerele sunt folosite doar ca markeri. Cam la fel ca atunci când predați rufele la spălătorie, adică. doar pentru a distinge obiectele. Scara numelor măsoară, de exemplu, numerele de telefon, numerele de mașini, numerele de pașapoarte și numerele de identificare a studenților. Numerele certificatelor de asigurare ale asigurărilor de pensii de stat, asigurărilor medicale, TIN (numărul individual de contribuabil) sunt măsurate într-o scară de nume. Genul oamenilor este, de asemenea, măsurat într-o scară de nume, rezultatul măsurării ia două valori - masculin, feminin. Rasa, naționalitatea, culoarea ochilor, culoarea părului sunt caracteristici nominale. Numerele literelor din alfabet sunt, de asemenea, măsurători în scara de denumire. Nimeni în minte nu s-ar gândi să adauge sau să înmulțească numere de telefon nu au sens; Nimeni nu va compara literele și nu va spune, de exemplu, că litera P este mai bună decât litera S.

ÎN Utilizarea numerelor în viața și activitățile economice ale oamenilor nu implică întotdeauna că aceste numere pot fi adunate și înmulțite, sau efectuate alte operații aritmetice. Ce ai spune despre o persoană care înmulțește numerele de telefon? Și nicidecum întotdeauna 2+2=4. Dacă puneți două animale într-o cușcă seara și apoi încă două, atunci nu este întotdeauna posibil să găsiți patru animale în această cușcă dimineața. Pot fi mai multe dintre ele - dacă seara ați dus oi sau pisici gestante într-o cușcă. S-ar putea să fie mai puțini - dacă ați plasat doi miei cu doi lupi. Numerele sunt folosite mult mai pe scară largă decât aritmetica. Singurul lucru pentru care dimensiunile la scară de denumire sunt bune este să facă distincția între obiecte. În multe cazuri, aceasta este tot ceea ce li se cere. De exemplu, vestiarele din vestiarele pentru adulți se disting prin numere, adică. numere, iar în grădinițe folosesc desene, deoarece copiii încă nu știu numerele. acceptabil numerele sunt folosite nu numai pentru a diferenția obiectele, ci și pentru a stabili ordinea între obiecte. Cel mai simplu exemplu sunt evaluările elevilor. Este simbolic faptul că în gimnaziu se folosesc clasele 2, 3, 4, 5, iar în gimnaziu se exprimă verbal exact același sens - nesatisfăcător, satisfăcător, bun, excelent. Acest lucru subliniază natura „non-numerică” a evaluărilor elevilor. Pe o scară ordinală

Setarea tipului de scară, de ex. specificarea unui grup de transformări admisibile ale scalei de măsurare este o chestiune de specialitate în domeniul aplicat relevant. Astfel, în monografie, acționând ca sociologi, am considerat evaluările atractivității profesiilor să fie măsurate la scară ordinală.

Cu toate acestea, unii sociologi nu au fost de acord cu noi, considerând că absolvenții de școală folosesc o scală cu un grup mai restrâns de transformări permise, de exemplu, o scală de intervale. Evident, această problemă nu se referă la matematică, ci la științele umane. Pentru a o rezolva, poate fi efectuat un experiment destul de intensiv în muncă. Până la setare, se recomandă adoptarea unei scale ordinale, deoarece aceasta garantează împotriva eventualelor erori.

Evaluările experților, așa cum sa menționat deja, ar trebui adesea considerate măsurate pe o scară ordinală. Un exemplu tipic este sarcina de a clasifica și clasifica instalațiile industriale supuse asigurării de mediu.

De ce este firesc să exprime opiniile experților la scară ordinală? După cum au arătat numeroase experimente, o persoană răspunde întrebărilor de natură calitativă, de exemplu, comparativă, mai corect (și cu mai puțină dificultate) decât la cele cantitative. Astfel, îi este mai ușor să spună care dintre două greutăți este mai grea decât să indice greutatea lor aproximativă în grame.

Multe alte tipuri de scale ordinale sunt utilizate în diferite domenii ale activității umane. De exemplu, în mineralogie se folosește scara Mohs, care clasifică mineralele după criteriul durității. Și anume: talcul are un scor de 1, gips - 2, calciu - 3, fluorit - 4, apatit - 5, ortoclază - 6, cuarț - 7, topaz - 8, corindon - 9, diamant - 10. Un mineral cu o valoare mai mare numărul este mai dur decât un mineral cu un număr mai mic, îl zgârie când este apăsat.

În medicină, scalele ordinale sunt scala etapelor de hipertensiune arterială (conform lui Myasnikov), scala gradelor de insuficiență cardiacă (conform lui Strazhesko-Vasilenko-Lang), scala severității insuficienței coronariene (după Fogelson) etc. . Toate aceste cântare sunt construite după următoarea schemă: nicio boală detectată; primul stadiu al bolii; a doua etapă; a treia etapă... Uneori se disting etapele 1a, 1b etc. Fiecare etapă are o caracteristică medicală unică. Când se descriu grupurile de dizabilități, numerele sunt folosite în ordine inversă: cel mai grav este primul grup de dizabilități, apoi al doilea, cel mai ușor este al treilea.

Numerele caselor sunt, de asemenea, măsurate pe o scară ordinală - ele arată în ce ordine sunt situate casele de-a lungul străzii. Numerele de volum din lucrările colectate ale unui scriitor sau numerele de caz dintr-o arhivă de întreprindere sunt de obicei asociate cu ordinea cronologică a creării lor.

La evaluarea calității produselor și serviciilor, în așa-numita În calimetrie (traducere literală: măsurarea calității), scalele ordinale sunt populare. Și anume, o unitate de producție este evaluată ca fiind acceptabilă sau necorespunzătoare. Pentru o analiză mai amănunțită, se folosește o scală cu trei gradații: există defecte semnificative - sunt doar defecte minore - nu există defecte. Uneori se folosesc patru gradații: există defecte critice (care fac imposibilă utilizarea) - există defecte semnificative - există doar defecte minore - nu există defecte.

Clasificarea produselor are o semnificație similară - premium, clasa întâi, clasa a doua,...

Când se evaluează impactul asupra mediului, prima evaluare, cea mai generală, este de obicei ordinală, de exemplu: mediul natural este stabil - mediul natural este oprimat (degradat). În mod similar, la scara medicală de mediu: nu există un impact pronunțat asupra sănătății umane - se remarcă un impact negativ asupra sănătății.

Scara ordinală este utilizată în multe alte domenii. În econometrie, acestea sunt în primul rând diferite metode de evaluări ale experților. (Vezi materialul dedicat acestora în partea 3).

Toate scalele de măsurare sunt împărțite în două grupe - scale de caracteristici calitative și scale de caracteristici cantitative. Scara ordinală și scara numelor sunt principalele scale ale caracteristicilor calitative

. Prin urmare, în multe domenii specifice, rezultatele analizei calitative pot fi considerate măsurători pe aceste scale. Scale de caracteristici cantitative sunt scale de intervale, rapoarte, diferențe, absolute . Pe o scară măsurați cantitatea de energie potențială sau coordonatele unui punct pe o dreaptă. În aceste cazuri, nici originea naturală, nici unitatea naturală de măsură nu pot fi marcate pe scară. Cercetatorul trebuie sa stabileasca punctul de plecare si sa aleaga el insusi unitatea de masura. = 5/9 (0 Transformările acceptabile la scara intervalului sunt transformări liniare crescătoare, adică. funcții liniare. Scalele de temperatură Celsius și Fahrenheit sunt legate tocmai prin această relație: 0 CU Cercetatorul trebuie sa stabileasca punctul de plecare si sa aleaga el insusi unitatea de masura. F Transformările acceptabile la scara intervalului sunt transformări liniare crescătoare, adică. funcții liniare. Scalele de temperatură Celsius și Fahrenheit sunt legate tocmai prin această relație: 0- 32), unde 0

- temperatura (în grade) pe scara Celsius și 0 - temperatura pe scara Fahrenheit. Dintre scalele cantitative, cele mai comune în știință și practică sunt scalele

relatii. Au un punct de referință natural - zero, adică. absența cantității, dar nici o unitate naturală de măsură. Cele mai multe unități fizice sunt măsurate pe scara raportului: masa corporală, lungimea, sarcina, precum și prețurile din economie. Transformările acceptabile ale scalei raportului sunt similare (schimbând doar scara). Cu alte cuvinte, transformări liniare crescătoare fără un termen inactiv. Un exemplu este conversia prețurilor dintr-o monedă în alta la un curs fix.

Să presupunem că comparăm eficiența economică a două proiecte de investiții folosind prețuri în ruble. Să se dovedească primul proiect mai bun decât al doilea. Acum să trecem la moneda celei mai puternice puteri economice din lume - yuanul, folosind o rată de conversie fixă. Evident, primul proiect ar trebui să fie din nou mai profitabil decât al doilea. Acest lucru este evident din considerente generale. Cu toate acestea, algoritmii de calcul nu asigură în mod automat că această condiție evidentă este îndeplinită. Trebuie să verificăm dacă a fost finalizat. Rezultatele unui astfel de test pentru valori medii sunt descrise mai jos (secțiunea 2.1.3). scale, rezultate măsurători - numere în sensul obișnuit al cuvântului. Un exemplu este numărul de persoane din cameră. Pentru o scară absolută, este permisă doar o transformare de identitate.

În procesul de dezvoltare a domeniului de cunoaștere corespunzător, tipul de scară se poate schimba. Deci, mai întâi s-a măsurat temperatura prin ordinal scara (mai rece - mai caldă). Apoi - prin interval (Scazi Celsius, Fahrenheit, Reaumur). În cele din urmă, după descoperirea zeroului absolut, temperatura poate fi considerată măsurată pe o scară relaţii

(Scara Kelvin). Trebuie remarcat faptul că, uneori, există dezacorduri între specialiști cu privire la care scale ar trebui folosite pentru a considera anumite valori reale măsurate. Cu alte cuvinte, procesul de măsurare include și determinarea tipului de scară (împreună cu rațiunea pentru alegerea unui anumit tip de scară). Pe lângă cele șase tipuri principale de scale enumerate, uneori sunt folosite și alte scale.

Discuția scărilor de măsurare va fi continuată în continuare într-un context mai larg - ca unul dintre conceptele de statistică a datelor nenumerice.

Anterior

Introducere

Originile statisticii matematice (SM) sunt un volum mare de date statistice și necesitatea, după o prelucrare specială, de a face o prognoză a evoluției situației inițiale. Prima secțiune

DOMNIȘOARĂ. – statistici descriptive – concepute pentru a colecta, prezenta într-o formă convenabilă și descrie datele sursă. Statistica descriptivă prelucrează două tipuri de date: cantitative și calitative.

Cele cantitative includ înălțimea, greutatea etc. la calitativ – tip de temperament, gen.

Statisticile descriptive vă permit să descrieți, să generalizați și să reduceți proprietățile matricelor de date la forma dorită. A doua secțiune

DOMNIȘOARĂ. – teoria inferenței statistice este un sistem formalizat de metode pentru rezolvarea problemelor care se rezumă la o încercare de a deriva proprietățile unei game largi de date prin examinarea unei mici părți din acestea.

Inferența statistică se bazează pe statistici descriptive și de la proprietățile particulare ale eșantionului de date trecem la proprietățile particulare ale populației. Secțiunea a treia

DOMNIȘOARĂ. - planificare si analiza experta. Conceput pentru a detecta și analiza relațiile cauzale dintre variabile.

Măsurare, scale și statistici Măsurare

este atribuirea unor numere obiectelor în conformitate cu anumite reguli. Numerele sunt obiecte ușor de procesat în care transformăm anumite proprietăți ale percepției noastre. sau scară nominală. Măsurarea nominală se rezumă la împărțirea unui set de obiecte în clase, fiecare dintre ele conținând obiecte identice după un semn sau o proprietate, de exemplu, după naționalitate, după gen, după tip de temperament.

În aceste măsurători, fiecăreia dintre clase i se atribuie un număr, dar acesta este folosit doar ca nume al acestei clase și nu se presupune că trebuie efectuate operații asupra acestor numere.

Măsurarea ordinală este posibil doar atunci când în obiectele de calificare se pot distinge diferite grade ale semnului și proprietății pe baza cărora se face calificarea (de exemplu, concursul de frumusețe „Bărbați deștepți și fete inteligente”). În acest caz, numerele folosesc doar una dintre proprietățile lor - capacitatea de a fi ordonate.

Scala intervalului este acceptat atunci când este posibil să se determine nu numai cantitatea, proprietatea sau semnul dintr-un obiect, ci și să se înregistreze diferențe egale între obiecte, adică puteți introduce o unitate de măsură pentru o proprietate sau semn (de exemplu, temperatura, vârstă).

Numerele din măsurătorile pe intervale au proprietatea de a fi ordonate și lipsite de ambiguitate. Diferențele egale de numere corespund unor diferențe egale ale valorilor proprietății sau atributului măsurat al unui obiect.

Scarărelaţii diferă de intervalul unu doar prin faptul că punctul de referință nu este arbitrar, ci indică absența completă a proprietății sau caracteristicii măsurate a obiectului.

Variabilele și măsurarea lor

Variabilele pot fi discrete sau continue. La măsurarea, în special a proprietăților sau caracteristicilor continue, se poate realiza doar o valoare indirectă a variabilei, adică una apropiată de cea exactă, iar gradul acestei aproximări va fi determinat de sensibilitatea măsurării.

Sensibilitatea este determinată de unitatea minimă de cântare digitală de care dispunem.

Limitele pentru valoarea exactă sunt stabilite prin adăugarea și scăderea jumătate din sensibilitatea procesului de măsurare.

Un set de numere este scris folosind o cantitate arbitrară cu un index care indică numărul de serie al cantității din lanțul de date (xi).

DesemnareSși proprietățile sale

4.

5.

Tabelarea și prezentarea datelor

Înainte de a analiza și interpreta datele, acestea sunt rezumate.

Generalizare– înregistrarea datelor sub formă de tabel. Etapa cea mai elementară.

Variind– ordonarea variabilelor de la maxim la minim sau invers. Această ordonare se numește rang negrupat.

Distribuția de frecvență. Lista clasată este restrânsă, indicând toate măsurătorile obținute într-un rând, o dată, iar în coloana alăturată indicați frecvența cu care are loc această evaluare

Distribuția frecvențelor grupate utilizat pentru un număr mare de evaluări (100 sau mai mult). Evaluările sunt grupate după caracteristici și fiecare astfel de grup este numit categorie de rating. În cazul absorbției complete a tuturor datelor de către aceste grupuri, vorbim de o distribuție a frecvențelor grupate.

Construirea unei distribuții de frecvențe grupate

Interval

Fiecare măsurătoare asupra unui obiect se face la o anumită scară. Diferitele coordonate ale aceluiași vector de observație pot fi exprimate pe scări diferite. Astfel, în § 5.1 este dat un exemplu de vector de observații (Tabelul 5.1), în care primele coordonate sunt de natura mărcilor convenționale (afilierea socială a familiei, genul și profesia capului de familie, calitatea de condițiile de viață), în timp ce restul sunt exprimate ca cifre (număr de membri ai familiei, numărul de copii, venitul mediu anual etc.). Proprietățile acestor cântare diferă foarte mult unele de altele. Astfel, despre sexul capului de familie putem spune doar că este fie bărbat, fie femeie și că sexul masculin este diferit de sexul feminin; despre condițiile de viață – că sunt la fel sau diferite și că în unele cazuri unele condiții de viață sunt mai bune decât altele; despre cheltuieli, putem spune că cheltuielile cu hrana unei familii sunt mai mici, egale sau mai mari decât cheltuielile unei alte familii și puteți calcula diferența de cheltuieli între familii și de câte ori diferă cheltuielile unei familii de cheltuielile unei familii; altul.

Mai jos descriem principalele tipuri de scale și tehnici matematice de unificare a datelor exprimate în diferite scale, care de obicei preced utilizarea metodelor de analiză multivariată.

10.2.1. Scara nominală.

Această scară este folosită doar pentru a clasifica un individ sau un obiect într-o anumită clasă. Dacă sunt descrise în prealabil clase și reguli posibile pentru atribuirea unui obiect, atunci ele vorbesc despre o scară clasificată, dacă nu, atunci despre una necategorizată; Un exemplu de scară clasificată este genul. În studiu, unui individ i se atribuie unul dintre cele două semnificații: litera M sau F, un semn special sau numărul 1 sau 2. În principiu, alte litere și numere ar putea fi atribuite, este important doar ca un unu-la- să se mențină o corespondență între coduri. Pentru a introduce date clasificate, este convenabil să folosiți „meniul”, adică o listă de categorii posibile cu codurile lor. Exemple de variabile nominale necategorizate sunt numele, numele și locul nașterii.

O altă sursă importantă de date nominale neclasificate este listată în § 5.3. Acesta este cazul în care o observație este dată asupra unei perechi de obiecte, iar variabila indică doar dacă obiectele aparțin aceleiași clase sau nu și nu indică claselor cărora le aparțin.

Ultima împrejurare nu trebuie considerată o curiozitate. Desigur, dacă clasele sunt predefinite și nu este dificil să atribuiți fiecare obiect unei anumite clase, atunci acest lucru ar trebui făcut și înregistrat cărei clase îi aparține obiectul. Dar uneori clasele nu sunt descrise în avans, crearea clasificării lor complete este tocmai scopul lucrării și, în același timp, este posibil să se evalueze dacă obiectele aparțin unei clase. De exemplu, se poate vorbi despre un curs „apropiat”, „similar” al bolii la doi pacienți, deși nu sunt descrise toate variantele evoluției bolii. Mai mult, identificarea unor variante similare empiric ale evoluției bolii poate servi ca punct de plecare pentru identificarea și descrierea tuturor variantelor posibile ale dezvoltării procesului patologic. Același lucru este valabil și pentru identificarea grupurilor socio-economice etc.

Aceeași variabilă poate acționa în capacități diferite, în funcție de scopul utilizării. Deci, de exemplu, o variabilă nominală necategorizată - numele programului - servește doar la individualizarea programului și, dacă sunt puține programe, poate fi găsită prin vizualizarea directă a listei de programe. În același timp, dacă numele programelor din listă sunt ordonate într-un fel (de exemplu, în ordine alfanumerică), atunci numele programului ca imagine de căutare conține elemente de valoare ordinală. Pentru fiecare două nume putem spune că fie sunt aceleași, fie că unul dintre ele îl precede pe celălalt în modul acceptat de ordonare. Când se schimbă metoda de ordonare, se schimbă și următoarea relație.

Operațiile aritmetice pe mărimi măsurate la scară nominală sunt lipsite de sens. În consecință, atât mediana, cât și media aritmetică nu pot fi utilizate ca măsuri semnificative ale tendinței centrale. Mai multe statistici relevante aici sunt moda.

10.2.2. Scară ordinală (ordinală).

Pe lângă funcția de atribuire a obiectelor unei anumite clase, această scală aranjează și clase în funcție de gradul de exprimare al unei proprietăți date. Fiecărei clase i se atribuie propriul simbol, astfel încât ordinea predeterminată a simbolurilor să se potrivească cu ordinea claselor. Astfel, dacă claselor li se atribuie valori numerice, atunci clasele vor fi ordonate după succesiunea numerică; dacă sunt scrise, atunci clasele vor fi ordonate în ordine alfabetică, iar dacă sunt cuvinte, atunci clasele vor fi ordonate în funcție de semnificațiile cuvintelor.

De exemplu, § 5.3 oferă un exemplu de scară ordinală pentru a descrie calitatea condițiilor de locuit cu patru gradații (clase): „rău”, „satisfăcător”, „bun”, „foarte bun”. Desigur, aceste clase pot fi numerotate cu numerele 1,2,3,4 sau 4,3,2,1 sau cu literele a, b, c, d etc.

Alte exemple cunoscute de scale ordinale sunt: ​​în medicină - scara stadiilor de hipertensiune conform lui Myasnikov, scala gradelor de insuficiență cardiacă după Strazhesko-Vasilenko-Lang, scara severității insuficienței coronariene după Fogelson; în mineralogie - scara Mohs (talc - 1, gips - 2, calcit - 3, fluorit - 4, apatit - 5, ortoclază - 6, cuarț - 7, topaz - 8, corindon - 9, diamant - 10), conform care minerale sunt clasificate în funcție de criteriul durității; în geografie - scara vântului Beaufort („calm”, „vânt ușor”, „vânt moderat”, etc.).

Structura scării ordinale nu este distrusă de nicio transformare de cod unu-la-unu care păstrează ordinea. La fel ca în cazul unei scale nominale, operațiile aritmetice nu își păstrează semnificația la transformarea scalelor ordinale, de aceea este indicat să nu le folosiți. Nu este dificil să arătăm că dacă ne bazăm doar pe proprietățile scărilor și nu implicăm considerații suplimentare externe scalelor, atunci singurele statistici permise atunci când se folosesc scalele ordinale sunt membrii seriei de variații.

10.2.3. Scale cantitative.

O scară în care se poate reflecta cât de mult diferă un obiect de altul în ceea ce privește gradul de exprimare a unei proprietăți date se numește interval. Pentru a defini o scară de interval, trebuie să definiți obiectele corespunzătoare punctului de plecare și unității de măsură. Și apoi, atunci când măsurați, atribuiți fiecărui obiect un număr care să arate câte unități de măsură diferă acest obiect de obiectul luat ca punct de plecare. Cel mai simplu exemplu de scară de interval este temperatura în grade Celsius, unde 0° este punctul de plecare și 1° este unitatea de măsură.

Structura scării intervalului nu se modifică cu transformările liniare ale formei Efectul unei astfel de transformări este de a muta punctul de plecare cu b unități și de a înmulți unitatea de măsură cu a.

De exemplu, transformând , unde este temperatura, puteți schimba temperatura în grade Fahrenheit.

Dacă începutul unei scale de interval este punctul zero absolut, atunci devine posibil să se reflecte pe scară de câte ori diferă o măsurătoare de alta. Scara corespunzătoare se numește scară de raport. Scala raportului permite transformări ale formei . Cele mai multe scale utilizate în fizică sunt fie scale de interval (temperatura, energie potențială) fie scale de raport (timp, masă, sarcină, distanță).

Deoarece scalele cantitative permit transformări aritmetice, media aritmetică poate fi folosită pentru a descrie tendința cumulativă în gruparea datelor.

10.2.4. Prezentarea unificată a diferitelor tipuri de date.

Fiecare tip de scară are propria sa tehnică statistică. Astfel, pentru variabilele măsurate la scară nominală, puteți utiliza criteriul - pentru distribuțiile polinomiale, criteriul - pentru verificarea absenței asociațiilor în tabelele de contingență și criteriile pentru testarea ipotezelor despre probabilitate într-o distribuție binomială. Scala ordinală corespunde metodelor bazate pe utilizarea rangurilor (corelarea rangurilor, teste neparametrice pentru testarea ipotezelor de tip) etc.). Cu o scară de interval, se poate folosi întregul arsenal de metode statistice.

Mai mult, au fost dezvoltate proceduri statistice pentru cazurile în care se observă vectori, unele dintre ale căror coordonate sunt măsurate pe o scară, iar altele pe alta. Un exemplu tipic este analiza obișnuită a varianței (vezi § 3.5), în care factorii sunt măsurați pe o scară nominală, iar răspunsurile corespunzătoare combinațiilor lor sunt măsurate pe o scară de interval.

Cu toate acestea, o serie de metode statistice, în special metodele moderne de analiză multivariată, presupun că datele sunt măsurate pe scale similare. Pentru a putea aplica aceste metode în cazul general al datelor eterogene, au fost propuse diverse tehnici de unificare a datelor. Să facem cunoștință cu cele mai importante dintre ele.

Reducerea la variabile binare. Această metodă se bazează pe introducerea, în locul fiecărei variabile aleatoare inițiale, a unei serii de variabile aleatoare care iau doar două valori: 0 și 1.

Pentru o valoare nominală cu k gradații, k valori astfel încât când când

Aceeași tehnică este uneori folosită atunci când se reduce o variabilă aleatoare măsurată pe o scară ordinală la variabile binare. Cu toate acestea, într-un număr de cazuri, se dovedește a fi convenabil să evidențiem nu evenimentul, ci evenimentul. Pentru a compara meritele relative ale acestor două metode, luați în considerare următoarea problemă de model. Fie o variabilă aleatoare distribuită uniform pe segment, fie un număr mic;

Funcția modelează în mod evident primul mod de a trece la variabile binare, iar funcția modelează al doilea. După calcule simple obținem:

Principalul dezavantaj al tehnicii descrise este introducerea unui număr mare de variabile noi și pierderea parțială a informațiilor conținute în date, atât din cauza cuantizării, cât și datorită unei reduceri artificiale a nivelului scalei utilizate.

Digitalizarea variabilelor nominale și ordinale. Această metodă este exact opusul a ceea ce tocmai s-a conturat în ea, toate variabilele sunt ridicate, trase la nivelul celor cantitative, atribuindu-le gradații de valori numerice. Uneori, valorile atribuite se numesc etichete.

Alegerea etichetelor depinde în mod semnificativ de scopul pentru care se realizează digitizarea. Astfel, dacă se studiază mărimea relației dintre două caracteristici nominale, atunci etichetele pot fi selectate din condiția maximizării coeficientului de corelație dintre ele , . Dacă vorbim de atribuirea observațiilor uneia dintre clasele predeterminate (analiza discriminantă), atunci alegerea etichetelor poate fi asociată cu condiția maximizării distanței normalizate în spațiul eșantionar multidimensional între centrele populațiilor studiate (distanțele Mahalanobis) . Uneori, această sarcină este simplificată și etichetele sunt atribuite coordonată cu coordonată, astfel încât să maximizeze doar distanța normalizată dintre valorile medii ale unei coordonate date. O comparație statistică folosind exemplul unei probleme particulare a eficacității abordărilor globale și coordonate cu coordonate ale digitizării în analiza discriminantă poate fi găsită în.

Tehnicile de digitizare prezentate, atunci când etichetele sunt selectate din condiția maximizării unui funcțional selectat corespunzător, se încadrează în cadrul abordării extreme a formulării principalelor probleme de statistică matematică menționată în § 1.2.

În general, digitizarea variabilelor calitative este o sarcină complexă atât în ​​termeni computaționali, cât și pur statistici. Anumite aspecte ale acestei probleme sunt discutate în lucrări.



Într-un studiu empiric, de exemplu, pot fi întâlnite următoarele variabile (este indicată codarea lor cea mai probabilă):

Pol: 1 = masculin

2 = feminin

Starea civilă: 1 = singur

2 = căsătorit

3 = văduv/văduvă

4 = divorțat

Fumator 1 = nefumător

2 = fumător ocazional

3 = fumător intens

4 = fumător foarte intens.

Greutate. etc.

Să ne uităm mai întâi la coloana Sex. Vedem că atribuirea corespondenței numerelor 1 și 2 ambelor sexe este absolut arbitrară, acestea ar putea fi schimbate sau desemnate de alte numere.

Desigur, nu ne referim la faptul că femeile sunt cu un pas mai jos decât bărbații sau că bărbații contează mai puțin decât femeile. În consecință, numerele individuale nu au nici un sens empiric. În acest caz, vorbim despre variabile legate de scara nominala. Exemplul nostru ia în considerare o variabilă scalată nominal care are două categorii. Această variabilă are un alt nume - dihotomică.

Situația este aceeași cu variabila Starea civilă. Nici aici corespondența dintre numere și categorii de stare civilă nu are semnificație empirică. Dar, spre deosebire de Gen, această variabilă nu este dihotomică - are patru categorii în loc de două.

Capacitățile de procesare ale variabilelor legate de scara nominală sunt foarte limitate. Strict vorbind, numai analiza de frecvență a unor astfel de variabile poate fi efectuată. De exemplu, calcularea valorii medii pentru variabila Starea civilă este complet lipsită de sens. Variabile legate de scara nominala sunt adesea folosite pentru grupări care împart un eșantion de populație în categorii ale acestor variabile. Se efectuează aceleași teste statistice pe subprobele și apoi rezultatele sunt comparate între ele.

Pentru exemplul următor, luați în considerare variabila Fumatul. Aici cifrelor codului li se atribuie un sens empiric în ordinea în care apar în listă. Variabila Fumatul este în final sortată în ordinea importanței de jos în sus: un fumător moderat fumează mai mult decât un nefumător, un fumător intens fumează mai mult decât un fumător moderat etc. Astfel de variabile, pentru care sunt utilizate valori numerice care corespund unei schimbări treptate a semnificației empirice, sunt denumite ca scară ordinală.

Cu toate acestea, semnificația empirică a acestor variabile nu depinde de diferența dintre valorile numerice adiacente. Astfel, în ciuda faptului că diferența dintre valorile numerelor de cod pentru un nefumător și un fumător ocazional și între un fumător ocazional și un fumător intens în ambele cazuri este egală cu unul, nu se poate argumenta că diferența dintre un nefumător și un fumător ocazional și între un fumător ocazional și un fumător intens este aceeași. Pentru aceasta, aceste concepte sunt prea vagi.

Pe lângă analiza frecvenței, variabilele cu scară ordinală Ele permit, de asemenea, calcularea anumitor caracteristici statistice, cum ar fi mediane. În unele cazuri este posibil să se calculeze valoarea medie. Dacă urmează să se stabilească o relație (corelație) cu alte variabile de acest fel, se poate utiliza în acest scop coeficientul de corelație de rang.

Pentru a compara diferite eșantioane de variabile legate de scara ordinală, pot fi utilizate teste neparametrice, ale căror formule operează pe ranguri.

Să luăm acum în considerare variabila Creștere. Valorile sale absolute reflectă relația ordinală dintre respondenți, dar diferența dintre două valori are și semnificație empirică. De exemplu, dacă înălțimea lui Ivan este de 180, iar a lui Fedor este de 170, iar a lui Peter este de 160, putem spune că Ivan este mai înalt decât Fedor și Peter este chiar mai înalt. Asemenea variabile care au o diferență (interval) între două valori și au semnificație empirică sunt clasificate ca scara intervalului. Ele pot fi procesate prin orice metode statistice fără restricții. Deci, de exemplu, valoarea medie este un indicator statistic cu drepturi depline pentru caracterizarea unor astfel de variabile. Astfel de variabile includ greutatea, dimensiunea etc.

De foarte multe ori variabile scara intervalului, la care se referă datele pot fi apelate scara relațiilor. Prin urmare, în setările Definire variabilă, ambele scale sunt definite ca Scară (Metric).

Acum trebuie să justificăm și să determinăm tipul de scale pentru variabilele noastre: Vozrast (Vârsta); Ves (Greutate); Rost (Creștere); Noga (marimea boo); Pol (Sex); Volos (Culoarea părului); Glaz (culoarea ochilor).

Vozrast (Vârsta), Ves (Greutate), Rost (Înălțime) - scala intervalului.

Pol (Sex), Volos (Culoarea părului); Glaz (culoarea ochilor).- scara nominala.

După clarificarea acestei probleme critice, trebuie să introducem tipul de scară în tabel pentru variabilele noastre. Totul se face foarte simplu: faceți dublu clic pe numele variabilei și apare fereastra Define Variable. În această fereastră, selectați cadrul de măsurare și setați butonul la una dintre cele trei stări pentru fiecare variabilă.

Variabile: Vozrast (Vârsta), Ves (Greutate), Rost (Înălțime) vor avea o valoare Scară.

Variabile: Pol (Sex), Volos (Culoarea părului); Glaz (culoarea ochilor) va conta Nominal.

Variabile legate de scară Ordinal(ordinal) nu vom avea.

Ne-am dat seama de scara variabilelor. Acum să continuăm definirea variabilelor.

Tip(tip de variabilă) pentru a seta tipul de variabilă, faceți clic pe butonul Toure. Se deschide caseta de dialog Definire tip de variabilă. Acceptați setarea sugerată Numeric(Numeric) și setați lungimea la „2” pentru variabila Vozrast și numărul de zecimale la „0”, deoarece această variabilă va stoca doar valorile de vârstă. Confirmați setarea cu OK și treceți la următorul câmp al variabilei Ves. Având în vedere codificarea digitală a valorilor variabilelor, toate variabilele noastre vor fi Numeric.

Etichete..(Variable label) este un nume care vă permite să descrieți variabila mai detaliat. După ce faceți clic pe butonul Etichete.. apare o casetă de dialog și puteți introduce până la 256 de caractere. Etichetele variabile fac diferența între litere mari și mici. Sunt afișate așa cum au fost introduse. Pentru variabila Vozrast, introduceți „date despre vârsta studentului” ca etichetă.

În aceeași opțiune, introduceți Value Labels (Valori). Etichetele de valoare sunt nume care ajută la descrierea mai detaliată a valorilor posibile ale unei variabile. Deci, de exemplu, în cazul variabilei Pol, puteți specifica eticheta „femeie” pentru valoarea „1” și eticheta „masculin” pentru valoarea „2”. Acceptați setarea implicită. Cu toate acestea, introducerea datelor poate fi confirmată și cu cheia .

Valori lipsă(Valori lipsă). SPSS permite două tipuri de valori lipsă:

Valori lipsă definite de sistem: dacă există celule numerice goale în matricea de date, SPSS le identifică automat ca valori lipsă. Acest fapt este reprezentat în matricea de date folosind virgulă (,).

Valori lipsă definite de utilizator: dacă variabilele au valori lipsă în anumite cazuri, cum ar fi dacă la o întrebare nu i s-a răspuns, răspunsul este necunoscut sau alte motive, utilizatorul poate folosi butonul Lipsă pentru a declara aceste valori ca fiind pierdute . Valorile lipsă pot fi excluse din calculele ulterioare. În exemplul nostru, vom declara opțiunea de răspuns „0” (fără date) pentru variabila Pol ca fiind o valoare lipsă definită de utilizator.

Format de coloană(format de coloană). Câmpul Coloane determină lățimea pe care o va avea această coloană în tabel atunci când se afișează valori. Lățimea coloanei poate fi modificată și direct în fereastra editorului de date. Pentru a face acest lucru, plasați cursorul mouse-ului pe separatorul dintre cele două anteturi de coloană cu nume de variabile. Aspectul indicatorului se va schimba. Apare o săgeată dublă care indică faptul că coloana corespunzătoare poate fi extinsă sau contractată prin glisare.

Astfel, după definirea tuturor parametrilor variabilelor, puteți începe să introduceți datele colectate pentru grupul dvs.

Variabilele diferă în ceea ce privește „cât de bine” pot fi măsurate sau, cu alte cuvinte, cât de multe informații măsurabile oferă scala lor de măsurare. Se știe că în fiecare măsurătoare există o anumită eroare care determină limitele „cantității de informații” care poate fi obținută într-o măsurătoare dată. Tipul de scară pe care se face măsurarea este un alt factor care determină cantitatea de informație conținută într-o variabilă. Se disting următoarele tipuri de scale: nominală, ordinală (ordinală), relativă de intervale (scara de raport). În consecință, avem patru tipuri de variabile.

este atribuirea unor numere obiectelor în conformitate cu anumite reguli. Numerele sunt obiecte ușor de procesat în care transformăm anumite proprietăți ale percepției noastre.(scara nominală) nu este de fapt legată de conceptul de „mărime” și este folosită doar pentru clasificarea calitativă pentru a distinge un obiect de altul: numărul unui animal dintr-un grup sau un cod unic atribuit acestuia etc. Aceste variabile pot fi măsurate doar ca aparținând unor anumite clase, semnificativ diferite; cu toate acestea, nu veți putea comanda aceste cursuri. De exemplu, indivizii aparțin unor naționalități diferite. Exemple tipice de variabile nominale sunt sexul, naționalitatea, culoarea, orașul etc. Adesea variabilele nominale sunt numite categorice. Variabilele categoriale sunt adesea prezentate ca frecvențe de observații care se încadrează în categorii și clase specifice. Dacă există doar două clase, atunci variabila va fi numită dihotomică. De exemplu, la studierea eșantionului s-a constatat că prima categorie Genul feminin 30 de subiecți cu hipertensiune arterială au fost repartizați în a doua categorie Gen masculin 25 de subiecți au fost clasificați ca având tensiune arterială ridicată. Capacitățile de procesare ale variabilelor legate de scara nominală sunt foarte limitate. Strict vorbind, este posibilă doar efectuarea unei analize de frecvență a unor astfel de variabile. De exemplu, calcularea valorii medii pentru o variabilă Podea , este complet inutil.

Scara ordinală (scala de ranguri) - o scară cu privire la valorile căreia nu se poate spune de câte ori valoarea măsurată este mai mare (mai mică) decât alta și nici cât de mai mare (mai mică) este. O astfel de scară organizează doar obiectele, atribuindu-le anumite puncte (rezultatul măsurătorilor este o ordonare liberă a obiectelor). Totodată, se indică care dintre ele, într-o măsură mai mare sau mai mică, au calitatea exprimată prin această variabilă. Cu toate acestea, ele nu ne permit să spunem „cu cât mai mult” sau „cu cât mai puțin”. Variabilele ordinale sunt uneori numite și variabile ordinale. Numerele caselor de pe stradă sunt măsurate pe o scară ordinală. Un exemplu tipic de variabilă ordinală este statutul socioeconomic al familiei. Pentru mărimile de îmbrăcăminte se utilizează următoarea scară ordinală: S, M, L, XL, XXL, XXXL, XXXXL. Scala de duritate minerală Mohs este, de asemenea, ordinală. Forța vântului Beaufort și scara cutremurului Richter sunt construite în mod similar. Scalele de ordine sunt utilizate pe scară largă în pedagogie, psihologie, medicină și alte științe care nu sunt la fel de precise ca, să zicem, fizica și chimia. În special, scara omniprezentă a notelor școlare în puncte (cinci puncte, douăsprezece puncte etc.) poate fi clasificată ca o scară de ordine. În cercetarea biomedicală, scalele de ordine se găsesc peste tot și sunt uneori foarte abil deghizate. De exemplu, un trombotest este utilizat pentru a analiza coagularea sângelui: 0 – fără coagulare în timpul testului, 1 – „fire slabe”, 2 – cheag de gelatină, 3 – cheag ușor deformabil, 4 – dens, elastic, 5 – dens, ocupând întregul volum etc. Este clar că intervalele dintre aceste poziții puțin distinse și foarte subiective sunt arbitrare. În acest caz, nu are sens să compari valorile medii în două mostre! O mulțime de scale similare se găsesc încă în toxicologia experimentală, chirurgia experimentală și morfologia experimentală. Scalele ordinale în medicină sunt scala etapelor de hipertensiune arterială (conform lui Myasnikov), scala gradelor de insuficiență cardiacă (conform lui Strazhesko-Vasilenko-Lang), scala severității insuficienței coronariene (conform lui Fogelson) etc. Toate aceste cântare sunt construite după următoarea schemă: nicio boală detectată; primul stadiu al bolii; a doua etapă; a treia etapă. Fiecare etapă are o caracteristică medicală unică. Când se descriu grupurile de dizabilități, numerele sunt folosite în ordine inversă: cel mai grav este primul grup de dizabilități, apoi al doilea, cel mai ușor este al treilea. Pe lângă analiza de frecvență, variabilele de scară ordinală permit și calcularea anumitor caracteristici statistice, cum ar fi mediane. În unele cazuri este posibil să se calculeze valoarea medie. Pentru a compara diferite eșantioane de variabile legate de scara ordinală, pot fi utilizate teste neparametrice, ale căror formule operează pe ranguri.

Variabilele de interval permit nu numai organizarea obiectelor de măsurare, ci și exprimarea numerică și compararea diferențelor dintre ele. De exemplu, temperatura măsurată în grade Fahrenheit sau Celsius formează o scară de interval. Scala Celsius, așa cum se știe, a fost stabilită după cum urmează: punctul de îngheț al apei a fost considerat zero, punctul său de fierbere la 100 de grade și, în consecință, intervalul de temperatură dintre îngheț și fierberea apei a fost împărțit în 100 de părți egale. Aici afirmația că temperatura de 40°C este de două ori mai caldă decât 20°C va fi incorectă. Scala intervalului păstrează raportul dintre lungimile intervalului. Nu numai că poți spune că o temperatură de 40°C este mai mare decât o temperatură de 30°C, dar și că o creștere a temperaturii de la 20°C la 40°C este de două ori creșterea temperaturii de la 30 la 40 de grade. Astfel de variabile pot fi procesate prin orice metode statistice fără restricții. Deci, de exemplu, valoarea medie este un indicator statistic cu drepturi depline pentru caracterizarea unor astfel de variabile.

Scale de relații sunt măsurate aproape toate mărimile fizice - timp, dimensiuni liniare, suprafețe, volume, curent, putere etc. Aceasta este cea mai puternică scară. Această scară include toate variabilele de interval care au un punct zero absolut. În cercetarea medicală și biologică va avea loc o scară de relații, de exemplu, când se măsoară timpul de apariție a unui anumit semn după debutul expunerii (prag de timp, în secunde, minute), intensitatea impactului înainte de apariția oricărui semn (pragul de rezistență la impact în volți, roentgens) etc.). Desigur, scala raportului include toate datele din studiile biochimice și electrofiziologice (concentrații de substanțe, tensiuni, indicatori temporari ai electrocardiogramei etc.). Aceasta include și, de exemplu, numărul de „sarcini” îndeplinite corect sau incorect în diferite teste pentru studiul activității nervoase superioare la animale. De exemplu, temperatura Kelvin formează o scară de raport și se poate argumenta că o temperatură de 200 de grade nu este doar mai mare de 100 de grade, dar este de două ori mai caldă. Scalele de interval (cum ar fi scala Celsius) nu au această proprietate a unei scale de raport. Rețineți că majoritatea procedurilor statistice nu fac distincție între proprietățile scărilor de interval și scările de raport. Pentru ultimele două scale, este posibil să se calculeze astfel de indicatori numerici precum valoarea medie și abaterea standard.

Să ne uităm la câteva exemple mai specifice de variabile în cercetarea empirică. Lăsați-le să fie codificate după cum urmează:

Tabelul 1.1

Tipuri de cântare

Vedem că codarea variabilei podea utilizarea numerelor 1 și 2 sunt absolut arbitrare, ele pot fi schimbate sau desemnate cu alte numere. Asta nu înseamnă că femeile sunt cu un pas mai jos decât bărbații. În acest caz, vorbim despre variabile legate de scara nominală. Aceeași situație se aplică variabilei starea civilă. Nici aici corespondența dintre numere și categorii de stare civilă nu are semnificație empirică. Dar, spre deosebire de gen, această variabilă nu este dihotomică - are patru cifre de cod în loc de două.

Variabilă fumat sortat în ordinea importanței de jos în sus: un fumător moderat fumează mai mult decât un nefumător, iar un fumător intens fumează mai mult decât un fumător moderat etc. Aceste variabile sunt pe o scară ordinală. Cu toate acestea, semnificația empirică a acestor variabile nu depinde de diferența dintre valorile numerice adiacente. Astfel, deși diferența dintre numerele de cod pentru un nefumător, un fumător ușor și un fumător intens este în ambele cazuri egală cu unul, nu se poate spune că diferența reală dintre un nefumător, un fumător ocazional și un fumător intens. fumatorul este acelasi. Pentru aceasta, aceste concepte sunt prea vagi. Exemplele clasice de variabile cu o scară ordinală sunt, de asemenea, variabile obținute prin gruparea cantităților în clase, cum ar fi venitul lunarîn exemplul nostru.

Să ne uităm acum la coeficientul de inteligență (IQ). Iar valorile sale absolute reflectă relația ordinală dintre respondenți, iar diferența dintre cele două valori are și o semnificație empirică. De exemplu, dacă IQ-ul lui Fedor este de 80, al lui Peter este de 120 și al lui Ivan este de 160, putem spune că Peter, în comparație cu Fedor, este la fel de inteligent pe cât este Ivan în comparație cu Peter (și anume, cu 40 de unități IQ). Cu toate acestea, doar pe baza faptului că valoarea IQ-ului lui Fedor este jumătate din cea a lui Ivan, nu se poate concluziona că Ivan este de două ori mai inteligent decât Fedor. Astfel de variabile aparțin scalei intervalului.

Cea mai înaltă scară statistică la care raportul dintre două valori capătă și semnificație empirică este scara raportului. Un exemplu de variabilă legată de o astfel de scară este vârsta: dacă Andrey are 30 de ani și Alexey are 60 de ani, putem spune că Alexey este de două ori mai în vârstă decât Andrey. Scala raportului este scala de temperatură Kelvin cu temperaturi zero absolut.

În practică, inclusiv la prelucrarea datelor în pachetul Statistica, diferența dintre variabilele legate de scara intervalului și scara de raport este de obicei neimportantă.

Puteți trece oricând de la o scară mai bogată sau mai puternică la una mai săracă. Astfel, variabilele continue pot fi clasificate. De exemplu, o variabilă aleatoare continuă (CV) Înălţime poate fi convertit dintr-o scară de raport într-o scară ordinală cu gradații: scăzut, mediu, ridicat.

Să presupunem că întreaga gamă de modificări într-o variabilă de interval a fost împărțită într-o zonă de valori ridicate, medii și scăzute și fiecare observație a fost atribuită uneia dintre cele trei categorii. Aceasta înseamnă că un fenomen care a fost descris inițial pe o scară de interval poate fi descris și pe o scară de numire și, prin urmare, toate acele metode statistice care necesită utilizarea de variabile pe o scară de denumire pot fi folosite pentru a analiza acest fenomen. Dar trebuie să ținem cont de faptul că atunci când trecem la o scară de nume de la scale de ordin superior, pierdem o parte din informațiile despre observații. Observațiile care au fost diferite unele de altele atunci când sunt descrise pe o scară de intervale pot fi percepute ca aceleași atunci când sunt descrise pe o scară de denumire. Prin urmare, se recomandă utilizarea unei scale de denumire numai atunci când nu este posibilă utilizarea unei scale de ordin superior.