7 Kontrolldiagram

Et kontrolldiagram er mer sensitivt for å vise spesielle typer variasjon enn et run diagram. For å oppnå denne økte sensitiviteten er det imidlertid viktig at man velger riktig type kontrolldiagram ut fra hvilken type data man har. Her vil flytdiagrammet på s.xxxx kunne være til hjelp for å velge riktig type, men vi vil også gå gjennom hvert enkelt kontrolldiagram nedenfor. Man skal imidlertid ikke anta at et seriediagram er «mindre verdt» enn et kontrolldiagram. Selv om kontrolldiagram er mer sensitive ovenfor spesielle typer variasjon, er seriediagram mer sensitive ovenfor mindre skifter i dataene (under 2 SD) enn kontrolldiagrammene som typisk reagerer på større skifter i dataene (rundt 2 SD og mer) (Anhøj and Olesen 2014). Et seriediagram kan derfor ofte være et viktig første steg før man tar i bruk mer sofistikerte verktøy som kontrolldiagram (Perla et al. 2011).

En spesiell egenskap ved kontrolldiagram er at den kan hjelpe oss til å se yteevnen til en stabil prosess. Med det mener vi hvilke grenser prosessen trolig vil holde seg innenfor. Dette kalles ofte for prosesskapabilitet. Dette vil vi komme nærmere tilbake til i et senere avsnitt.

Så hva er et kontrolldiagram? Et kontrolldiagram er en statistisk tilnærming til å se på prosesser, variasjon i prosesser og om prosesser produserer resultater innenfor gitte akseptable grenser. Det likner på i stor grad på et seriediagram. Vi plotter inn en rekke hendelser eller observasjoner i et diagram der tiden for observasjonene plottes fortløpende i tid på x-aksen og verdien eller antall hendelser på y-aksen. Det et kontrolldiagram tilfører er at det inkluderer mer avanserte analyser gjennom å regne ut to kontrollgrenser som lar oss vurdere statistisk etter andre regler enn seriediagrammet om en prosess har normal eller unormal variasjon. I tillegg er kontrolldiagrammene basert på at sentraltendensen er gjennomsnittet, ikke median (som i seriediagrammet).

Shewhart baserte sin tilnærming til kontrolldiagram på matematisk teori (se vedlegg 7 for forklaring på Chebyshevs teorem) og egne empiriske erfaringer når han satt verdiene for øvre og nedre kontrollgrenser til tre sigma (tre standardavvik). Flere tiårs erfaring fra en lang rekke områder viser at tre sigma som grenseverdier holder vann (Mohammed, Worthington, and Woodall 2008).

Et kontrolldiagram kan se slik ut (R pakken qicharts2 (Anhøj 2020):
Eksempel kontrolldiagram i *qicharts*

Figure 7.1: Eksempel kontrolldiagram i qicharts

Observasjonene/målingene plottes som punkter sekvensielt i tid. Snittet er -0,2, UCL 2,2 og LCL -2,7.

Tilsvarende data ved bruk av R pakken qcc (Scrucca et al. 2017):
Eksempel kontrolldiagram i *qcc*

Figure 7.2: Eksempel kontrolldiagram i qcc

Eksempel kontrolldiagram i *qcc*

Figure 7.3: Eksempel kontrolldiagram i qcc

Alle kontrolldiagram vil ha tre horisontale linjer: En gjennomsnittsverdi, en øvre kontrollgrense og en nedre kontrollgrense (øvre og nedre kontrollgrense kan ved enkelte typer kontrolldiagram avvike fra en ren horisontal linje, men ha et horisontalt mønster.

Ulike programmer eller R-pakker gir ulik grafisk framstilling.Analyse-It i Excel gir dette for samme data:

Før vi går inn på kontrolldiagram for hhv telledata og måldata skal vi ta en gjennomgang av typiske mønstre som trekkes fram som kan si oss noe om tolkning av kontrolldiagram (se f.eks. Lavangnananda and Tengsriprasert (2002) og Montgomery (2020)).

7.1 Mønstre i kontrolldiagram

Når vi har laget et kontrolldiagram vil det være noen åpenbare tegn vi vil legge merke til, f.eks. vil vi ganske raskt se om vi har punkter utenfor kontrollgrensene. En annen ting vi raskt kan forsøke å se på er om kontrolldiagrammet viser et gjenkjennbart mønster som kan fortelle oss noe om prosessen og dataene vi har. Vi skal her vise åtte typiske mønstre som blir av flere blir trukket fram (Lavangnananda and Tengsriprasert (2002) snakker om ni mønster, der det siste omtales som “Mixture” - vi mener imidlertid den i praksis kan være så vanskelig å fange opp eller skille fra et normalt mønster at vi velger å se bort fra denne). Vi viser mønstrene uten mange kommentarer da de fleste er ganske åpenbare.

Det eneste mønsteret vi ønsker å knytte noen korte kommentarer til er “stratifisering” som kanskje ikke er helt intuitiv. Stratifisering regnes som en unormal variasjon (“a special cause”) dersom 15 eller flere påfølengde punkter faller innenfor det som kalles sone C (= +/- 1 SD fra snittet). Man sier ofte at punktene “klemmer” senterlinjen, og det kan se ut som prosessen har unormalt liten variasjon. Montgomery (2020) peker på to mulige årsaker: Kontrollgrensene kan være feilkalkulert, eller målingene kan komme fra flere underliggende prosesser. Vi skal ikke gå dypere inn på dette her, men en god gjennomgang av dette er gitt av Rowe (2012)denne lenken.

7.2 Tolkning av kontrolldiagram

Vi skal være oppmerksom på at de kan opererer med ulike “regler” for når de flagger unormal variasjon. Ulike programmer kan imidlertid ha lagt inn noe ulike regler for hva som betraktes som unormal variasjon. Det er derfor lurt å sette seg inn i hvilke regler som benyttes i det programmet du bruker – alle programmene vil, på en eller annen måte, indikere unormal variasjon hvis vi ber programmet om å gjøre det. Og de fleste programmene vil også la oss velge mellom hvilke kontrollregler vi ønsker å bruke. Her må man altså sjekke opp ut fra hvilket program/R-pakke man ønsker å bruke. I det videre vil vi i hovedsak bruke qcc og qicharts2. Ulike sett regler har vokst fram fra det som regnes som de opprinnelige 4 reglene (1, 2, 5 og 6) (Western Electric Company 1956), til Nelson (1984) 8 regler som er modifisert av flere, blant annet Montgomery (2020) (som qicharts2 bruker).Pakken qcc bruker reglene 1, 2, 3 og 4 som “Shewhart reglene”.

Eksempel på kontrolldiagram med indikasjon på et eller flere brudd på regler for normal variasjon:

Oversikt regler kontrolldiagram

Figure 7.4: Oversikt regler kontrolldiagram

Oversikt regler kontrolldiagram

Figure 7.5: Oversikt regler kontrolldiagram

Vi skal i det følgende vise reglene grafisk. I diagrammene nedenfor viser vi eksempler på kontrolldiagram inndelt i tilsammen seks soner (A, B og C). Sone C er intervallet +/- 1 sigma fra sentraltendensen, sone B er intervallene +/- 1 til 2 sigma fra sentraltendensen og sone A er intervallene +/- 2 til 3 sigma fra sentraltendensen.

7.2.1 Punkter utenfor kontrollgrensene:

7.2.2 2 av 3 påfølgende punkter er mer enn 2 sigma fra gjennomsnittsverdien (i sone A) og i samme retning

7.2.3 4 av 5 påfølgende punkter er mer enn 1 sigma fra gjennomsnittsverdien (sone A og B) og i samme retning

7.2.4 8 påfølgende punkter er på samme side av gjennomsnittet

7.2.5 6 påfølgende punkter er i stigende eller synkende trend (etter hverandre)

7.2.6 15 påfølgende punkter er innenfor +/- 1 sigma fra gjennomsnittet

7.2.7 14 påfølgende punkter alternerer opp og ned (annenhver opp og ned i forhold til foregående verdi)

7.2.8 8 påfølgende punkter på samme side av gjennomsnittet og ingen innenfor +/- 1 sigma

Bruk av regel 1 på en normalfordelte data vil kunne gi «falsk alarm» (vise unormal variasjon når det ikke finnes) i 1 av 370 tilfeller i gjennomsnitt. Hvis man imidlertid legger til testene 2, 5 og 6 stiger raten av feil alarmer til 1 av 91,75 tilfeller. Et godt råd som ofte gis er å velge tester før man lage kontrolldiagrammene basert på kjennskap til prosessen man holder på med. Som Anhøj (2021a) påpeker: “It is a common misunderstanding that control charts are superior to run charts. The confusion may stem from the fact that different sets of rules for identifying non-random variation in run charts are available, and that these sets differ significantly in their diagnostic properties.”

Vi skal i videre i dette kapittelet ta for oss ulike typer kontrolldiagrammene (ref. flytskjema for valg av kontrolldiagram). Vi vil vise et eksempel på hvert av de vanlige kontrolldiagrammene. For hvert eksempel finnes det en Excelfil med dataene som er brukt for de ulike eksemplene og en video som viser framgangsmåten i Excel. Grunnen til dette er at for mange vil Excel være et mye mer kjent grensesnitt enn R. Samtidig, ved å se på videoen og stegene som gjøres, ser man hvordan det enkelte kontrolldiagram er bygd opp. Selvsagt er dette mye mer tidkrevende enn å bare kjøre analysen i R, men det kan gi en fin innsikt i “hva som egentlig skjer”. På sikt mener vi det er mye å hente på å bruke R og pakken qicharts2 eller pakken qcc. Alternativt kan man investere i et tillegg til Excel som nevnt i kapittel 1.

7.3 Telledata (attributter)

Diagrammene i dette delkapittelet handler om data der vi kan telle og putte dataene inn i kategorier. Motsetningen er måledata som er kontinuerlige data som behandles i neste delkapittel.

7.3.1 p-diagram

P-diagrammet er trolig det mest brukte diagrammet i helsesektoren (Anhøj 2021a). Her er dataene binomiale, dvs type ja/nei. Vi kan f.eks. registrere om det er eller ikke er et avvik fra en gitt rutine. P-diagrammet og NP-diagrammet skiller seg kun fra hverandre ved at NP-diagrammet forutsetter en lik størrelse på utvalget hver måling, mens P-diagrammet brukes når utvalgsstørrelsen varierer. Hvis vi f.eks. registrerer antall avvik i en rutine pr uke og antallet gjennomføringer av rutinen varierer fra uke til uke bør vi bruke et P-diagram.

La oss tenke oss at vi har følgende data som viser antall keisersnitt og totalt antall fødsler på et sykehus (eksempeldata modifisert fra QIMacros 2021).

Datasettet i Excelformat finner du her:

Download P_chart.xlsx

p-diagram

Figure 7.6: p-diagram

p-diagram

Figure 7.7: p-diagram

I p-diagrammet vil UCL og LCL variere noe siden det tas hensyn til at n varierer fra registrering til registrering.

Video med framgangsmåte i Excel ligger her.

7.3.2 Laney’s p-diagram

I noen tilfeller har vi data som gir svært smale kontrollgrenser (eksempeldata modifisert fra SPC for Excel 2021).

La oss anta følgende datasett:

Datasett: Download Laneyp.xlsx

p-diagram for Laney

Figure 7.8: p-diagram for Laney

p-diagram for Laney

Figure 7.9: p-diagram for Laney

Diagrammet gir liten mening når mer eller mindre alle punktene ligger utenfor kontrollgrensene. Laney (2002) peker på at p- og u-diagrammer har forutsetninger om distribusjonen som blant annet antar at gjennomsnittet er konstant over tid. Kombinert med veldig stor utvalgsstørrelse gir dette såkalt overdispersjon, hvilket betyr at den faktiske variansen er større enn det modellen benytter. Framgangsmåten Laney foreslår kan virke noe teknisk, men innebærer å regne ut z verdien for alle punktene (z verdien forteller antallet standardavvik mellom det målte punktet og gjennomsnittet). Z-verdiene brukes så for å regne ut Moving Range (MR), som igjen brukes til å regne ut gjennomsnittlige MR, som igjen brukes til å regne ut UCL og LCL.

Vi har laget en video som kort forklarer begrepet Moving Range.

Som dere vil se i videoen (se lenke litt lenger ned) er den eneste forskjellen i formlene som regner ut UCL og LCL et uttrykk for standardavviket for z-verdiene. Denne, sier Laney, korrigerer for den relative andelen av prosessvariasjon som ikke forklares av den binomiale fordelingen alene. Ved stor n minskes variasjonen fra utvalgene.

Laneys p’-diagram er i realiteten veldig likt et I-diagram, med den forskjellen at p’-diagrammet tar høyde for varierende utvalgsstørrelser. Du finner en video som forklarer framgangsmåten i Excel her.

7.3.3 np-diagram

Forskjellen på p-diagram og np-diagram ligger i om utvalgsstørrelsen er lik eller ulik gjennom registreringene. I dette eksempelet sjekker vi om en prosedyre er korrekt gjennomført eller ikke. For å registrere dette tar vi hver uke 50 stikkprøver og registrerer hvor mange som ikke er gjennomført iht prosedyren (eksempeldata modifisert fra QIMacros 2021).

Datasett: Download np_diagram.xlsx

np-diagram

Figure 7.10: np-diagram

np-diagram

Figure 7.11: np-diagram

I dette tilfellet ser vi at det ved to anledninger – uke 15 og 23 – var brudd på regel 1 (utenfor 3 sigma).

Som vanlig finnes det en Excelvideo som viser framgangsmåten steg-for-steg i Excel.

7.3.4 u-diagram

p- og np-diagrammer teller antall defekter – en hendelse, et produkt, en tjeneste er enten defekt eller ikke. Men i mange tilfeller gir det ikke så mye mening å se på defekt/ikke-defekt. En bil kan f.eks. ha flere feil, men likevel være kjørbar. Bilen er ikke defekt selv om den har feil vi er interessert i. Det vi i stedet kan være mer interessert i er hvor mange feil har enheten vi ser på. Vi kan f.eks. være interessert i hvor mange kundeklager som har kommet inn i en periode. Vi er da interessert i antallet klager og antar ikke at hele prosessen er defekt selv om vi har klager.

I eksempelet under ser vi på antall pasientfall opp mot totalt antall pasientdager (eksempeldata modifisert fra QIMacros 2021).

Datasett: Download u_diagram.xlsx

u-diagram

Figure 7.12: u-diagram

u-diagram

Figure 7.13: u-diagram

Video her for Excel

7.3.5 Laney’s u-diagram

Som for p-diagrammet finnes det et alternativ fra Laney (2002). Se punktet om Laneys p’-diagram – samme forhold som ble diskutert for p vs p’-diagram gjelder for u vs u’-diagram.

Datasett: Download ludiagram.xlsx

Data (eksempeldata modifisert fra SPC for Excel 2021).

Uten Laneys korreksjon (standard u-diagram):

Laneys u-diagram: Video som viser frangangsmåte i Excel ligger her

7.3.6 c-diagram

c-diagrammet likner på u-diagrammet, men her er utvalgsstørrelsen lik. Man kan f.eks. registrere antall hendelser med personskader i en fabrikk. Fabrikken vil da utgjøre utvalget og den er lik fra periode til periode.

Vi kan bruke antall feilmedisineringer i en enhet som et eksempel (eksempeldata modifisert fra QIMacros 2021).

Datasett: Download cdiagram.xlsx

c-diagram

Figure 7.14: c-diagram

c-diagram

Figure 7.15: c-diagram

Excelvideo her

7.3.7 g-diagram

g-diagrammet brukes på sjeldne hendelser. Her bruker vi dager dager mellom infeksjoner etter en viss type operasjon som eksempel (eksempeldata modifisert fra SPC for Excel 2021).

Datasett: Download gdiagram.xlsx

Video for Excel

I utregning av sentraltendensen oppgis noe ulike utregninger i forskjellige kilder. Noen bruker det aritmetiske gjennomsnittet (slik vi har gjort i de andre diagrammene hittil), mens flertallet ser ut til å bruke en beregnet medianverdi (se Benneyan 2001). Grunnen til dette er at distribusjonen antas å være geometrisk, noe som innebærer at den er betydelig skjevfordelt. Median er dermed en mer representativ verdi for sentraltendensen enn gjennomsnittet. Det legges derfor inn en konstant på 0.693 når man regner ut CL. Samtidig brukes snittet likevel når man regner ut UCL og LCL – framgangsmåten er forklart i videoen.

7.3.8 Utfordringer med telledata og distribusjon på dataene

Alle telledata, om det er antall eller andeler, er individuelle verdier per en eller annen tidsenhet. Som vi kan se av formlene for utregning av UCL og LCL i så vel p som np, u og c utgjør gjennomsnittet grunnlaget for utregning av kontrollgrensene. Dette baserer seg på at dataene følger enten en binomial (for p og np) eller Poisson (for c og u) sannsynlighetsfordeling (jfr kapittelet om datadistribusjon). Som Wheeler (2021) beskriver innebærer det at gjennomsnittet spesifiserer modellen og snittet er grunnlaget for både sentraltendens og spredning/variasjon, men det er uansett en teoretisk tilnærming som baserer seg på at dataene har enten binomial eller Poissonfordeling. Er dataene ikke det viser Wheeler (2021) at kontrollgrensene blir gale, og mange typer telledata har ikke verken binomial eller Poisson fordeling. Man bør derfor kjenne til distribusjonen av telledataene før man benytter p, np, c eller u diagram.

Wheeler (2021) viser at IMR (XMR) diagrammer (se neste delkapittel), som baserer utregningen av kontrollgrensene empirisk (i motsetning til teoretisk ut fra sannsynlighetsfordeling) på Moving Ranges (MR), alltid vil gi deg riktige kontrollgrenser. Kontrollgrensene med et IMR diagram vil således være empirisk utregnet fra den variasjonen du faktisk har i dataene og ikke være teoretisk beregnet ut fra en sannsynlighetsfordeling. Wheelers (2021) artikkel viser gjennom tre eksempler at kontrollgrensen i et IMR-diagram vil replikere de i p, np, c og u der disse er korrekte, og avvike (men vise de riktige) der p, np, c og u viser feil kontrollgrenser. viser at IMR (XMR) diagrammer (se neste delkapittel), som baserer utregningen av kontrollgrensene empirisk (i motsetning til teoretisk ut fra sannsynlighetsfordeling) på Moving Ranges (MR), alltid vil gi deg riktige kontrollgrenser. Kontrollgrensene med et IMR diagram vil således være empirisk utregnet fra den variasjonen du faktisk har i dataene og ikke være teoretisk beregnet ut fra en sannsynlighetsfordeling. Wheeler (2021) artikkel viser gjennom tre eksempler at kontrollgrensen i et IMR-diagram vil replikere de i p, np, c og u der disse er korrekte, og avvike (men vise de riktige) der p, np, c og u viser feil kontrollgrenser.

Som Wheeler (2021) uttrykker det:

In contrast to this use of theoretical models which may or may not be correct, the XmR chart provides us with empirical limits that are actually based upon the variation present in the data. This means that you can use an XmR chart with count-based data anytime you wish. Since the p-chart, the np-chart, the c-chart, and the u-chart are all special cases of the chart for individual values, the XmR chart will mimic these specialty charts when they are appropriate and will differ from them when they are wrong.

Mohammed and Worthington (2012) understreker at så lenge det kun finnes normal variasjon vil kontrollgrensene for IMR(XMR) og p/np/c/u-diagrammer være samsvarende. De peker videre på at dersom det er klare forskjeller mellom IMR og p/np/c/u er det en indikasjon på unormal variasjon. De anbefaler derfor at man bruker begge typene.

Vi foreslår derfor at dersom man ikke er helt sikker på distribusjonen i telledata kan man følge anbefalingen fra Wheeler (2021) anbefaling om å bruke IMR (XMR) diagram. Man kan eventuelt følge anbeflaingen fra Mohammed and Worthington (2012) om å bruke IMR i kombinasjon med p/np/c/u. Man bør trolig være forsiktig med å bruke bare p/np/c/u om man ikke er sikker på distribusjonen.

Under kapittelet om distribusjoner finner du en beskrivelse av ulike aktuelle distribusjoner og hvordan man kan undersøke data med tanke på distribusjon. Et enkelt grep for å få et inntrykk av distribusjonen er et «vanlig» histogram. For dataene brukt i eksempelet over for np-diagram kan vi sammenlikne np-diagrammet med I-diagramdelen av IMR-diagram for samme data: NP vs I Vi kan se det er avvik mellom diagrammene. Np-diagrammet har trangere kontrollgrenser og viser to punkter utenfor øvre kontrollgrense. Hvis vi plotter et Q-Q plott, finner vi:

Sammen med statistiske tester for normalitet (Shapiro-Wilk og Anderson-Darling) får vi klare indikasjoner på at datasettet er nærme normalfordeling. Siden et np-diagram bygger på forutsetning om en binomial fordeling virker det mest korrekt å bruke IMR-diagrammet22.

7.4 Måledata (variabler)

7.4.1 IMR (XMR)

Eksempel basert på Anhøj (2021a).

Datasett: Download imr_diagram.xlsx

IMR-diagram

Figure 7.16: IMR-diagram

IMR-diagram

Figure 7.17: IMR-diagram

IMR-diagram

Figure 7.18: IMR-diagram

IMR-diagram

Figure 7.19: IMR-diagram

Framgangsmåte i Excel her

7.4.2 XbarR

Eksempeldata modifisert fra (QIMacros 2021).

Datasett: Download XbarR_diagram.xlsx

R-diagram X-bar diagram NB NB NB - Lage og sette inn video her.

7.4.3 XbarS

Eksempeldata modifisert fra (QIMacros 2021). Download XbarS_diagram.xlsx

S-diagram Xbar-diagram

Video kommer her

7.4.4 T-diagram

I likhet med g-diagrammet er T-diagrammet er diagram vi kan bruke når det er lang tid mellom hendelser (sjeldne hendelser). I g-diagrammet så vi på antall tilfeller mellom hver uønskede hendelse. T-diagrammet brukes når vi vil se på tid mellom hendelser. Siden antall tilfeller mellom hendelser er en diskret variabel og tid er en kontinuerlig variabel plasseres de hhv. i “telledata” og “måledata”.

Eksempelet under er modifisert fra Anhøj (2021a).

Datasett: Download t_diagram_data.xlsx

t-diagram

Figure 7.20: t-diagram

Video kommer her

7.5 Spesielle kontrolldiagram (CUSUM og EWMA)

7.5.1 CUSUM

7.5.2 EWMA

7.6 Risikojustering av kontrolldiagram