Begreper og definisjoner - Personal webpages at...

37
Repetisjon – Vedlikeholdsoptimalisering I dette notatet repeteres det viktigste innhold i del en av kurset. Noen tema fra del to er også inkludert. Fokus her er på teori og resultater knyttet til kvantifisering. Noen tema er repetisjon av pålitelighet mer generelt. Noen begreper er derfor utdypet mer enn hva vi har gjort i kurset. Det er laget noen kontrollspørsmål for at leseren skal sjekke forståelse og se hva som betraktes som viktigst. Begreper og definisjoner Def: Pålitelighet = En enhets evne til å utføre en påkrevd funksjon, under gitte miljø- og operasjonelle betingelser for en gitt tidsperiode. Kommentar: Fokus er å yte en funksjon. En enhet kan ha flere funksjoner. Def: Svikt (failure) = Opphør av mulighet til å utføre krevd funksjon Def: Feil (fault) = Tilstanden at evnen til å utføre krevd funksjon er opphørt Def: Feilmode (failure mode) = effekten av en svikt slik den observeres på enheten som har sviktet (sett utenfra, dvs relativt til funksjonen den skal utføre) Def: Feilmekanisme = fysiske, kjemiske eller andre prosesser som forringer enheten, og leder til svikt Def: Tid til svikt (TTF = Time To Failure) = Tiden fra en enhet settes i drift til den svikter. Tid til svikt er en tilfeldig størrelse. Ofte benyttes symbolet T. Viktige begrep: Fordelingsfunksjon, F(t) = Pr(T £ t) = Sannsynlighet for at enheten svikter før tidspunkt t. F eks F(8760) = Pr(T £ 8760) = 0.1 betyr at det er 10% sjanse for at enheten svikter før ett år er gått (t = 8760). Overlevelsessannsynligheten, R(t) = Pr(T > t) = 1 - F(t) angir sannsynligheten for at enheten overlever tid t. F eks R(8760) = Pr(T > 8760) = 0.9 betyr at det er 90% sjanse for at enheten overlever ett år (t = 8760) etter at den er satt i drift. Sviktintensitet z(t) (failure rate function/hazard rate) angir sannsynligheten for at en enhet med alder t og som fortsatt 1

Transcript of Begreper og definisjoner - Personal webpages at...

Repetisjon – Vedlikeholdsoptimalisering

I dette notatet repeteres det viktigste innhold i del en av kurset. Noen tema fra del to er også inkludert. Fokus her er på teori og resultater knyttet til kvantifisering. Noen tema er repetisjon av pålitelighet mer generelt. Noen begreper er derfor utdypet mer enn hva vi har gjort i kurset. Det er laget noen kontrollspørsmål for at leseren skal sjekke forståelse og se hva som betraktes som viktigst.

Begreper og definisjonerDef: Pålitelighet = En enhets evne til å utføre en påkrevd funksjon, under gitte miljø- og operasjonelle betingelser for en gitt tidsperiode. Kommentar: Fokus er å yte en funksjon. En enhet kan ha flere funksjoner.

Def: Svikt (failure) = Opphør av mulighet til å utføre krevd funksjon

Def: Feil (fault) = Tilstanden at evnen til å utføre krevd funksjon er opphørt

Def: Feilmode (failure mode) = effekten av en svikt slik den observeres på enheten som har sviktet (sett utenfra, dvs relativt til funksjonen den skal utføre)

Def: Feilmekanisme = fysiske, kjemiske eller andre prosesser som forringer enheten, og leder til svikt

Def: Tid til svikt (TTF = Time To Failure) = Tiden fra en enhet settes i drift til den svikter.

Tid til svikt er en tilfeldig størrelse. Ofte benyttes symbolet T. Viktige begrep:

Fordelingsfunksjon, F(t) = Pr(T £ t) = Sannsynlighet for at enheten svikter før tidspunkt t. F eks F(8760) = Pr(T £ 8760) = 0.1 betyr at det er 10% sjanse for at enheten svikter før ett år er gått (t = 8760).

Overlevelsessannsynligheten, R(t) = Pr(T > t) = 1 - F(t) angir sannsynligheten for at enheten overlever tid t. F eks R(8760) = Pr(T > 8760) = 0.9 betyr at det er 90% sjanse for at enheten overlever ett år (t = 8760) etter at den er satt i drift.

Sviktintensitet z(t) (failure rate function/hazard rate) angir sannsynligheten for at en enhet med alder t og som fortsatt fungerer, svikter i et lite tidsintervall (sannsynligheten divideres med lengden av intervallet). Ofte betegnes sviktintensiteten for (den lokale) badekarskurven.

Midlere tid til svikt (Mean Time To Failure), MTTF = E(T )Def: Midlere nedetid (MDT = Mean Down Time) = Forventet tid det tar fra en enhet svikter, til den er ferdig reparert, og satt i drift.

Def: Midlere tid mellom svikt (MTBF = Mean Time Between Failure) = Midlere tid mellom en enhet svikter til den svikter neste gang. MTBF = MTTF + MDT.

Def: Feilrate (failure rate) er her forventet antall svikt per tidsenhet, og hvor feilraten ikke endrer seg over tid. Vi bruker den greske bokstaven lambda for å betegne feilraten ().

Def: Effektiv feilrate er forventet antall svikt per tidsenhet for en enhet som blir vedlikehold forebyggende med vedlikeholdsintervall . Effektiv feilrate betegnes E( ).

1

Def: En k oo N struktur representerer et system hvor det er nok at k ut av N av komponenter virker for at systemet skal virke (fungere).

Def: PFD = Probability of Failure on Demand er sannsynligheten for at en enhet eller et system ikke virker når det etterspørres.

Greske bokstaver = alpha, brukes om aldringsparameter = beta, brukes om fellesfeilandel = lambda, brukes om feilrate (i eksponensialfordelingen), effektiv feilrate i vedlikeholdsmodeller, og lokasjonsparameter i Weibullfordelingen. = tau, brukes om vedlikeholdsintervall = phi, brukes om strukturfunksjonen = Phi, brukes om gj.snittlige kostnader per tidsenhet, grupperingsmodeller = Delta, brukes sammen med t om et lite tidstillegg = mu, brukes om reparasjonsrater = rho, fornyelsesrate

Enkle utilgjengelighetsbetraktninger for komponenterFor enheter som svikter, blir reparert til så god som ny, for deretter å svikte igjen osv, innfører vi begrepet utilgjengelighet (U = Unavailability). Utilgjengeligheten er det samme som sannsynligheten for at enheten ikke virker på et vilkårlig tidspunkt. Formel for U er:

U = MDT/(MTTF+MDT) (1)Merk at både MDT og MTTF påvirkes av mange forhold, f eks mengden forebyggende vedlikehold, antall reservedeler på lager, beredskap osv. I ligning (1) må vi derfor sette inn MDT og MTTF verdier som representerer status på disse forhold. For å tydeliggjøre dette benyttes ofte MDTE og MTTFE i ligning (1) for å angi at det er effektive verdier med f eks et gitt nivå på reservedeler og forebyggende vedlikehold.

Ligning (1) følger av å se på gjennomsnittlig nedetid dividert på gjennomsnittlig lengde av en periode (oppetid + nedetid).

Ligning (1) er en av de klassiske ligningene i pålitelighetsanalysen som jeg kjenner til

For enheter som har skjult funksjon kan man foreta en funksjonstest for å avdekke skjult feil(tilstand). Ofte er tid det tar å reparere en slik enhet mye kortere enn tid mellom funksjonstest. Dersom tid mellom funksjonstest betegnes og enheten har konstant sviktintensitet = = 1/MTTF kan vi finne utilgjengeligheten ved:

U /2 (2)Resultatet følger av ligning (1) ved at gjennomsnittlig nedetid etter en svikt er halvparten av testintervallet. I denne situasjonen er det vanlig å bruke betegnelsen PFD i stedet for utilgjengelighet. PFD står for probability of failure on demand, og oversettes til norsk som sannsynligheten for at enheten ikke er tilgjengelig ved en forespørsel. For en enkelt komponent kan man resoneres seg til svaret gitt av ligning (2).

2

PFD beregninger for systemerDersom man skal finne PFD for et system følger man følgende tilnærming:

1. Finn PFD for systemet som funksjon av t i et intervall, dvs 0 £ t £ , og betegn resultatet PFD(t)2. Her fortolkes PFD(t) som sannsynligheten for at den skjulte funksjonen ikke er tilgjengelig ved tid t 3. For finne PFD(t) er det ofte nyttig å gå veien om overlevelsessannsynligheten til systemet, R(t)4. Finn gjennomsnittlig verdi av PFD(t) ved å integrere: PFD = 1

τ ∫0

τ

PFD ( t )dt=1−1τ ∫0

τ

R (t ) dt

I boka til Rausand&Høyland (2004) presenteres resultatet for en vilkårlig k oo N struktur, og for vanlige verdier i Tabell 10.1 side 432 som også gjengis nedenfor i Tabell 1:

Tabell 1 PFD for k oo Nk \ N N = 1 N = 2 N = 3 N = 4

k = 1 λτ2

(λτ )2

3(λτ )3

4(λτ )4

5k = 2 λτ (λτ )2 (λτ )3

k = 3 3 λτ2

2(λτ )2

k = 4 2 λτ

Jeg kan bruke Tabell 1 for å finne PFD for vanlige strukturer.

LevetidsfordelingerFor å beskrive levetider benyttes ofte ulike klasser av levetidsfordelinger. De vanligste er:

EksponensialfordelingenDenne karakteriseres ved at sviktintensiteten er konstant, dvs z(t) = . For eksponensialfordelingen gjelder at en gammel komponent statistisk sette er like god som en ny komponent. Eksponensialfordelingen er den enkleste fordelingen å jobbe med, og benyttes derfor ofte som en forenkling. For komponenter som er underlagt et forebyggende vedlikeholdsprogram kan eksponensialfordelingen være en rimelig tilnærming. For eksponensialfordelingen gjelder at:

R (t )=e− λt (3)MTTF = 1/ (4)

WeibulfordelingenDenne fordelingen er ofte benyttet dersom sviktintensiteten øker. Formen på sviktintensiteten er z(t) t -1 ( er proporsjonalitetssymbolet). er aldringsparameteren. For enheter som blir dårligere med alderen (økt sviktintensitet) vil være større enn 1. Typiske verdier er i området 2-4. For Weibullfordelingen gjelder at:

R (t )=e−( λt )α (5)MTTF = (1+1/)/ (6)

3

Her er MTTF midlere tid til svikt dersom vi ikke gjør forebyggende vedlikehold. For å tydeliggjøre dette skriver vi ofte MTTFN (N = «naked», dvs uten vedlikehold). I noen fremstillinger benyttes også MTTFWO (without maintenance). For Weibullfordelingen er variasjonskoeffisienten gitt ved:

cv=√¿¿¿ (7)Variasjonskoeffisienten angir standardavviket dividert på forventningsverdien, og en lav variasjonskoeffisient betyr forholdsvis deterministisk tid til svikt. Variasjonskoeffisienten kan benyttes til å sammenligne Weibullmodellen med f eks en Markov tilstandsmodell som beskrives senere.

Jeg kan redegjøre for hvorfor det ikke har noen hensikt å foreta forebyggende utskifting av komponenter med eksponensialfordelte svikttider.

For Weibullfordelingen vet jeg at dersom aldringsparemeteren er > 1 har vi økende sviktintensitet.

Strukturfunksjon og pålitelighetsblokkdiagram Avsnittet nedenfor om strukturfunksjon og pålitelighetsblokkdiagram anser jeg kun gjelder for spesielt interesserte. Jeg kikker nærmere på det dersom jeg tar kurset Industriell sikkerhet og pålitelighet.

For binære systemer innfører vi to typer tilstandsvariable (et binært system er et system hvor komponentene kun antar to verdier (fungerer og er sviktet), og systemet også har kun to tilstander (fungerer eller er sviktet)). En tilstandsvariabel innføres for komponentene, og en for systemet. For komponent nummer i setter vi xi(t) = 1 dersom komponenten fungerer ved tid t, og 0 ellers. For systemet setter vi (x,t) = 1 om systemet fungerer ved tid t, og 0 ellers. betegnes strukturfunksjonen, og er en funksjon av tilstanden til komponentene.

Ofte er vi kun interessert i å se på den funksjonelle sammenhengen mellom strukturfunksjonen og komponenttilstandene, og da dropper vi ofte symbolet t.

For å illustrere funksjonaliteten til et system tegnes ofte et pålitelighetsblokkdiagram (RBD = Reliability Block Diagram). Diagrammet synliggjør hvordan det er mulig å gå fra venstre gjennom fungerende komponenter og komme helt til høyre i diagrammet.

For å etablere strukturfunksjonen til et pålitelighetsblokkdiagram tar vi ofte utgangspunkt i de to basisreglene som gjelder for serie- og parallellstrukturer. Dvs for en seriestruktur av n komponenter gjelder at:

(x) = x1× x2 × ...× xn (8)og tilsvarende for en parallellstruktur (redundans) gjelder:

(x) = 1-(1-x1)(1- x2) …(1- xn) (9)Merk at ligning (9) kan forenkles om vi kun har to komponenter (n = 2)

(x) = 1-(1-x1)(1- x2) = x1 + x2 x1x2 (10)4

For å jobbe med strukturfunksjonen er det viktig å beherske reglene for parentesregning. Når vi skal multiplisere to parentesuttrykk med hverandre er regelen at vi for det første parentesuttrykket systematisk går gjennom alle ledd, og for hvert lett multipliserer vi med hvert ledd i det andre uttrykket og legger sammen etter hvert. Her må vi huske på reglene for pluss og minus. ” + + = +”, ” = +”, ” + = ”¸ og ” + = ”. Eksempel (3a+4)(2b-3) = 3a2b + 3a(-3) + 42b + 4(-3) = 6ab – 9a + 8b -12. Jeg husker formlene for serie- og parallellstrukturer.

Jeg kan finne moduler, og bruke reglene for serie- og parallellstrukturer.

For sammensatte strukturer kan vi lage moduler av delstrukturer. Reglene for serie- og parallellstrukturer gjelder også om noen komponenter er ”moduler”. Se eksemplet som følger senere.

Strukturfunksjonen er en deterministisk funksjon (dvs uten sannsynligheter). Vi er ofte interessert i å finne påliteligheten til et pålitelighetsblokkdiagram. Vi benytter symbolet pS for påliteligheten til et system (dvs sannsynligheten for at systemet fungerer). Noen ganger ønsker vi å understreke at påliteligheten er en funksjon av komponentpålitelighetene, og skriver da pS = h(p), hvor p er en vektor av komponentpålitelighetene.

Birnbaums mål for kritisk betydningDersom vi ønsker å finne viktigheten av komponentene kan vi beregne Birmbaums mål for kritisk betydning ved å finne den partiellderiverte av systempåliteligheten mht komponentpåliteligheten:

I B ( i )= ∂ h( p)∂ p i

(11)Høy verdi av Birnbaums mål tilsier at komponenten er kritisk, og det kan være lønnsomt å bedre påliteligheten ved f eks å kjøpe bedre kvalitet eller øke vedlikeholdsinnsatsen. Birnbaums mål kan også fortolkes som sannsynligheten for at komponenten er kritisk.

Feiltreanalyse (FTA = Fault Tree Analysis)Et feiltre er et logisk diagram som illustrerer sammenhengen mellom en uønsket hendelse i et system og årsakene til denne hendelsen

For å konstruere et feiltre benytter vi følgende symboltyper:

5

SYMBOL BESKRIVELSE “ELLER”

port A

E2E1 E3

ELLER-porten indikerer at utgangshendelsen A inntreffer hvis minst en av inngangshendelsene Ei inntreffer.

LOGISKE PORTER

“OG” port A

E2E1 E3

OG-porten indikerer at utgangshendelsen A inntreffer hvis alle inngangshendelsene Ei inntreffer.

“KooN” port

A

E2E1 E3

K/N

KooN-porten indikerer at utgangshendelsen A inntreffer hvis K eller flere av inngangshendelsene Ei inntreffer.

“Basis”-hendelse

Symbol for komponent i primær feiltilstand, oppstått under normal drift.

Gangen i en feiltreanalyse er i hovedtrekk:

1. Definisjon av problem og randbetingelser2. Konstruksjon av feiltreet3. Bestemmelse av minimale kutt- og stimengder4. Kvalitativ analyse av feiltreet5. Kvantitativ analyse av feiltreet

Noen kommentarer følger til hvert trinn:

Definisjon av problem og randbetingelserHjelpespørsmål for å definere “TOPP”-hendelsen

Hva: F eks brann Hvor: I kontrollrom Når: Under normal drift

Med disse hjelpespørsmålene blir det ofte lettere å konstruere feiltreet, dvs det blir klart hvilken situasjon vi analyserer.

Jeg bruker hjelpespørsmålene hva, hvor og når for å definere TOPP-hendelsen presist.

Konstruksjon av feiltreetFølgende iterative prosess følges for å konstruere feiltreet:

Start med “TOPP”-hendelsen Spør hvilke hendelser som er de direkte årsaker til “TOPP”-hendelsen Kople disse sammen med en “OG”/“ELLER”-port Hver av hendelsene behandles nå på samme måte, og man arbeider seg suksessivt ned til

“basishendelsene”

Nedenfor vises feiltreet for følgende eksempel:

6

Figur 1 Skisse av prosess-system med pumper

Beskrivelsen av det fysiske systemet kan være som følger. Prosessmediet pumpes ved hjelp av to redundante pumper inn i en tank der den kjemiske hovedprosessen foregår. Hver pumpe har et eget filter (sil) for å skille ut grovpartikler. Pumpene drives av en felles motor. TOPP-hendelsen her er «ingen output fra hovedprosessen»

Vi starter på toppen. Direkteårsakene til ”ingen output” er enten at hovedprosessen har sviktet, eller at det ikke kommer inn prosessmedium til hovedprosessen. Vi bruker en ELLER port her fordi det er nok at en av disse svikter for å gi TOPP-hendelsen. Fortsetter slik med at vi ikke får output fra pumpesystemet. Direkteårsakene her er at det verken kommer fra den ene eller den andre pumpen. Bruker her en OG port fordi vi har antatt at det er tilstrekkelig at det kommer prosessmedium fra den ene (redundant system). Dvs feil kun dersom begge ”grenene” feiler. Fortsetter videre etter samme prinsipp.

CARA Fault Tree version 4.1 (c) Sydvest Sotfware 1999Licenced to: SINTEF Industrial ManagementDept of Safety and Reliability

Ingen output frahovedprosess

TOPP

Feil i hovedprosess

MP

Ingen output frapumpesystemet

G0

Ikke output fraPumpe1

G1

Pumpefeil

P1

Motorfeil

M

Svikt i filter 1

F1

Ikke output fraPumpe2

G2

Pumpefeil

P2

Motorfeil

M

Svikt i filter 2

F2

7

Jeg starter med TOPP-hendelsen, og ser etter direkteårsaker. Jeg forstår forskjellen mellom OG-porter og ELLER-porter.

Et k oo N system fungerer så lenge at k eller flere av de N komponentene fungerer. Systemet vil imidlertid feile dersom N – k + 1 eller flere av de N komponentene feiler. For å representere et k oo N system i et feiltre kan vi da velge ut alle kombinasjoner av komponenter som til sammen utgjør N – k + 1 komponenter. En slik kombinasjon kobles sammen med en OG-port som representerer at denne kombinasjonen feiler dersom alle de N – k + 1 komponentene feiler. Deretter kan alle disse kombinasjonene kobles sammen med en ELLER port. For et 2 oo 3 system gir dette:

Merk at i mange feiltreprogrammer (f eks CARA FaultTree) angir man k i forhold til hvor mange feil som skal til for at systemet feiler, slik at k da skal erstattes av N – k + 1 i forhold til funksjon slik k har blitt benyttet i kurset.

Bestemmelse av minimale kuttmengderEn kuttmengde i et feiltre er en mengde av basishendelser som ved å inntreffe sikrer at TOPP-hendelsen inntreffer. En kuttmengde sies å være minimal hvis den ikke kan reduseres uten å miste status som kuttmengde.

For enkle systemer kan vi finne kuttmengdene ved direkte inspeksjon:

Start fra toppen Ved ELLER-port, ta med hendelser lenger ned fra hver gren inn til porten. For hver hendelse får vi

en ny kuttmengde Ved OG-port, ta med hendelser lenger ned fra hver gren inn til porten. Alle hendelsene vi tar med

oss “opp” blir i en kuttmengde Kan bli veldig stort dersom vi har mange OG porter Eliminer ikke-minimale kuttmengder

Fra eksemplet

Ta først med {MP}

Deretter går vi videre med G0 porten. Da dette er en OG port må vi ta med en fra hver side. Etter som vi får ELLER porter lenger ned må vi ta med alle kombinasjoner, en fra hver hovedgren som gir:

{P1,P2}, {P1,M},{P1,F2},{M,P2},{M,M},{M,F2}, {F1,P2}, {F1,M},{F1,F2}

Vi ser at {M,M} = {M}, og har da totalt følgende kuttmengder

{MP},{P1,P2}, {P1,M},{P1,F2},{M,P2},{M},{M,F2}, {F1,P2}, {F1,M},{F1,F2}

8

hvor ikke minimale kuttmengder er strøket over. Totalt får vi da følgende minimale kuttmengder:

{MP},{P1,P2}, {P1,F2},{M},{F1,P2},{F1,F2}

Kvalitativ analyse av feiltreetVi lister kuttene i stigende orden. De minimale kuttmengder med få element er de viktigste:

Cut set(s) with 1 component (Total: 2)

{M} {MP}

Cut set(s) with 2 components (Total: 4)

{P1,P2} {P1,F2} {F1,P2} {F1,F2}

Jeg kan finne kuttmengdene for enkle feiltrær. Jeg kan også eliminere ikke-minimale kuttmengder om jeg har slike.

Kvantitativ analyse av feiltreetFølgende systemmål er av interesse:

Q0(t) = Sannsynligheten for at TOPP-hendelsen er inntruffet ved tid t (utilgjengelighet)

F0(t) = Frekvens av TOPP-hendelsen ved tid t

R0(t) = Sannsynligheten for at TOPP-hendelsen ikke har inntruffet i [0,t>

For å beregne systemmålene kreves pålitelighetsdata for basishendelsene

feilrater (i = 1/MTTF)

reparasjonstider (MDT = 1/i) testintervall ved funksjonstest (i )

Vi viser kun beregning av Q0(t), hvor vi dropper tidsangivelsen (t ). Trinnene i beregningen er nå:

Trinn 1Finn feilsannsynlighetene per komponent. For enheter som repareres med en gang svikt inntreffer benytter vi:

qi = i MDTi (12)Merk at dette er en tilnærming av ligning (1), hvor qi = U. For enheter som funksjonstestes får vi

tilsvarende:

9

qi = ii /2 (13)For eksemplet ovenfor får vi (med mer nøyaktig formel for qi)Komponent MTTF MDT q = MDT/(MDT+MTTF)P1 /P2 1460 16 0.01084F1 /F2 1460 4 0.00273M 17520 24 0.00137MP 26280 48 0.00182

Jeg kan finne qi-ene på samme måte som jeg fant de i pålitelighetsblokkdiagrammet, evt gjøre det enda litt enklere med formelen qi = i MDTi.Trinn 2For hver kuttmengde beregner vi sannsynligheten for at kuttmengden er i feiltilstand. Denne sannsynligheten finner vi ved å multiplisere sammen alle feilsannsynlighetene for basishendelsene som inngår i kuttmengden. Fra eksemplet får vi:

Kuttmengde Bidrag per kutt Q j

{M} qM 0.001370{MP} qMP 0.001820{P1,P2} qP1 qP2 0.000011{P1,F2} qP1 qF2 0.000003{F1,P2} qF1 qP2 0.000030{F1,F2} qF1 qF2 0.000007

Trinn 3Vi kan nå legge sammen alle bidragene (kolonnen forQ j¿, og får Q0 = 0.003241.

Jeg kan finne bidragene til Q0 fra hvert kutt, og så summere disse for å finne Q0

Merk at dersom vi modellerer systemer som har skjult funksjon (lavdemand-systemer), vil vi være interessert i PFD. Her svarer Q0 til PFD. Det er vanlig i feiltreanalyse å benytte formelen qi = ii /2 for å finne PFD på komponentnivå. Dersom komponenter som inngår i en minimal kuttmengde testes samtidig, blir dette ikke riktig. Det er ikke helt rett fram å justere for dette. Dersom vi har en enkel parallellkobling kan vi for de kuttmengder hvor denne inngår, multiplisere med faktoren 4/3 for å få riktig svar. Dersom vi har ett 2 oo 3 system, kan vi multiplisere hver kuttmengde som inneholder 2 av disse komponentene også med faktoren 4/3. For mer kompliserte strukturer finnes generelle justeringsfaktorer, men disse gjengis ikke her.

Feiltreanalysen antar uavhengige komponenter. Dersom komponenter er stokastisk avhengig, er det vanlig å legge inn ekstra komponenter som representerer denne avhengigheten. Eksemplet nedenfor viser Et 2 oo 3 systemet med basishendelsen CCF som representerer fellesfeil.

10

Fellesfeilkomponenten antas å ha en lavere feilrate enn komponentene PT1, PT2 og PT3. Den enkleste metoden antar at fellesfeilandelen er .Vi kan også ved feiltranalysen finner viktigheten av komponentene ved å beregne Birnbaums mål som nå blir:

I B (i )=∂Q 0

∂q i(14)

Hendelsestreanalyse (ETA = Event Tree Analysis) Hendelsestreanalyse er også for spesielt interesserte. Jeg ser mer på dette dersom jeg tar kurset i risikoanalyse.

I en hendelsestreanalyse modellerer vi mulige hendelsesforløp etter at en uønsket hendelse har inntruffet. Hendelsesforløpet illustreres grafisk, hvor vi tar inn tidsaspektet, avhengigheter og dominoeffekter. Resultater fra en hendelsestreanalyse er:

Kvalitativ beskrivelse av hendelsesscenariene Kvantitativ beregning av frekvenser for hver av slutthendelsene Anbefalte risiokreduserende tiltak Kvantitativ beregning av effekt av tiltak

For å systematisere hendelsestreanalysen benyttes følgende trinn:

1. Identifiser og definer den initierende hendelsen (uønsket hendelse)2. Identifiser barrierer og fysiske forhold som skal modelleres i hendelsestreet3. Konstruer hendelsestreet4. Beskriv mulige hendelsesforløp som leder til slutthendelsene5. Bestem frekvensen av den initierende hendelsen og sannsynlighetene i hendelsestreet6. Beregn frekvenser for slutthendelsene i hendelsestreet7. Sammenstilling og presentasjon av resultater

Kvantitativ analyse av hendelsestre (punkt 6)Vi trenger følgende størrelser

f = Frekvens av initierende hendelse

11

qi = Sannsynligheten for at barrieren feiler (fiasko) pi = 1- qi = Sannsynligheten for at barrieren virker etter hensikten

Ofte representerer barrierene skjulte funksjoner, slik at vi kan benytte følgende formel:

qi = ii/2 (15)for å finne feilsannsynlighetene (PFD).

For å finne sluttfrekvensene (dvs frekvensene til slutthendelsene lengst til høyre i treet) multipliserer vi frekvensen av initierende hendelse med alle sannsynlighetene vi treffer på fram til slutthendelsen, dvs qi for ”fiasko-utgangene”, og pi for ”suksessutgangene”. Eksempel følger nedenfor.

Det er enkelt å regne på hendelsestrær, utfordringen er å sette opp barrierene i riktig rekkefølge.

Hendelsestreanalyse kontra feiltreanalyseEn feiltreanalyse benyttes primært til å analysere årsakene til uønskede hendelser, eller årsakene til en svikt i en barriere. For feiltreanalysen er det bare en ”utgangshendesle”, dvs TOPP-hendelsen. Feiltreanalyse er derfor uaktuelt dersom det er flere utfall. Hendelsestreanalysen benytter vi når vi skal analysere hendelsesforløpet etter en uønsket hendelse (dvs den initierende hendelsen i hendelsestreet). En hendelsestreanalyse vil ha flere utganger. Hver gren i hendelsestreet representerer et mulig utfall gitt at den uønskede hendelsen har inntruffet. Typisk vil vi tegne et hendelsestre for et system hvor flere barrierer aktiveres en etter en etter en kritisk situasjon. Alvorligheten av hendelsesforløpet vil typisk øke jo færre barrierer som fungerer (dvs opp til høyre i eksemplet ovenfor).

Jeg er stø i valget av ETA kontra FTA. Med kun et utfall, er FTA naturlig, mens ved mange utfall er ETA eneste tilnærming.

Dersom det er knyttet en tallverdi for tap til hver sluttkonsekvens (f eks antall drepte) kan jeg finne forventet tap (f eks forventet antall drepte) ved å multiplisere sluttfrekvens med tap for hver sluttkonsekvens, og så summere alle bidragene.

12

-faktor modellen-faktor modellen er den vanligste modellen for å ta hensyn til at komponenter kan svikte som følge av en felles årsak. Ideen bak modellen er at den totale feilraten til en komponent splittes opp i en uavhengig (I = independent) del, og en avhengig (C = Common cause) del:

= I +C (16)Hvor I = (1- ) er delen av feilraten som representerer uavhengige feil, mens C = er delen av feilraten som representerer avhengige feil, og som vil slå ut alle komponentene samtidig, eller i løpet av kort tid (dvs innenfor en testperiode). For en parallellkobling med identiske komponenter får vi da:

PFD ≈ ( (1−β ) τ )2

3+ βτ /2 (17)

Det første leddet representerer uavhengige feil, mens det siste leddet representerer avhengige feil. For en k oo N struktur kan man erstatte det uavhengige leddet ovenfor med tilsvarende ledd fra Tabell 10.1 i Rausand og Høyland (2004). Dersom man vil lage en formel i MS Excel kan man benytte følgende generelle formel:

PFD ≈ N ! ( (1−β ) τ )N−k +1

(N −k+2 )! (k−1 ) !+ βτ /2 (18)

Jeg benytter formelen ovenfor dersom jeg vil lage en generell modell i et regneark. For enkle systemer benytter jeg Tabell 10.1 i Rausand og Høyland (2004) eller Tabell 1 ovenfor.

Markov modellering Markovanalyse er en metode som benyttes for å analysere dynamiske systemer hvor det er komplekse sammenhenger mellom overgangene mellom systemtilstander. Metoden har følgende trinn:

1. Lag en skisse av systemet, og forsøk å forstå logikken i systemet

2. Definer systemtilstander

3. Tegn Markovdiagrammet med overgangsrater

4. Kvantiative beregninger

5. Sammenstilling og presentasjon av resultatene fra analysen

Makrovanalyse benyttes oftest innen pålitelighetsanalysen for å analysere standby systemer, og målet er ofte å finne gjennomsnittlig tid systemet er i ulike tilstander som utgangspunkt for å finne regulariteten til systemet.

De viktigste elementene for Markovanalyse er:

1. Tilstander, som nummereres fra 0 (dårligst) til r (best)2. X(t) er tilstand til systemet ved tid t3. Overgangsrater, dvs aij er raten av overganger fra tilstand i til j gitt at systemet er i tilstand i4. A er overgangsmatrisen, og består av elementene aij. Diagnoalelementene ajj fastsettes ved at

summen av aij’ene på en rad skal være lik 0.5. Pi(t) er sannsynligheten for at systemet er i tilstand i ved tid t

13

6. P(t) = [P0(t), P1(t),…,Pr(t)]For å finne den tidsavhengige løsningen kan man benytte følgende differensialligning:

P(t) A = d P(t)/d t (19)Hvor initialbetingelsene angis ved en vektor av initielle sannsynligheter, dvs P(0). For å løse Markov differensialligningene kan man numerisk benytte seg av følgende iterasjonsformel:

P(t) A = d P(t)/d t [P(t+t) - P(t)] /t (20)som gir

P(t+t) P(t) [I +t A] (21)Hvor I er identitetsmatrisa. Her kan vi benytte ligning (21) for å «iterere» oss frem til en løsning for tid t+t ved å bruke verdien ved tid t. P(0) angir tilsand like før en test, og er en vektor med bare nuller bortsett fra verdien 1 i tilstanden som representerer tilstanden etter en test (typisk den høyeste verdien).

For å løse Markovligningene finnes egne regneark i MS Excel.

RCM - Reliability Centred MaintenanceRCM er primært en metode for å etablere et forebyggende vedlikeholdsprogram. Metoden er sporbar, slik at man forholdsvis enkelt kan justere vedlikeholdsprogrammet ved endring av forutsetninger. Det er ikke noe standardoppsett for RCM, men følgende trinn kan være en naturlig start:

1. Forberedelser2. Valg av system, systemavgrensninger3. Funksjonell feilanalyse (FFA)4. Utvelgelse av kritiske enheter (MSI)5. Datainnsamling og analyse6. Feilmode og effekt analyse (FMEA/FMECA)7. Bestemmelse av vedlikeholdsaktiviteter (RCM-logikk)8. Intervalloptimalisering9. Kontinuerlig oppdatering - RCM prosessen

FFA og FMECA er viktige skjemateknikker for å analysere funksjon og feilmoder til systemet, evt komponentene til systemet. I denne analysen begrenser man antall komponenter/feilmoder ved at kun de med høy kritikalitet (på en eller annen skala) blir tatt med i det videre arbeidet.

Jeg vet at en FFA finner delsystemets funksjoner, og feilmoder (som ofte betegnes funksjonsfeil).

Jeg vet at basert på kritiske systemfeilmoder identifiseres relevante komponenter for videre analyse (MSI=Maintenance Significant Items).

For enkle systemer kan jeg utføre en FMECA, og vurdere relevansen av de ulike kolonnene i skjemaet.

14

RCM – BeslutningslogikkFor de mest kritiske feilmodene (fra FMECAen) foretas nå en analyse av hvilke vedlikeholdsaksjoner som kan være relevante. Til dette benyttes RCM beslutningslogikk. Det finnes heller ingen standard beslutningslogikk, men en enkel og for de aller fleste situasjoner tilstrekkelig logikk gjengis nedenfor:

Figur 2 RCM beslutningslogikk

Jeg forstår spørsmålene, og kan for rimelige enkle systemer benytte logikken. F eks tilstandskontroll (kontinuerlig eller periodisk) er naturlig dersom det finnes indikatorer som kan varsle kommende feil.

Jeg vil kunne huske hovedtrekkene i en slik logikk fordi jeg skjønner gangen i logikken. Først vurderer vi om tilstandskontroll er mulig, hvis ikke, er neste valg aldersbestemt utskifting/overhaling, og til slutt er det bare funksjonstest som er mulig (ved skjult funksjon).

IntervalloptimaliseringRCM beslutningslogikken gir type vedlikehold. Men logikken sier ikke noe om hvor mye vedlikeholds som bør gjennomføres. Intervalloptimalisering betyr å finne tid mellom hver vedlikeholdsoppgave. Jo mer vedlikeholds som gjøres (kortere intervall) jo lavere effektiv feilrate kan man forvente, og i utgangspunktet lavere produksjonstap osv. Men vedlikehold koster slik at man må balansere innsatsen. For å optimere vedlikeholdsintervallene trenger vi som minimum:

1. Effektiv feilrate, E( ),2. Kostnad for å utføre en FV, CPM3. Kostnad for å utføre en KV, CCM4. Sannsynlighet for at vi får systemsvikt gitt komponentsvikt5. Konsekvens av systemsvikt

a. Sikkerhet (kroneverdi)b. Punktlighet/tilgjengelighet (kroneverdi)

15

c. Materielle tap (havari med mer, kroneverdi)

Effektiv feilrate, E( ), er forventet antall svikt per tidsenhet (ubetinget feilrate) gitt at vi foretar vedlikehold med tid mellom hver gang vedlikehold utføres lik (vedlikeholdsintervall).

For å finne optimalt intervall beregnes forventede kostnader per tidsenhet. I standardssituasjonen kan vi skrive:

C( ) =CPM/ + E ( ) [CCM + CEU + CES…] (22)hvor

CPM er kostnader per forebyggende vedlikeholdsaktivitet (perventive maintenance). CCM er kostnadene ved å reparere en feil (corrective maintenance). CEU er forventet produksjonstap (evt punktlighetstap) ved en svikt, og kan ofte finnes ved CEU = Pr(P) (CP MDT + CT). Pr(P) er sannsynligheten for at en komponentsvikt leder til

produksjonstap (punktlighetstap osv). CP er kostnaden per time systemet er nede, og MDT er midlere nedetid til komponenten etter en svikt ( i timer), og CT er fast kostnad ved at systemet går ned, uavhengig av nedetid.

CES er forventet sikkerhetstap ved en svikt, og kan ofte skrives som CES = Pr(S) CS. Pr(S) er sannsynligheten for at komponentsvikt leder til en hendelse kritisk for sikkerhet. CS er tilhørende kostnad gitt sikkerhetshendelse inntreffer.

Pr(P) og Pr(S) er sannsynlighet for produksjonstap, evt sikkerhetstap ved komponentsvikt. For å finne Pr(P) og Pr(S) kan man ofte benytte Birnbaums mål, IB(i ), som angir sannsynligheten for at en komponent er «kritisk». Kritisk betyr her at systemet står og «vipper» mht om komponent i virker eller ikke.

For å finne minimale kostnader per tid, kan man derivere ligning (22) mht og sette lik 0. Alternativt kan man beregne kostnadene i ligning (22) for ulike -verdier, og se hvilken som gir laveste forventede kostnader. En tredje tilnærming er å legge inn ligning (22) i MS Excel, og så benytte «problemløseren» (Solver).

Jeg skjønner gangen i å sette opp kostnadsfunksjonen. C() angir forventede kostnader per tidsenhet.

Jeg pugger aldri slike formler, men resonerer meg fram til uttrykket. Jeg starter med totale FV kostnader per tid, og setter disse til CPM/. Så ser jeg på hva som skjer ved en svikt. Utenfor parentesen har jeg raten av svikt som funksjon av intervallet, dvs E (). Inne i parentesen har jeg alltid CCM da jeg alltid må reparere enheten som har sviktet. Med en viss sannsynlighet får jeg systemsvikt, enten i form av sikkerhet, eller produksjonstap. For å finne forventet kostnad her multipliserer jeg sannsynligheten med konsekvensen gitt sikkerhet, eller produksjonstap.

Derivasjon er ikke min sterke side, men jeg er i stand til å beregne kostnadsfunksjonen for utvalgte verdier av (intervallet). Til dette benytter jeg Excel, og finner minimum ved å lage en graf.

Jeg forstår å bruke «Problemløseren» i Excel.

Ikke-observerbar feilutvikling - AldringDersom feilutvikling (f eks slitasje eller sprekkutvikling) ikke kan avdekkes som en del av vedlikeholdet

16

sier vi at vi har ikke-observerbar feilutvikling. For komponenter hvor vi umiddelbart avdekker en svikt, og hvor vi har aldring kan vi finne effektiv feilrate ved ligning (23):

E() = [ (1+1/)/MTTF ] -1 (23)hvor MTTF er midlere tid til svikt dersom enheten ikke vedlikeholdes (ut over daglig “pleie”), er aldringsparameter og er vedlikeholdsintervallet (bytting eller overhaling). Gammafunksjonen kan finnes i Excel ved: (x) = Exp(GammaLn(x)). Formelen gjelder for << MTTF. Ved å sette inn i ligning (22), derivere mht , og sette lik 0 finner vi optimalt intervall ved:

τ =MTTF❑

¿¿ (24)Dersom er større enn ca 10% av MTTF vil tilnærmingen i ligning (23) bli unøyaktig. Vi kan da benytte en korreksjonsfaktor for å få et mer nøyaktig uttrykk for den effektive feilraten:

λE(τ )=¿¿ (25)hvor korreksjonsleddet er gitt ved

γ (τ ,α , MTTF )=[1− 0.1 α τ2

MTTF2 +(0.09 α−0.2¿τ

MTTF ] (26)Dersom nærmer seg MTTF er også ligning (25) unøyaktig. Vi kan da finne effektiv feilrate ved å beregne fornyelsesfunksjonen W(t ) ved følgende iterative oppsett:

W i(t )=FX❑( t )+∫

0

t

W i−1(t−u) f X(u)du (27)Hvor FX(t ) og fX(t ) er hhv fordelingsfunksjonen og sannsynlighetstettheten til levetidsfordelingen. Initiell verdi finnes ved W0(t )= E(t )×t, hvor E(t ) igjen finnes ved ligning (25). Det er ofte tilstrekkelig med 2-3 iterasjoner av ligning (27). Til slutt setter vi:

λE(τ )=¿¿ (28)Denne tilnærmingen krever programmering, f eks i VBA for MS Excel.

Dersom vi benytter ligning (25) eller (28) for effektiv feilrate kan vi ikke finne en ligning på lukket form. Vi må da benytte numeriske metoder for å minimere kostnadsfunksjonen, f eks «Problemløseren».

Jeg satser på ligning (25) dersom jeg har god tid. For en kjapp beregning benytter jeg ligning (23).

Ikke-observerbar feilutvikling – SjokkDersom vi ikke har observerbar feilutvikling, og heller ikke aldring vil forebyggende utskifting eller overhaling ha noen effekt. Dersom funksjonen til enheten som analyseres er skjult, vil imidlertid en periodisk funksjonstest kunne avdekke svikt. I denne situasjonen beregner vi den såkalte PFD’en (Probability of Failure on Demand) som angir andelen av tiden enheten ikke kan yte krevd funksjon. For et k oo N system finnes PFD ved:

PFD (τ )≈ ( NN−k+1) ( λτ )N −k+1

N −k+2+¿2 (29)

Ligningen kan skrives i MS Excel ved:

PFD=COMBIN(N,N-k+1)*((lambda*tau)^(N-k+1))/(N-k+2)+beta*lambda*tau/2

17

Hvor COMBIN(N,N-k+1) i Norsk Excel (og norsk oppsett) finnes ved KOMBINASJON(N;N-k+1). Dersom det kun er en komponent benytter vi den vanlige formelen PFD = /2For slike system gir det ikke særlig mening å snakke om effektiv feilrate, men vi kan finne raten av farlige situasjoner, hvor en farlig situasjon er definert ved at sikkerhetsfunksjonen ikke virker og at det er en etterspørsel (f eks en gasslekkasje). Denne raten er gitt ved produktet av PFDen og raten av etterspørsler. Kostnadsligningen vi benytter i denne situasjonen er ofte på formen:

C() CI/ + N CR(- 2/2)+ CH PFD( ) fD (30)Hvor CI er inspeksjonskostanden, CR er kostanden for å reparere en av de N komponentene dersom den er funnet i feiltilstand ved en funksjonstest, CH er kostnaden ved en farlig situasjon (Hazardous event), og fD er raten av etterspørsler (f eks raten av gasslekkasjer).

Jeg forstår leddene i ligning (30).

Jeg benytter Tabell 1 for å finne første ledd i ligning (29) dersom jeg ikke har tid til å legge inn formelen i MS Excel.

Observerbar gradvis feilutviklingMange modeller finnes for situasjonen hvor feilutviklingen starter mer eller mindre ved tid t = 0, og fortsetter rimelig jevnt til enheten går til svikt om den ikke skiftes ut eller blir forbedret. Standard kostnadsmodell i denne situasjonen er:

C(,l ) = CI/ + (CF+CCM) ×E(,l ) + CRC × E(,l ) (31)hvor l er vedlikeholdsgrensen, CI er inspeksjonskostanden, CF er kostanden ved en systemsvikt, CCM er kostnaden for å reparere en enhet som har sviktet og CRC er kostnaden for å fornye («resette») en komponent som har passert vedlikeholdsgrensen. E(,l ) er effektiv feilrate og E(,l ) er fornyelsesraten (antall «resettinger» per tidsenhet) og er begge avhengig både av intervallet og vedlikeholdsgrensen.

En såkalt Markov tilstandsmodell benyttes ofte for å beskrive feilutviklingen. Den antar at degraderingen går gjennom trinn fra beste tilstand (0) til feiltilstand (r ). Systemet «hopper» mellom tilstandene. Følgende parametere må spesifiseres i en slik modell:

MTTF = Midlere tid til svikt dersom vi ikke skifter enheten før den går til svikt (MTTFN). V = r-1/0 = forholdet mellom degraderingsrate på slutten av levetiden i forhold til i begynnelsen. r = Antall tilstander før vi kommer til feiltilstanden. q = Sannsynligheten for at en inspeksjon ikke avdekker kritisk feilutvikling.

Valget av r er en utfordring. Ofte vil vi ikke kunne gi r en fysisk fortolkning, men den er kun en parameter som gir modellen realistiske egenskaper. Det er da ønskelig å velge r slik at variansen til tid til svikt (T ) uten vedlikehold svarer til variansen gitt fra Markov modellen. Vi kan da benytte

v = V 1/(r-1) (32)λ0=

1− 1vr

(1− 1v ¿MTTF

(33)18

Var (T )= 1−v−2 r

( 1−v−2 ) λ0❑

2 (34)Ved å beregne Var(T ) fra ligning (34), evt standardavviket kan vi forsøke ulike verdier for r for å se om modellen gir rimelige anslag for variansen. Fra ligning (34) kan vi finne variasjonskoeffisienten ved cv=√Var (T )/ MTTF og sammenligne med f eks variasjonskoeffisienten i Weibull modellen gitt av ligning (7). For å kunne beregne effektiv feilrate og fornyelsesrate trenger vi å programmere rutiner. Dette kan gjøres i VBA i MS Excel.

Jeg skjønner inngangsstørrelsene i modellen.

Jeg satser på å bruke MS Excel filer med innebygget VBA funksjoner for å beregne effektiv feilrate og fornyelsesrate, og kan da finne optimal vedlikeholdsstrategi.

Observerbar rask feilutvikling (PF-modellen)Denne modellen benyttes dersom man i en lang periode ikke har observerbar feilutvikling, for deretter å gå inn i en fase hvor feilutviklingen er relativt rask. Tidspunktet hvor feilutvikling først er observerbar (med det utstyr vi har for å avdekke feilutvikling) betegnes en potensiell feil (P), mens svikttidspunktet betegnes en feil (F). PF-intervallet er tiden mellom den potensielle feilen og svikttidspunktet. PF intervallet er en stokastisk variabel. Følgende størrelser inngår i modellen:

MTTF = Midlere tid til svikt dersom vi ikke skifter enheten før den går til svikt (MTTFN). EPF = Forventet lengde av PF-intervallet. SDPF = Standardavviket til lengden av PF-intervallet. q = Sannsynligheten for at en enkelt inspeksjon ikke avdekker en potensiell feil f = 1/( MTTF - EPF) = raten av potensielle feil

Effektiv feilrate i denne modellen er:

E() = f Q0( ;EPF, SDPF,q) (35)hvor Q0( ;EPF, SDPF,q) må finnes ved numeriske metoder. Kostnadsligningen som skal minimeres er gitt ved:

C( ) = CI/ + (CF+CCM)E() + CPMf (1- Q0( ;EPF, SDPF,q)) (36)hvor CI er inspeksjonskostanden, CF er kostanden ved en systemsvikt, CCM er kostnaden for å reparere en enhet som har sviktet og CPM er kostnaden for å reparere en enhet som har en potensiell feil.

Jeg skjønner inngangsstørrelsene i modellen.

Jeg satser på å bruke MS Excel filer med innebygget VBA funksjoner for å beregne Q0, og kan da finne optimalt intervall.

GrupperingPresentasjonen her diskuterer hvordan vi kan formalisere optimaliseringen av vedlikeholdsgruppering. Dvs vi søker å gruppere vedlikeholdsoppgaver slik at totale kostander minimeres. Vi skiller på to hovedtyper av gruppering:

19

Statisk gruppering hvor gruppene er faste. Dvs det er alltid de samme komponentene som inngår i samme gruppe, og hver vedlikeholdsgruppe utføres samtidig i betydningen at aktivitetene blir utført.

Dynamisk gruppering hvor vi lager gruppene etter hvert som aktiviteter blir lagt i «forfallsregisteret». Fordelen med dynamisk gruppering er at vi kan oppdatere planen dersom vi får ny informasjon, eller det oppstår ekstra muligheter (opportunities) til å gjennomføre vedlikehold. Ulempen er betydelig mer administrativt arbeid og utfordringer i forhold til bemanningsplanlegging.

Følgende notasjon innføres:

c iP Kostnad for planlagt forebyggende aktivitet, eksklusivt set-up kostnad, komponent i

c iU Kostnad for “ikke-planlagt” svikt komponent i. Kostnaden inkluderer KV, sikkerhetskostnader,

produksjonstap osv.S Set-up kostnad, dvs kostnader for forberedelser, adkomst osv som kan “deles” av flere FV-aktiviteter

E,i(x) Effektiv feilrate komponent i. Bruker her argumentet x for å angi lokal tidMi(x) ¿ x ∙c iU ∙❑E ,i(x ) = Akkumulerte forventede sviktkostnader i en vedlikeholdssyklus av lengde x

Φ i( x , k ) ¿ [c iP+S /k+M i(x) ]/x = Forventede totale kostander per tidsenhet for en vedlikeholdssyklus av

lengde xx i ,k

¿ Vedlikeholdsintervall som minimerer Φ i( x , k )Φ i ,k

¿ Minimumskosntad for en enhet som vedlikeholdes ved optimalt intervall

For statisk gruppering skiller vi mellom indirekte og direkte gruppering.

Statisk indirekte grupperingTilnærmingen for indirekte gruppering er at tidspunkt for hver enkelt aktivitet bestemmes indirekte ved å angi hvor ofte aktiviteten utføres i forhold til et fast repeterende tidspunkt for vedlikehold. Situasjonen nå er som følger:

Det er en mulighet for å gjøre forebyggende vedlikehold ved tidspunkter med tid mellom disse tidspunktene gitt av størrelsen T

For komponent i så benyttes denne muligheten hver li’te gang, dvs intervallet mellom vedlikehold for denne enheten er liT

Utfordringen nå er å bestemme T og li, i = 1,2,…

For gitt verdi av T, l1, l2,… blir forventede kostnader per tidsenhet:

C(T, l1, l2,…) = S/T + i=1:n [cPi + Mi(liT )]/(liT ) = S/T + i=1:n [cPi /(liT )+ cUi E,i(liT )] (37)

Følgende heuristikk foreslås for å finne en rimelig god løsning:

1. For hver aktivitet i finner vi den verdien av i som minimerer C(i) = (S+ cPi )/i + cUi E,i(i)2. En initiell verdi av T settes lik den minste av i-verdiene3. Velg li i /T (nærmeste heltall)4. Hold li fast og minimer ligning (37) mht T

20

5. GoTo 3 og varier li litt for å se om en bedre løsning kan finnes, typisk økes eller reduseres en av li ene av gangen til løsningen ikke blir bedre

Statisk direkte grupperingVed direkte gruppering velges gruppene direkte ved å inspisere individuelle intervaller. Aktivitetene deles nå inn i m ikkeoverlappende grupper. Aktiviteter i en gruppe vedlikeholdes samtidig. For gruppe j er intervallet Tj. Totale forventede kostnader per tidsenhet blir da:

C(T1, T2, T3,… Tm) = j=1:m {S/Tj + i Gj [cPi /Tj + cUi E,i(Tj )] } (38)Følgende heuristikk foreslås for å finne en rimelig god løsning:

1. Finn individuelle intervaller, i, tilsvarende som for indikerte 2. Sorter i økende orden, dvs (1) < (2) < … 3. Se etter naturlige klynger i intervallene, og la disse danne grupper G1, G2,… 4. Gitt oppdelingen, Gj, j = 1,..,m, minimer ligning (38) mht T1, T2, T3,… Tm5. GoTo 3 og varier gruppene for å se om en bedre løsning kan finnes, f eks flytte en aktivitet fra en

gruppe til en annen, slå sammen to grupper, eller del en gruppe i to

Dynamisk grupperingI dynamisk gruppering lages gruppene etter hvert. Det er ingen faste grupper, men et tentativt forfallsregister benyttes for å bestemme gruppene. Hoved trinnene er:

Trinn 0 – Initialisering Trinn 1 – Lag en tentativ plan Trinn 2 – Lag kandiatgrupper for første gruppe Trinn 3 – Beregn kostnad for hver kandidatgruppe dersom den utføres på optimalt tidspunkt, og

velg den beste Trinn 4 – Gå til neste gruppe, på samme måte som i trinn 2 og 3 hvor kanidatgrupper håndteres på

samme måte

I Trinn 0 beregnes individuelle intervaller for hver aktivitet under forutsetning av at de gjennomføres sammen med k-1 andre aktiviteter. k er ikke kjent, men vi kan velge en verdi ut fra hvor mange enheter vi grovt sett forventer i hver gruppe. En «bedre» verdi av k kan finnes på et senere tidspunkt i analysen ved å se på «resultatet» av grupperingenen. Kostnadsfunksjonen vi nå benytter er:

Φ i ( x , k )=c i

p+S /kx

+c iU (39)

hvor optimalt intervall betegnes x i ,k¿ , og minimumsverdien betegnes Φi ,k

¿ . I den videre analysen går vi videre med bare en k-verdi per aktivitet, og vi stryker da indeks k.

Den tentative planen blir nå å plassere aktivitetene ut i tid. Vi antar at vi nå er ved tidspunkt t0. Anta nå videre at tidspunkt for forrige forebyggende vedlikehold for aktivitet i er ti < t0. Neste forfall for aktivitet i er da t i

¿=ti❑+x i

¿> t0, se Figur 3.

21

Figur 3 Aktiviteter i forfallsregisteret

En kandidatgruppe er nå en gruppe av aktiviteter som følger kronologisk i forhold til t i¿-ene. Vi bestemmer

først kandidatgrupper for den første gruppen. Kandidatgruppe Kk er nå en gruppe med de første k aktivitetene. Gitt Kk er totale kostnader fra nå og fram til slutten av planleggingshorisonten, T, gitt ved:

c (t ;k )=S+∑i∈K k

[c iP+ Mi( t−t0+x i)−M i( xi)+(T −t )Φi

¿ ]

+∑i∉ Kk

[ ciP+S /k i+M i(x i

¿)−M i(x i)+(T −ti¿)Φi

¿ ] (40)hvor det antas at aktiviteter i kandidatgruppen utføres ved tidspunkt t, og deretter ved sine respektive optimale tidspunkter. Aktiviteter som ikke inngår i kandidatgruppen antas å bli utført ved sine optimale tidspunkter både ved første forfall, og etterfølgende forfall. For kandidatgruppen som vurderes beregnes optimalt tidspunkt ved å minimere ligning (40) mht t. Å finne den beste kandidatgruppen betyr nå å øke k, dvs at kandidatgruppene Kk øker med en aktivitet om gangen. Dette gjøres helt til økningen i k gir økte kostnader. Merk at dersom en aktivitet har to forfall nært etter hverandre i tid, slik at aktiviteten inngår to ganger i en kandidatgruppe vil ikke dette gi mening. Dette setter begrensning på størrelsen av kandidatgrupper som kan vurderes.

DataanalysePresentasjonen her fokuserer på dataanalyseteknikker med formål å estimere parametere (MTTF, osv) i modeller vi benytter for vedlikeholdsoptimering. Ikkeparametriske metoder vil her være grafiske teknikker for å synliggjøre aldring, overlevelsessannsynlighet og midlere tid til svikt. Dersom vi har fullstendige data er metodene enklere og gir bedre resultater enn dersom vi har mange sensurerte datapunkter. Et sensurert datapunkt betyr her at vi ikke har observert svikttiden, men kun at enheten har overlevd en viss tid.

Nelson Aalen plottNelson Aalen plottet benyttes for å se om det er global trend i dataene. Dette gjelder spesielt dersom vi observerer flere svikt per system (vi bruker begrepet system her fordi et slikt system kan ha flere komponenter som kan svikte, men vi betrakter systemet generelt under ett). Ofte vil slike enheter ikke være så god som ny etter en svikt, og vi før en økning i antall svikt per tidsenhet. Nelson Aalen plottet viser essensielt kumulativt antall svikt som funksjon av global tid. Settingen er nå som følger:

Vi observerer data for n systemer, og for system i observerer vi svikt i perioden (ai,bi] i forhold til global alder

La tij betegne svikttid j i system i (global eller kalendertid)22

Slå sammen alle tidene, tij, og sorter dem i økende orden. Betegn resultatet tk, k = 1,2,….. For hver k, la Ok betegne antall systemer som er i drift like før svikttid tk La W 0=0 BeregnW k =W k−1+1/Ok

Plott (t k , W k )

Dersom vi har kun ett system blir prosedyren svært enkel, da lager vi et plott som øker med en på y-aksen for hver svikt. Det er det samme som skjer ovenfor, men her øker vi med faktoren 1/Ok for hver svikttid. Plottet er et estimat for W(t ), som er forventet antall svikt fra 0 til t for ett system. Et plott som krummer oppover (konveks) indikerer økende antall svikt, mens et plott som krummer nedover (konkav) viser et system som forbedrer seg. Et plott som ligger langs en rett linje indikerer at det ikke er noen trend. Dersom vi ikke kan se noen trend, kan vi anta at tid mellom svikt er tilnærmet identisk fordelt, og klassisk levetidsanalyse kan benyttes.

TTT plott for komplette data

VI antar at vi har n uavhengige identisk fordelte levetider (enheter operert under tilnærmet like betingelser, og enhetene er så god som ny etter en svikt dersom flere svikttider er observert for en og samme enhet). Dersom vi observerer flere svikt for samme system, så må Nelson Aalen plottet vise punkter tilnærmet på en linje. Levetidene betegnes T1,T2,T3,..,Tn, og T(1),T(2),T(3),.., T(n) er sorterte levetider, dvs T(1) £T(2)£T(3)£…. £T(n). Den såkalte TTT observatoren defineres nå for et hvert tidspunkt t som totalt observert tid (Total Time on Test) fram til t:

TTT ( t)=∑j=1

i

T ( j)+(n−i)t (41)hvor i er slik at T(i) £ t < T(i+1).TTT plottet finnes nå ved å plotte normalisert TTT observator mot normalisert indeks:

( in

,TTT (T (i ))TTT (T (n ))) (42)

Kaplan Meier plottStandard TTT plot antar at vi har komplette data. Dersom vi har sensurerte data er det vanlige TTT plottet ikke hensiktsmessig. For å konstruere et TTT plott går vi da vegen om Kaplan Meier plottet. La T(1), T(2),…,T(n) være de sorterte levetidene vi har (inkluder sensurerte levetider). La n(i) være antall komponenter «under risiko», dvs som fortsatt lever, ved tid t(i) og s(i) være antall svikt ved tid t(i). I regelen er s(i) = 1, men kan være større enn 1 dersom vi observerer like svikttider (med målenøyaktigheten vi benytter). Kaplan Meier estimatoren for overlevelsessannsynligheten er nå gitt ved:

R (t )=∏T (i)<t

n(i)−s(i)

n(i)(43)

For å lage plottet beregner vi n(i)−s(i)

n(i) for hvert svikttidspunkt T(i). Tidligere verdier multipliseres da med

denne brøken for å finne neste verdi av R ( t ).

23

TTT plott for sensurerte dataVed å kombinere den såkalte TTT-transformen (se nedenfor) med Kaplan Meier estimatoren, kan man for sensurerte data lage et TTT plott. På x-aksen plottes normalisert verdier av uttrykket:

v(i)=1−R ( T (i)) (44)hvor indeks i løper gjennom de sorterte svikt tidene, og på y-aksen plottes normaliserte verdier av uttrykket:

H−1 ( v (i) )=∑j=1

i−1

(¿T ( j+1 )−T ( j )) R ( T ( j))¿ (45)Med normalisering mener vi at vi plotter:

( v ( i)

v ( k ),

H−1 ( v ( i) )H−1 ( v ( k ) ) ) (46)

hvor k er siste levetid i lista sorterte levetider.

TTT TransformasjonTTT transformasjonen er en parametrisk analog til TTT-plottet, og er gitt ved:

ϕ F(v)= 1MTTF ∫

0

¿¿

¿ (47)For Weibullfordelingen finner vi at TTT transformasjonen er gitt ved:

W(v;) = CDFGamma(-ln(1-v), 1/, 1) (48)hvor CDFGamma() er fordelingsfunksjonen i gammafordelingen, og er i MS Excel gitt ved Gammadist(). Dersom vi kjenner aldringsparameteren i Weibullfordelingen kan vi sammenligne ligning (48) med det ikkeparametriske plottet vi har for dataene. Som alternativ til formell estimering, kan vi prøve oss med ulike verdier for og finne den verdien som gjør at ligning (48) passer best med det ikkeparametriske plottet. Et grovt anslag for MTTF vil være gjennomsnittet av levetidene, men dersom vi har mange sensurerte levetider vil vi da underestimere MTTF.

Estimering i Weibulfordelingen med sensurerte dataDersom vi vil estimere parametere i Weibullfordelingen kan vi gjøre dette dersom vi har observert levetider og sensurerte levetider som er uavhengig og identisk fordelte. Oppskriften er nå som følger:

1. La T1, T2,…,Tn være levetidene vi har (inkluder sensurerte levetider). La videre I1, I2,…In være indikatorer slik at Ii = 1 dersom tid nummer i er en levetid, og 0 hvis det er en sensurert levetid.

2. Rimelighetsfunksjonen, L (α , λ ), er nå gitt ved produktet av sannsynlighetstetthetene i punktene1 t1, t2,…,tn for levetidene multiplisert med produktet av overlevelsessannsynlighetene i punktene t1, t2,…,tn for de sensurerte levetidene.

3. ML-estimatene (ML = Maximum likelihood) er nå gitt ved de verdiene av parameterne som maksimerer rimelighetsfunksjonen. Vi kan alternativt maksimere logaritmen av rimelighetsfunksjonen. Denne er gitt i ligning (49) for Weibullfordelingen.

4. Vi skal minimere mht og , og må generelt benytte numeriske metoder (f eks problemløseren).

1 Vi bruker store bokstaver om de stokastiske variablene, dvs levetidene. Når vi har tallverdier for disse, dvs de virkelige observasjonene, benytter vi små bokstaver

24

l (α , λ )=log L ( α , λ )=∑i=1

n

I i [ ln α+α ln λ+ (α−1 ) ln ti ]−¿¿ ∑i=1

n

( λ ti )α (49)Estimering i NHPPFor reparerbare systemer antar vi ofte at svikttidene følger en ikkehomogen Poissonprosess (NHPP). De vanligste slike prosesser er:

Tabell 2 Ulike parametriske modeller for NHPPEgenskaper Modell Power law model Linear model Log-linear model

ROCOF = w(t) t β −1 (1+t) eα+ βt

W(t) t β (t +t2/2) (eα+ βt−eα)/¿

Systemet forbedres for < 1 < 0 < 0

Systemet forringes for > 1 > 0 > 0

E() ❑β−1 (1+/2) (eα+ βτ−eα )/( )

Her er ROCOF = w(t) (Rate Of Occurrence Of Failures) raten av svikt for et system med alder t, mens W(t) er forventet antall svikt i intervallet [0 , t ⟩. Vi antar nå at vi observerer et system i en periode [a ,b ⟩, og har observert (sorterte) svikttider t1,t2,t3,..,tn. Logaritmen av rimelighetsfunksjonen som skal maksimeres er nå gitt ved:

l (θ ,t )=∑i =1

n

¿¿ (50)hvor vi trenger numeriske metoder (Problemløseren) for maksimere ligning (50), og vi må velge en parametrisk form fra Tabell 2.

Bayesianske metoderBayesianske metoder er metoder for å estimere modellparametere hvor vi kombinerer såkalt apriori informasjon (fra eksperter, eller annen relevant informasjon) med data fra systemet vi skal analysere. Metoden består av følgende trinn:

1. Spesifiser en a priori fordeling over parametervektoren, , som betraktes, ()2. Strukturer data, x, fra systemet vi betrakter inn i en rimelighetsfunksjon, L(;x)3. Beregn a posteriori fordeling, (x)4. A posteriori fordeling finnes ved (x) L(;x) (), hvor proporsjonalitetskonstanten finnes

ved at a posteriorifordelingen skal integreres til 1. Ofte vil vi ved å studere formen på a posteriorifordelingen kunne se normaliseringskonstantene direkte

5. Det såkalte Bayes-estimatet for er nå gitt ved forventningsverdien i a posteriorifordelingen

Bayesestimatet for konstant sviktintensitetDersom vi skal estimere feilraten i en situasjon med konstant sviktintensitet har vi ofte følgende situasjon:

25

Vi har observert et eller flere systemer over en total tidsperiode på t (f eks timer). I denne perioden har vi observert totalt n svikt. Ut fra ekspertvurderinger, eller generiske data fra f eks OREDA beskrives a priorifordelingen ved forventningsverdien E, og standardavviket SD. Gangen i analysen er nå:

1. Beregn hjelpestørrelser = E/SD2, og = E2. Bayesestimatet for feilraten er gitt ved λ= α+n

ξ+t

LevetidskostnaderFor å sammenligne ulike investeringsprosjekter er det ønskelig å betrakte alle kostnader knyttet til et produkt over livssyklusen. Denne kostnaden betegnes levetidskostnaden eller livssykluskostnaden, og forkortes LCC (Life Cycle Cost). For å beregne LCC må vi inkludere kostnader som kommer på ulike tidspunkter. Generelt betraktes fremtidige kostnader å telle mindre enn kostnader som påløper i dag. Det er da vanlig å neddiskontere fremtidige kostnader til en ekvivalent kostnad i dag. Et slikt neddiskontert beløp betegnes nåverdien av beløpet, og er gitt ved

NPV =X t (1+r )−t (51)hvor NPV (net present value) angir netto nåverdibidrag, Xt er nominell (krone-) verdi av beløpet t år frem i tid, og r er kalkylerenten. Nedenfor presenteres de mest brukte størrelser i en LCC analyse

t Hvilket år et beløp kommerXt Beløp i år tr KalkylerentenT Tidshorisont, dvs antall år som betraktes, T kan være uendeligv Prisstigning, brukes for å angi at pris på innsatsfaktorer øker med en faktor (1+v) per ård Degraderingsraten, brukes for å angi at kostnaden knyttet til degradering øker med en faktor (1+d) per

årk Periode for beløp som kommer periodisk, f eks k = 2 angir at bilen skal på EU kontroll hvert andre årl År for første periodiske beløp

Total nåverdibidragDet totale nåverdibidraget, eller summen av neddiskonterte beløp blir da

NPV =∑t=0

T

X t (1+r )−t (52)hvor X0 er et beløp som betales ved oppstart. Formlene her tar utgangspunkt i at vi starter 1. januar i år 1, og at alle utbetalinger skjer 31. desember for år t over en tidsperiode på T år. Formel (52) gjelder også om beløpene representerer samlet inntekt. Vi kan da i prinsippet bruke samme formelapparat for å gjennomføre en levetidsinntjeningsanalyse (LCP = Life Cycle Profit).

Et fast beløpNåverdien av et årlig beløp XA i T år fremover:

NPV =[ 1−(1+r )−T

r ] X A (53)26

Et økende beløpNåverdien av en kroneverdi som vokser v×100% hvert år i T år, XA,v = verdi på slutten av første år:

NPV =[ 1−( 1+v1+r )

T

r−v ] X A ,v(54)

Periodiske beløpVi betrakter nå en situasjon hvor et fast beløp XA betales periodisk, hvor perioden k er større enn ett år, f eks k = 2 svarer til at beløpet betales hvert andre år. Nåverdien over en uendelig tidshorisont blir da:

NPV =X A (1+r )−l

1−(1+r )−k (55)

27

hvor l er hvilket år beløpet betales første gang. l = 0 svarer til at første innbetaling er umiddelbart, l = 1 svarer til at innbetalingen skjer på slutten av det første året osv.

Dersom beløpet kun skal betales over en endelig tidshorisont kan vi bruke samme formel til å trekke fra de beløpene fram i tids som vi slipper å betale:

NPVPeriodic(XA, r, k, l ) - NPVPeriodic(XA, r, k, m )

hvor m er første år vi ikke skal betale det periodiske beløpet, og NPVPeriodic er en funksjon som implementerer ligning (55).

Noen VBA funksjonerI kurset har det blitt utdelt ulike regneark. Regnearket MaintOp.xlsm har følgende funksjoner innebygget:

Pålitelighetsformler:lambdaE(tau,MTTF,alpha) Effektiv feilrate i BRP, kan brukes for alle verdier av tau < MTTFPFD(tau,lambda,k,N,beta) PFD for k oo N systemer med fellesfeilandel Q0(tau,E_PF,SD_PF,q) Sannsynligheten for at inspeksjonsstrategien ikke vil fange en

potensiell feil før den går til sviktTauBRP(MTTF,alpha,Cp,Cu) Finner intervallet som minimerer kostnaden i standard BRP modellcvWebiull(alpha) Variasjonskoeffisient i WeibulmodellencvMSM(r,V) Variasjonskoeffisient i Markov tilstandsmodellLambdaEMSM(tau,MTTF,V,r,l,q) Effektiv feilrate i Markov tilstandsmodellrrMSM(tau,MTTF,V,r,l,q) Fornyelsesrate i Markov tilstandsmodellNåverdiformler:NPVFixed(X,r,T) Et fast beløp årlig beløp, X, over T år med diskonteringsrente rNPVInc(X,r,v,T) Et beløp som starter på X og øker med v*100% over T år med

diskonteringsrente rNPVPeriodic(X,r,k,l) Et periodisk beløp X, periode k og kommer første gang etter l år,

diskonteringsrente rNPVt(X,r,t) Et engangsbeløp X som kommer i år t, diskonteringsrente rlogLWeibull(alpha,lambda,F,C) Beregner log likelihood i Weibullfordelingen, hvor F er en liste av

svikttider, og C er en liste av høyresensurerte svikttiderlogLPowerLaw(alpha,beta,ti,a,b) Beregner log likelihood i power law modellen, hvor ti er en liste av

tidspunkter for svikt, a er startpunkt for observasjon, og b er sluttpunkt for observasjon.

For pålitelighetsformlene gjelder:

tau Vedlikeholdsintervall (utskifting, overhaling, funksjonstest eller inspeksjon)alpha Aldringsparameter i WeibullfordelingenMTTF Midlere tid til feil uten vedlikeholdlambda Konstant feilrate for enheter med skjult funksjonk, n Størrelser i en k-ut-av-n konfigurasjon, dvs k eller flere ut av n må fungere for å sikre

funksjonenbeta FellesfeilandelE_PF Forventet lengde av PF-intervalletSD_PF Standardavvik til PF-intervallet

28

q Sannsynlighet for at en enkeltinspeksjon gir feil konklusjon (ikke avdekker kritisk verdi)V Vekstfaktor i degraderingsrate (vekstrate like før svikt dividert på initiell vekstrate)r Antall tilstander + 1 i Markov tilstandsmodelll Vedlikeholdsgrense i Markov tilstandsmodell

For NPV gjelder:

t Hvilket år et beløp kommerX Beløp i år t, evt på slutten av første år, eller periodisk beløpr KalkylerentenT Tidshorisont, dvs antall år som betraktes, T kan være uendeligv Prisstigning, brukes for å angi at pris på innsatsfaktorer øker med en faktor (1+v) per ård Degraderingsraten, brukes for å angi at kostnaden knyttet til degradering øker med en faktor (1+d) per årk Periode for beløp som kommer periodiskl År for første periodiske beløp, l = 0 dersom beløpet kommer ved tidspunkt t = 0

Siste versjon av filen finnes på http://frigg.ivt.ntnu.no/ross/elearning/MaintOp/MaintOp.xlsm

Trondheim, 2013-11-16

Jørn Vatn, [email protected]

Stikkord-faktor, 13Bayesianske metoder, 25Birnbaums mål

blokkdiagram, 5feiltre, 11

dataanalyse, 22dynamisk gruppering, 21effektiv feilrate, 1, 15eksponensialfordeling, 3feiltreanalyse, 5fellesfeil, 11

feiltre, 11fordelingsfunksjon, 1gruppering, 20hendelsestreanalyse, 11intervalloptimalisering, 15

observerbar gradvis feilutvikling, 18PF-modellen, 19skjult funksjon, 17standard aldringsmodell, 17

k oo N, 2Kaplan Meier plott, 23LCC, 26levetidsfordelinger, 3

levetidskostnader, 26Markov modellering, 13minimal kuttmengde, 8MTTF, 1nåverdi, 26

fast beløp, 26økende beløp, 27periodiske beløp, 27

Nelson Aalen plott, 22NHPP

parameterestimering, 25ulike parametriske modeller, 25

NPV, 26overgangsrater, 14overlevelsessannsynlighet, 1parallellstruktur, 4PFD, 2

k oo N, 3Q0

feiltreanalyse, 9RCM, 14

beslutningslogikk, 15ROCOF, 25seriestruktur, 4

29

statisk direkte gruppering, 21statisk indirekte gruppering, 20strukturfunksjon, 4sviktintensitet, 1TTT plott

komplette data, 23sensurerte data, 24

TTT transformasjon, 24

utilgjengelighet, 2variasjonskoeffisient

Markov tilstandsmodell, 19Weibull, 4

VBA funksjoner, 27vedlikeholdsgrense, 18Weibulfordeling, 3

parameterestimering, 24

30