7 tip til forarbejdning af biosignaler: hvordan du forbedrer robustheden i din Deep Learning klassifikator

Hvorfor håndtere lyde og forvrængninger er så vigtigt

Enhver klassificeringsopgave (påvisning af abnormitet), der er relateret til biosignaler, såsom elektrokardiografi (EKG), elektroencefalografi (EEG), elektromyografi (EMG) osv., Kan typisk betragtes som tidsseriegenkendelsesproblem.

I henhold til Karush – Kuhn – Tucker-forholdene skal indgangssignaler passe til kriterier for stationaritet. Simpelthen skal mønstrene for indgangssignaler være ens eller lignende som i et træningssæt uden at ændre signalets fordeling over tid.

Normalt udsættes enhver optagelse af biosignaler med mange støj. Disse forvrængninger indsætter yderligere varians i modellen på grund af overtrædelse af kriterierne for stationaritet.

Disse støj kan have forskellige karakterer og mere specifikke oplysninger, du kan finde her og her. Disse artikler beskriver EKG-støj, men det kan også anvendes til alle biosignaler.

Det betyder, at din DL-klassificeres samlede ydeevne er defineret af effektiviteten af ​​forbehandlingsteknikker.

Lad os se på, hvordan det praktisk er muligt at forbedre robustheden i den dybe læringsmodel med forarbejdning.

1. 50% af den effektive digitale signalbehandling er den effektive analoge behandling

Enhver digital signalbehandling starter med effektiv analog signalkonditionering. Den mest almindelige fejl er relateret til aliasing-problem.

I følge Nyquist-sætningen bør ADC's samplingshastighed være 2 gange højere end indgangssignalets højeste frekvens. Ethvert signal passer ikke til disse kriterier aliaser i hovedfrekvensdomænet og masker, der er nyttige som ekstra lyde:

For at forhindre dette problem anvendes det analoge lavpasfilter før ADC. Meget ofte betragter hardwareingeniører simpelt RC-kredsløb som tilstrækkeligt til dette formål. Men der er en enorm forskel i frekvensrespons mellem det perfekte lavpasfilter og det virkelige:

Bestående af frekvenskarakteristikken for ideelle (venstre) og reelle (venstre) analoge filtre

Sørg for, at din Inti-Aliasing LPF opfylder kravene til undertrykkelse på Nyquist-frekvensen (for yderligere oplysninger, anbefaler jeg denne bog):

  • 50dB til 8-bit ADC
  • 62dB til 10-bit ADC
  • 74dB til 12-bit ADC
  • 98dB til 16-bit ADC

2. Brug den samme hardware til træning og forudsigelser

Forskellige enheder definerer forskellige signaloptagelsesforhold, såsom ikke-lineær forvrængning af elektronik, forskellige indkapslinger, forskellige sensorer, osv.

Da forskellige forhold definerer forskellige signaler, vil jeg anbefale at bruge den samme hardware til træningsmodel og foretage forudsigelser. Det kan være en årsag til den ekstra bias på træningssættet.

Hvis der ikke er nogen muligheder, er det muligt at prøve forforvrængning af træningssættet, men det kræver yderligere ekspertise inden for hardware og støjdomæner.

3. Nyquist-sætning for at fremskynde træningen

Som beskrevet ovenfor definerer Nyquist teorem en minimum samplingshastighed af ADC for at gemme 100% af informationen om det analoge signal efter konverteringen. Det betyder, at hvis den maksimale frekvens af signalet er lavere end Fs / 2, har det redundansen, som kan bruges til at fremskynde træningen af ​​Deep Network.

Lad os overveje et eksempel.

Der er EKG-signalet med samplingshastigheden 125 Hz leveret af Physionet-databasen (30 Hz-filter blev anvendt):

Tip til ECG-forarbejdning: EKG-signaler tildeler 0–100Hz, men 30Hz lavpasfilter kan muligvis anvendes. Det holder P- og T-bølger uberørt, men det reducerer amplituden af ​​R-toppen med 20-30%. Det er ikke kritisk for påvisning af abnormiteter og tælling af hjerterytme.

Signalets spektrumdensitet ser ud:

Som vist ovenfor er hoveddelen af ​​signalets energi koncentreret mellem 0–30Hz. Lad os desimere det til 80Hz og sammenligne det med det originale signal:

Demonstration af decimeringseffekt: signal med 80Hz (øvre) og 125Hz (nedre) samplingshastighed

Den oprindelige form bevares, men signalets samlede længde reduceres med 35% fra 92 til 59 prøver. Det er lig med 35% acceleration af træning uden tab i nøjagtighed.

Demonstration af effektiviteten af ​​denne tilgang vises i mit Github-projekt.

Vigtig note: Sørg for, at din decimering ikke mister yderligere oplysninger, der kan bruges til genkendelse. Eksperimentering er den eneste måde at bevise på. Men praktisk talt er træning af to stablede (CNN + LSTM) modeller på downsampled signaler normalt hurtigere end at træne en model med den originale samplinghastighed uden tab af ydeevnen.

4. Forstå kravene til systemet

Før jeg prøver mere komplekse filtreringsalgoritmer, som Wavelette eller adoptiv, vil jeg anbefale at forstå, hvilke funktioner der kræves til genkendelse.

Her er et eksempel.

Lad os overveje opgaven for Deep Learning-modellen er arytmidetektion, mens vi går. Typisk indeholder EKG-gangdata lavfrekvent støj:

I mellemtiden ser det klare EKG-signal således ud:

P- og T-bølger er maskerede, og det er en ganske ikke-triviel opgave at udtrække den. Før vi prøver at udvikle komplekse algoritmer, lad os se, hvad der faktisk er arytmi:

Til arytmidetektion er kun pulttælling nok til at opbygge den effektive detektor, men naturligvis indsætter lavfrekvente baseline vandrende en yderligere variation med krænkelse af stationariteten.

Forskellige dele af EKG kan tildele forskellige spektrumdomæner:

Et simpelt 5–15Hz Bandpass-filter løser spørgsmålet om R-toppe til ekstraktion. Ved anvendelse af dette filter undertrykkes P- og T-bølger (og abnormiteter relateret til det er ikke tilgængelige til genkendelse), men kravene til systemet er opfyldt.

Hovedreglen: da mere algoritme er kompleks, da mindre den er robust, og den kræver flere ressourcer til implementering (både tid og penge). Den enkleste digitale filtrering skal være den første, du skal prøve.

5. Brug MiniMax-princippet til udvikling af rørledninger

MiniMax-princippet er den store strategi fra spilteorien.

Det største problem med biosignaler er ændring af signalkvalitet over tid:

  • Sag 1. Høj kvalitet under lav aktivitet af emnet:
  • Sag 2. Dårlig kvalitet af dataene under intens bevægelse. P og T er maskerede, og der er ingen måde at udtrække det fra støj med et 1-kanals system:

I det første tilfælde kan P, QRS, T detekteres, det betyder, at de fleste af unormale EKG-mønstre (hjerteanfald, atrieflimmer osv.) Kunne genkendes.

For det andet kunne kun nogle unormale relaterede til QRS (arytmi osv.) Genkendes.

Som vist ovenfor er den bedste måde at udtrække QRS på at anvende 5–15Hz båndpasfilter, i mellemtiden undertrykkes P og T.

For tilfælde 2 vil det ikke være kritisk, da P og T er maskeret af støj, men det begrænser mængden af ​​mulige detekterede patologier, mens data i høj kvalitet ved input.

Den bedste måde at undgå dette problem er at anvende et adaptivt filter, der ændrer dets impulsrespons på det skiftende miljø:

Ideen er enkel:

  1. Lav detektor af datakvaliteten (lineære detektorer / CNN);
  2. Definer et sæt filtre;
  3. Lav en regel om at ændre impulsrespons afhængigt af indgangssignalkvaliteten.

6. Den smarte måde at bruge High-Pass-filtre på

Normalt kræves high-pass-filtrering for at håndtere baseline-vandring:

EEG med baseline støj

Den åbenlyse tilgang overvejer at anvende high-pass filter. Den største begrænsning for dette er en meget lav afskæringsfrekvens (0,05 Hz) og høj stopbåndsundertrykkelse (> 30dB). For at imødekomme kravene, skal filteret have høj orden, det betyder lang forsinkelse, hvilket muligvis ikke er egnet til realtidsanvendelser.

En alternativ måde:

  • At decimere indgangssignal;
  • Ekstraher baseline-støj ved anvendelse af et lavpasfilter med en 0,05 Hz afskæringsfrekvens;
  • Interpolér signalet;
  • Trækk baseline fra det originale signal

Kodeeksemplet (Matlab) er tilgængeligt i dette GitHub-arkiv.

7. Iterativ eksperimentering

Som ethvert Data Science-problem er klassificering af biosignaler en iterativ eksperimentel proces, fordi forskellige filtreringsmetoder kan være egnede til forskellige anvendelser.

Jeg har opsummeret en kort liste med filtreringsteknikker, fra den mest pålidelige til værste.

BEMÆRK: Det er kun min personlige mening, den kan ikke falde sammen med din.

  • Digital filtrering (FIR, IIR). FIR anbefales på grund af fraværet af gruppeforsinkelsesforvrængninger. Det har moderat ydelse, ideelt til ikke-specifikke forhold, meget enkel at implementere og 100% robust.
  • Wavelet-filtrering. Stærk ydeevne, men realisering kan være kompleks med hensyn til valg af parametre.
  • Adaptiv filtrering. Denne metode viser dårligere ydelse end Wavelet-filtrering, men den er meget enklere at implementere med god smidighed og ydeevne.
  • Independent Component Analysis (ICA) / Blind Source Separation (BSS). Implementering af Fast ICA-algoritmen i de mest populære programmeringssprog er tilgængelig her. Jeg vil anbefale det at prøve sidst, fordi:
  1. Det fungerer kun med multikanals konfigurationer;
  2. Jeg har fundet robustheden i denne tilgang meget dårlig, fordi konvergens ikke er garanteret;
  3. Det kræver relativt flere beregningsressourcer, muligvis ikke egnet til realtidsapplikationer.

___________________________________________________________________

Fandt papiret nyttigt? Vær venlig at give din feedback om artiklen ved dette link

___________________________________________________________________

Dmitrii Shubin, F & U-ingeniør, Medicinsk udstyr

Toronto, ON, Canada

Kontaktoplysninger:

E-mail: [email protected]

LinkedIn, GitHub