Eind goed, al goed

Nu alle data uitgewerkt is, is het tijd om naar de resultaten te kijken. Zeker weten leuker dan het saaie werk dat ik in januari heb gedaan. Maandag moest ik nog wel de data controleren. Zelfs als alle programma’s goed werken dan glippen er toch altijd wel wat gegevens door die niet kloppen. Het is een saai precisiewerkje, wat het heel gevoelig voor fouten maakt. Alle hersens op een rijtje dus! Gelukkig was het werkje in 1 dag klaar.

Gisteren kwam dan de grote dag: alle grafieken werden naast elkaar gelegd om ze te vergelijken. De afgelopen maanden ben ik met drie data-sets in de weer geweest. Allereerst mijn eigen aggregaten. Dat was een simpele klus: er was een bijzonder goede signal to noise ratio (dus weinig achtergrondruis) en de data was overduidelijk. Er is een temperatuursafhankelijkheid die je bij wijze van spreken vanaf de maan nog kan ontdekken.
De tweede en derde sets waren door Hongzhen gemeten en dat waren echte single molecules. Oftewel: een slechte signal-noise ratio. Het uitwerken kost een stuk meer moeite en de gegevens zijn een stuk minder mooi. Voor de ene set waren metingen gedaan bij 50 en 300 Kelvin, voor de andere set bij 7, 50, 100 en 200 Kelvin. Alle metingen werden zowel in tolueen als in chloroform gedaan (twee oplosmiddelen, waarbij tolueen een nog slechtere ratio heeft dan chloroform). Met beide datasets was er een probleem.
Om een beetje statistisch iets te kunnen zeggen over de data heb je toch minimaal 100 moleculen nodig. Die voorwaarde gaf meteen een probleem bij de tweede set, waarbij het aantal moleculen tussen de 50 en 100 lag. De eerste set was zo mogelijk nog vreemder. Voor chloroform hadden we 270 moleculen, ruim genoeg dus, maar voor tolueen maar 90.
We hebben anderhalf uur naar de data gekeken en eigenlijk bleek het onmogelijk om een trend te ontdekken. Bij de verschillende temperaturen zat je met het probleem dat je te weinig data hebt om een goede vergelijking te maken. Waar je zou kunnen zeggen dat er van 7 t/m 200 Kelvin een trend was, leek de 300 K data toch in een andere richting te wijzen. En dan geeft een plot met voldoende moleculen toch de doorslag
Als je een vergelijking wilde maken tussen de oplosmiddelen viel het op dat bij tolueen een hoop punten misten in een hoek van de plot. Is dat een trend? Of gezichtsbedrog door het verschillende aantal punten? Of heeft het een andere oorzaak?

Een beetje vervelend dat we het eigenlijk niet wisten gingen we weer terug naar onze werkplek. Daar sprak ik met Daniel over het verschillende aantal punten tussen de plots. Waarom had Hongzhen nou zo’n verschillend aantal punten gemeten? Toen bedacht ik me dat het aantal metingen gelijk was, maar dat het aantal moleculen per meting veel lager was. Zou hij een lagere concentratie hebben gebruikt waardoor je minder moleculen per oppervlakte hebt? Een beetje verschil kan wel, maar 3x?
Toen bedacht ik me het andere verschil: de signal-to-noise ratio. Wat als…  de software meer moeite heeft met de samples van tolueen? Omdat de moleculen verdwijnen in de achtergrond? Dat zou meteen kunnen verklaren waarom er zoveel moleculen in die hoek van die plot misten… Geen trend dus, maar gewoon een ordinaire meet (verwerk) fout!
Om 17 uur kwamen we weer bij elkaar. Ik legde mijn gedachtes over het verschil in punten uit. Oleg, die de programma’s geschreven heeft, had moeite de verklaring te accepteren. Zijn programma’s zouden dit probleem juist moeten omzeilen. We lijken er weer niet uit te komen…
Opeens zegt Hongzhen “misschien heb ik voor tolueen wel de 1.6x zoom gebruikt”. Deze zoom kan gebruikt worden bij samples met een slechte signal-to-noise-ratios. Het zou de perfecte verklaring zijn: 1.6x zoom levert een 2.6x kleiner beeld op, wat bijna de 3x verschil verklaard. De rest zou dan aan de concentratie kunnen liggen. Terwijl hij in zijn logboek kijkt zie ik een maand aan hard werken teniet gedaan worden…
Als Hongzhen terug komt zegt hij niet alleen dat hij inderdaad 1.6x zoom gebruikt heeft, maar ook dat de metingen niet gedaan zijn bij 50 en 300 Kelvin, maar bij 50 en 7 Kelvin!!!
Oleg flapte terecht uit dat als je het effect van 1 verandering wil meten, je niet twee dingen moet veranderen. We hebben het hier trouwens niet over een eerstejaars maar over een postdoc die deze basale fout maakt. Oelewapper!
Met in mijn achterhoofd dat ik me met het vermoorden van mensen niet populair zou maken loop ik terug naar mijn kantoortje. Ik leg de plots nog een keer op een rijtje. Opeens is er wel een trend. Alleen missen nu de metingen bij een hogere temperatuur. Uit een oude archiefdoos worden nog wat oude single molecule metingen met chloroform en tolueen bij kamertemperatuur gehaald. De trend lijkt er daadwerkelijk te zijn.
Eind goed, al goed.

Leave a Reply